APUNTES A PUNTES DE IDENTIFICA IDENTIFICACIÓN CIÓN DE SISTEMA SISTEMAS S
e(t)
H(z)
v(t) u(t) G(z)
+
y(t)
ÍNDICE
TEMA 1: MODELOS DE SISTEMAS CONTINUOS Y DISCRETOS
1.1 INTRODUCCIÓN ............................................................................................................ 1-1 1.2 MODELADO DE SISTEMAS CONTINUOS .................................................................... ................................................ .................... 1-3 1.2.1 Ecuaciones diferenciales ............................ ......................................................... ......................................................... ................................ .... 1-3 1.2.2 Modelo en el espacio de estados ......................... ...................................................... ................................................... ...................... 1-5 1.2.3 Función de transferencia .......................... ....................................................... ......................................................... ................................ .... 1-11 1.3 MODELADO DE SISTEMAS DISCRETOS ............................... ............................................................... .................................... .... 1-16 1.3.1 Secuencias ............................................................................. ................................................. ........................................................ ............................... ... 1-16 1.3.2 La transformada Z de una secuencia .................................................................... .................................................... ................ 1-18 1.3.3 Ecuaciones en diferencias.......................... ....................................................... ......................................................... ................................ 1-21 1.3.4 Modelo en el espacio de estados ......................... ...................................................... ................................................. .................... 1-24 1.3.5 Función de transferencia .......................... ....................................................... ......................................................... ................................ .... 1-24 1.4 CONSIDERACIONES BÁSICAS SOBRE LA RESPUESTA TEMPORAL Y FRECUENCIAL DE UN SISTEMA LINEAL ................................ ................................................................ ................................... ... 1-25 1.4.1 Sistemas de primer orden............................ ......................................................... .......................................................... ............................. 1-25 1.4.2 Integrador ...................................................................... ......................................... ........................................................... ........................................ .......... 1-30 1.4.3 Efecto de un cero en la respuesta temporal de un sistema de primer orden ........ 1-31 1.4.4 Respuesta temporal de un sistema de segundo orden ......................................... 1-33 1.4.5 Efecto de un cero en la respuesta temporal de un sistema de segundo orden.....1-37 1.4.6 Respuesta temporal de un sistema lineal con ganancia negativa......................... 1-40 1.4.7 Respuesta temporal de un sistema lineal con ceros en el semiplano derecho ..... 1-41 1.4.8 Respuesta temporal de un sistema lineal con retardo........................................ retardo........................................... ... 1-42 1.4.9 Especificaciones de la respuesta temporal de un sistema lineal .......................... ................... ....... 1-44 1.5 CONSIDERACIONES BÁSICAS SOBRE LA RESPUESTA FRECUENCIAL DE UN SISTEMA LINEAL .............................................................. ................................ ............................................................. ........................................... ............ 1-46 1.5.1 Definición de respuesta en frecuencia de un sistema lineal .......................... .................................. ........ 1-46 1.5.2 Representación gráfica de la respuesta en frecuencia de un sistema .................. 1-48 1.5.3 Respuesta frecuencial de un sistema lineal genérico continuo ........................... ............................... 1-51 1.5.4 Respuesta frecuencial de una constante ....................................................... ............................ .................................. ....... 1-52 1.5.5 Respuesta frecuencial de un integrador ........................ ................................................... ........................................ ............. 1-52
Indice
1.5.6 Respuesta frecuencial de un derivador ................................................................. ................................................. ................ 1-54 1.5.7 Respuesta frecuencial de un elemento de retardo ......................... ................................................ ....................... 1-55 1.5.8 Respuesta frecuencial de un polo real: sistema de primer orden.......................... orden...................... .... 1-56 1.5.9 Respuesta frecuencial de un cero real .................................................................. .................................................... .............. 1-57 1.5.10 Respuesta frecuencial de un par de polos complejos conjugados: conjugados: sistema de segundo orden ............................................................................. ................................................ .................................................... ....................... 1-58 1.5.11 Respuesta frecuencial de un par de ceros complejos conjugados conjugados ..................... ............ ......... 1-61 1.5.12 Efecto de un cero en la respuesta frecuencial de un sistema de primer orden ... 1-62 1.5.13 Efecto de un cero en la respuesta frecuencial de un sistema de segundo orden1-63 BIBLIOGRAFÍA ................................................................... .................................... .............................................................. ................................................ ................. 1-64 TEMA 2: MODELOS DE PERTURBACIONES
2.1 INTRODUCCIÓN ............................................................................................................ 2-1 2.2 CARÁCTER DE LAS PERTURBACIONES .............................. ........................................................... ....................................... .......... 2-3 2.3 REDUCCION DE LOS EFECTOS DE LAS PERTURBACIONES .................................. ............................... ... 2-4 2.3.1 Reducción en la fuente ............................ ......................................................... ......................................................... ................................... ....... 2-4 2.3.2 Reducción mediante realimentación local ............................................................... ............................................... ................ 2-4 2.3.3 Reducción mediante feedforward ............................. .......................................................... ............................................... .................. 2-5 2.3.4 Reducción mediante predicción .................................................. ...................... ........................................................ ............................ 2-6 2.4 MODELOS DETERMINISTAS DE LAS PERTURBACIONES ........................................ ........................... ............. 2-6 2.5 CONCEPTOS BÁSICOS DE LA TEORÍA DE PROCESOS ESTOCÁSTICOS............... 2-8 2.5.1 Variables aleatorias ............................ ........................................................ ......................................................... ......................................... ............ 2-8 2.5.2 Procesos estocásticos ........................... ........................................................ ......................................................... ................................... ....... 2-14 2.6 MODELOS DE PROCESOS ESTOCÁSTICOS .............................. ............................................................ .............................. 2-24 2.6.1 Ruido blanco............................. .......................................................... ........................................................... ................................................ .................. 2-24 2.6.2 Procesos AR ........................... ......................................................... ........................................................... ................................................. .................... 2-27 2.6.3 Procesos MA ................................................................. .................................... ........................................................... ........................................ .......... 2-32 2.6.4 Procesos ARMA ................................................................ ................................... ........................................................... .................................... ...... 2-34 2.6.5 Procesos ARIMA ............................................................... .................................. ........................................................... .................................... ...... 2-36 2.6.6 Identificación del del tipo de modelo estocástico a utilizar a partir de una serie temporal ......................... ....................................................... ........................................................... ........................................................ ........................... 2-39 2.7 FILTRADO DE PROCESOS ESTOCÁSTICOS ESTACIONARIOS .............................. 2-48 BIBLIOGRAFÍA ................................................................... .................................... .............................................................. ................................................ ................. 2-51
Indice
TEMA 3: CONSIDERACIONES GENERALES SOBRE LA IDENTIFICACIÓN DE SISTEMAS
3.1 INTRODUCCIÓN ............................................................................................................ 3-1 3.2 PROCEDIMIENTO GENERAL DE IDENTIFICACIÓN DE SISTEMAS ........................... 3-3 3.3 HERRAMIENTAS SOFTWARE PARA IDENTIFICACIÓN DE D E SISTEMAS ..................... 3-6 3.3.1 SITB, la toolbox para identificación de sistemas de MATLAB ........................... ................................. ...... 3-6 3.3.2 ITSIE, una herramienta interactiva para la enseñanza de la identificación de sistemas .................................................................................. ..................................................... ........................................................... .................................. 3-9 BIBLIOGRAFÍA ................................................................... .................................... .............................................................. ................................................ ................. 3-12
TEMA 4: DISEÑO DE EXPERIMENTOS Y TRATAMIENTO DE DATOS
4.1 INTRODUCCIÓN ............................................................................................................ 4-1 4.2 CONSIDERACIONES GENERALES SOBRE LA ELECCIÓN DE LA SEÑAL DE ENTRADA ...................................................................................... ........................................................ ............................................................. ....................................... ........ 4-2 4.2.1 Excitación persistente ......................... ..................................................... ......................................................... ......................................... ............ 4-2 4.2.2 Características deseables en teoría para la entrada .......................... ............................................... ..................... 4-2 4.2.3 Características deseables deseables en la práctica para la entrada: entrada: entradas “amigables” “amigables” con la planta. ............................ .......................................................... ........................................................... ........................................................ ........................... 4-4 4.2.4 Índices para establecer el grado de amigabilidad amigabilidad de una entrada. ......................... 4-5 4.3 TIPOS DE SEÑALES DE ENTRADA .............................. ............................................................. ................................................ ................. 4-7 4.3.1 Señal escalón .......................... ....................................................... ......................................................... ................................................... ....................... 4-7 4.3.2 Señal pulso simple ............................................... ................... ........................................................ ................................................... ....................... 4-8 4.3.3 Señal pulso doble .......................... ...................................................... ........................................................ ............................................ ................ 4-10 4.3.4 Ruido blanco............................. .......................................................... ........................................................... ................................................ .................. 4-11 4.3.5 Señal binaria aleatoria (RBS) ......................................................................... ........................................... ..................................... ....... 4-12 4.3.6 Señal binaria psedoaleatoria (PRBS) .................................................................... ..................................................... ............... 4-14 4.3.7 Señal multiseno ............................ .......................................................... ........................................................... ........................................... .............. 4-18 4.3.8 Conclusiones ............................................................................... ................................................... ...................................................... .......................... 4-24 4.4 ELECCIÓN DEL PERIODO DE MUESTREO ............................................................... ............................................................. .. 4-24 4.5 TRATAMIENTO DE LOS DATOS ............................................................................ ............................................. .................................... ..... 4-27 4.5.1 Filtrado de las señales.......................... ....................................................... ......................................................... .................................... ........ 4-28 4.5.2 Eliminación de valores medios ......................... ...................................................... ..................................................... ........................ 4-31 4.5.3 Detección de outliers ........................... ....................................................... ........................................................ ...................................... .......... 4-33 BIBLIOGRAFÍA ................................................................... .................................... .............................................................. ................................................ ................. 4-34
Indice
TEMA 5: IDENTIFICACIÓN DE MODELOS NO PARAMÉTRICOS
5.1 INTRODUCCIÓN ............................................................................................................ 5-1 5.2 ANÁLISIS DEL TRANSITORIO ................................ ................................................................ ....................................................... ....................... 5-4 5.3 ANÁLISIS DE CORRELACIÓN ....................................................................................... ......................................................... .............................. 5-6 5.4 ANALISIS DE FRECUENCIA ........................................................................................ ......................................................... ............................... 5-11 5.5 ANÁLISIS DE FOURIER .............................. ............................................................. .............................................................. .................................. ... 5-13 5.6 ANALISIS ESPECTRAL ............................ .......................................................... ............................................................. ...................................... ....... 5-16 5.6.1 Periodograma ......................................................................... ............................................ ........................................................... ................................ 5-16 5.6.2 Periodograma promedio: Método de Welch .......................................................... .................................................... ...... 5-19 5.6.3 Suavizado del periodograma: periodograma: El método de Blackman - Tukey ............................ 5-19 5.6.4 Estimación de la densidad espectral cruzada ....................................................... ......................................... .............. 5-23 5.6.5 Estima de la función de frecuencia usando análisis espectral .............................. 5-24 5.6.6 Resumen de las características básicas del análisis espectral ......................... ............................. .... 5-28 BIBLIOGRAFÍA ................................................................... .................................... .............................................................. ................................................ ................. 5-28
TEMA 6: IDENTIFICACIÓN DE MODELOS PARAMÉTRICOS DISCRETOS
6.1 INTRODUCCIÓN ............................................................................................................ 6-1 6.2 MODELOS PARAMÉTRICOS BASADOS EN EL ERROR DE PREDICCIÓN................ 6-2 6.2.1 Definición ............................ .......................................................... ........................................................... ....................................................... .......................... 6-2 6.2.2 Tipos de modelos PEM............................................................................................ PEM ............................................................................................ 6-4 6.3 ESTIMACIÓN DE LOS PARÁMETROS DE UN MODELO PEM .................................... 6-8 6.3.1 Planteamiento general del problema ............................. ........................................................... .......................................... ............ 6-8 6.3.2 Cálculo de la estima cuando el modelo PEM se puede expresar como una regresión lineal ............................. ........................................................... ........................................................... ........................................................... .............................. 6-10 6.3.3 Cálculo de la estima cuando el modelo PEM no se puede expresar como una regresión lineal ......................... ..................................................... ........................................................ ................................................. ..................... 6-14 6.4 PROPIEDADES DEL MODELO PEM ESTIMADO .......................................... ........ ............................................... ............. 6-16 6.4.1 Calidad del modelo ............................. .......................................................... ........................................................... ...................................... ........ 6-16 6.4.2 Errores existentes en un modelo ........................... ....................................................... ................................................ .................... 6-16 6.4.3 Error de sesgo .............................. ........................................................... ........................................................... ............................................ .............. 6-17 6.4.4 Error de varianza ............................. ........................................................... ........................................................... ........................................ ........... 6-22 6.4.5 Compromiso entre el error de sesgo y el error de varianza .................................. 6-25 6.5 CONSIDERACIONES SOBRE LA ELECCIÓN DEL TIPO Y LA ESTRUCTURA DEL MODELO PEM ..................................................................................... ...................................................... ....................................................... ........................ 6-27 6.5.1 Elección del tipo de modelo........................... ....................................................... ........................................................ ............................ 6-27
Indice
6.5.2 Elección de la estructura del modelo......................... ...................................................... ............................................ ............... 6-28 6.6 VALIDACIÓN DEL MODELO ESTIMADO ........................................................... ........................... ......................................... ......... 6-32 6.6.1 Verificación del comportamiento comportamiento de entrada-salida entrada-salida ......................... ............................................... ...................... 6-37 6.6.2 Análisis de los residuos .......................... ...................................................... ........................................................ ................................... ....... 6-34 6.7 REDUCCIÓN DEL MODELO ................................................................................ ................................................ ........................................ ........ 6-37 6.8 ALGUNAS DIRECTRICES PARA OBTENER EL MODELO PEM MAS APROPIADO .6-38 BIBLIOGRAFÍA ................................................................... .................................... .............................................................. ................................................ ................. 6-39
TEMA 7: IDENTIFICACIÓN DE MODELOS PARAMÉTRICOS CONTINUOS
7.1 INTRODUCCIÓN ............................................................................................................ 7-1 7.2 OBTENCIÓN A PARTIR DE LA TRANSFORMACIÓN DEL MODELO DISCRETO IDENTIFICADO ................................................................................. .................................................. ............................................................ ............................. 7-1 7.3 ESTIMACIÓN A PARTIR DE DATOS DE ENTRADA-SALIDA TEMPORALES.............. 7-7 7.4 ESTIMACIÓN A PARTIR DE DATOS EN EL DOMINIO DE LA FRECUENCIA ........... 7-11 7.4.1 Estimación a partir de las transformadas de Fourier de la entrada y de la salida. 7-11 7.4.2 Estimación a partir de datos obtenidos del análisis en frecuencia. ....................... 7-12 BIBLIOGRAFÍA ................................................................... .................................... .............................................................. ................................................ ................. 7-15
TEMA 8: IDENTIFICACIÓN IDENTIFICACIÓN EN LAZO CERRADO CERRADO
8.1 INTRODUCCIÓN ............................................................................................................ 8-1 8.2 PROBLEMAS QUE PRESENTA LA IDENTIFICACIÓN EN LAZO CERRADO .............. 8-2 8.3 IDENTIFICACIÓN EN LAZO CERRADO MEDIANTE APROXIMACIÓN DIRECTA .......8-7 8.3.1 Consideraciones generales ................................................................... ...................................... ............................................... .................. 8-7 8.3.2 Consideraciones sobre el error de sesgo ......................... ...................................................... ....................................... .......... 8-9 8.3.3 Selección del punto de aplicación de la señal de excitación .......................... ................................. ....... 8-10 8.3.4 Consideraciones sobre el error de varianza ......................... ..................................................... ................................. ..... 8-14 8.4 CONCLUSIONES ............................... .............................................................. .............................................................. ............................................ ............. 8-15 BIBLIOGRAFÍA ................................................................... .................................... .............................................................. ................................................ ................. 8-16 TEMA 9: IDENTIFICACIÓN IDENTIFICACIÓN RELEVANTE RELEVANTE PARA EL CONTROL
9.1 INTRODUCCIÓN ............................................................................................................ 9-1 9.2 RELACIÓN ENTRE EL MODELO IDENTIFICADO Y EL DISEÑO DEL CONTROLADOR
.......................................................... ............................ ........................................................... .......................................... ............. 9-2
9.3 IDENTIFICACIÓN DE MODELOS APROXIMADOS .............................. ....................................................... ......................... 9-5 9.3.1 Identificación basada en el error de predicción .......................... ..................................................... ............................... 9-5
Indice
9.3.2 Desajuste modelo - proceso en lazo cerrado .......................................................... 9-6 9.3.3 Criterio de identificación relevante para control ...................................................... 9-8 9.3.4 Identificación a partir de datos obtenidos en lazo cerrado ...................................... 9-9 9.4 IDENTIFICACIÓN Y CONTROL ITERATIVOS ............................................................. 9-12 9.5 PREFILTRADO RELEVANTE PARA CONTROL.......................................................... 9-16 9.5.1 Estimación de parámetros relevantes para control ............................................... 9-16 9.5.2 Efecto del prefiltrado en la estimación de parámetros........................................... 9-17 9.5.3 Obtención de un prefiltro relevante para control.................................................... 9-18 9.5.4 Algoritmo para la implementación de un prefiltro relevante para control............... 9-23 9.6 CONCLUSIONES.......................................................................................................... 9-25 BIBLIOGRAFÍA .................................................................................................................. 9-26 TEMA 10: IDENTIFICACIÓN DE SISTEMAS MULTIVARIABLES
10.1 INTRODUCCIÓN ........................................................................................................ 10-1 10.2 DESCRIPCIÓN DE UN SISTEMA MULTIVARIABLE ................................................. 10-2 10.3 DISEÑO DE ENTRADAS PARA SISTEMAS MULTIVARIABLES .............................. 10-4 10.3.1 Diseño de señales RBS multientrada .................................................................. 10-4 10.3.2 Diseño de señales PRBS multientrada................................................................ 10-4 10.3.3 Diseño de señales multiseno multientrada .......................................................... 10-6 10.4 ESTIMACIÓN DE MODELOS MULTIVARIABLES ..................................................... 10-8 BIBLIOGRAFÍA ................................................................................................................. 10-20 TEMA 11: IDENTIFICACIÓN DE SISTEMAS NO L INEALES
11.1 INTRODUCCIÓN ........................................................................................................ 11-1 11.2 ALGUNAS CONSIDERACIONES SOBRE LA NECESIDAD DE IDENTIFICAR MODELOS NO LINEALES ........................................................................................... 11-1 11.3 COMPROBACIÓN DE LA NO LINEALIDAD DE UN SISTEMA .................................. 11-2 11.3.1 Test en el dominio del tiempo basado en la respuesta a escalones. .................. 11-2 11.3.2 Test basado en las funciones de correlación de orden más alto. ....................... 11-3 11.4 DISEÑO DE LA SEÑAL DE ENTRADA ...................................................................... 11-4 11.5 MODELOS NO LINEALES MÁS USUALES ............................................................... 11-5 11.5.1 Modelo de Hammerstein- Weiner ........................................................................ 11-5 11.5.2 Modelo NARMAX................................................................................................. 11-8 11.5.3 Modelo NARX ...................................................................................................... 11-9 11.5.4 Modelo de Volterra ............................................................................................ 11-11
Indice
11.6 CONSIDERACIONES ADICIONALES SOBRE LA IDENTIFICACIÓN DE SISTEMAS NO LINEALES .............................................................................................................. 11-11 11.6.1 Prefiltrado .......................................................................................................... 11-11 11.6.2 Análisis de los residuos ..................................................................................... 11-12 BIBLIOGRAFÍA ................................................................................................................. 11-13
TEMA 1
MODELOS DE SISTEMAS CONTINUOS Y DISCRETOS
1.1 INTRODUCCIÓN Un sistema puede ser definido como un objeto o una colección de objetos cuyas propiedades queremos estudiar. Ejemplos de sistemas son por ejemplo, el sistema solar, una planta fabricadora de papel, un circuito RC (Resistencia-Condensador),..., etc. Unas veces la curiosidad y otras la necesidad nos hace buscar respuestas a muchas preguntas sobre las propiedades de los sistemas. Por ejemplo: ¿Cómo se podría ajustar la planta para obtener papel de mejor calidad?, ¿qué ocurre si disminuyo la capacidad del condensador?, ¿cuándo tendrá lugar el próximo eclipse total de sol?, etc. La respuesta a alguna de estas preguntas se puede encontrar mediante experimentación. Por ejemplo, se puede conectar el condensador a la resistencia y ver qué ocurre. Sin embargo, muchas veces no es posible experimentar directamente con el sistema ya que resulta demasiado caro, es demasiado peligroso o el sistema todavía no ha sido construido. En los casos anteriores resulta muy útil disponer de un modelo del sistema. Un modelo es una idealización del sistema físico, usado para reducir el esfuerzo de cálculo en el análisis y diseño del sistema. El modelo se desarrolla de forma que represente adecuadamente al sistema. Al desarrollar un modelo para un sistema físico, ciertos parámetros y variables del sistema o relaciones entre sus componentes se pueden despreciar. Sin embargo, se debe de tener cuidado de no despreciar parámetros o relaciones que son cruciales para la precisión del modelo. Esto implica que un sistema físico pueda tener modelos diferentes dependiendo de la aplicación del modelo. Por ejemplo, un transistor tiene diferentes
TEMA 1: Modelos de sistemas continuos y discretos
modelos dependiendo de la amplitud y frecuencia de la señal aplicada. Generalmente, se elige un modelo que resulte simple y que, al mismo tiempo, describa adecuadamente la conducta del sistema. Los modelos se pueden dar en varias formas y con diferentes grados de formalismo matemático dependiendo del grado de sofisticación necesario. Así, se pueden usar modelos mentales , como los usados en la vida diaria, sin ningún formalismo matemático. Por ejemplo
este es el caso del modelo usado cuando se conduce un automóvil (“al girar el volante el automóvil gira” o “al pisar el freno el automóvil reduce la velocidad”). Para ciertas aplicaciones, la descripción del sistema se puede hacer mediante modelos gráficos y tablas numéricas. Por ejemplo, un sistema lineal se puede describir mediante su
diagrama de Bode o las gráficas de respuesta a un impulso o a un escalón. Para aplicaciones más avanzadas se necesitan modelos que describan las relaciones entre sus variables y componentes en términos de expresiones matemáticas como ecuaciones diferenciales o en diferencias, es decir, usar
modelos
matemáticos.
Dependiendo del tipo de ecuaciones diferenciales o en diferencias usadas, estos modelos matemáticos serán continuos o discretos, lineales o no lineales, deterministas o estocásticos, etc. Un sistema (ver Figura 1.1) se puede representar como uno o varios bloques que reciben una o varias señales de entrada predeterminadas u(t) y genera una o varias señales de salida y(t). Además el sistema puede estar sometido a una o varias perturbaciones w(t), que generalmente son señales de tipo aleatorio.
w(t) u(t)
Sistema
y(t)
Figura 1.1. Entradas, salidas y perturbaciones de un sistema.
Si el sistema posee m entradas, r perturbaciones y p salidas u(t), w(t) e y(t) son vectores:
1-2
Identificación de sistemas
y1 (t ) u1 (t ) w1 (t ) y (t ) u (t ) w (t ) 2 2 w(t ) y(t ) 2 u(t ) : : : y (t ) u (t ) w (t ) m r p
(1.1)
Si la magnitud de las entradas, salidas y perturbaciones puede cambiar en cualquier instante de tiempo t [0,] el sistema es de tiempo continuo o simplemente continuo. Por otro lado si la magnitud de las entradas, salidas y perturbaciones sólo puede cambiar en instante discretos de tiempo t={t 1, t 2, ...., tN} el sistema es de tiempo discreto o simplemente discreto.
En este tema se describen los modelos matemáticos de sistemas continuos y de sistemas discretos. En ambas casos, por simplificar la exposición se considerará que no existen perturbaciones. Éstas son estudiadas en detalle en el Tema 2. También en este tema se incluyen las características básicas de la respuesta temporal y de la respuesta frecuencial de un sistema lineal.
1.2 MODELADO DE SISTEMAS CONTINUOS 1.2.1 Ecuaciones diferenciales De forma general un sistema dinámico continuo se puede modelar matemáticamente usando una ecuación diferencial de la forma g ( y
(n)
(t ), y ( n 1) (t ),...., y (t ), y (t ), u ( m ) (t ), u ( m1) (t ),..., u(t ), u(t )) 0
(1.2)
donde k
y
( k )
(t )
d
k
dt
k
y (t ); u
( k )
(t )
d
k
dt
u(t )
(1.3)
y g() es una función no lineal arbitraria y vector-valuada. Ejemplo 1.1: Considérese un tanque de agua con una sección de A(m 2) y un orificio de salida con un área de a(m2). La altura o nivel del líquido en el tanque es h(m), el caudal de entrada es u(m 3/s) y el caudal de salida es q(m3/s). Se desea construir un modelo matemático que refleje como el caudal de salida depende del caudal de entrada.
1-3
TEMA 1: Modelos de sistemas continuos y discretos
De acuerdo con la ley de Bernoulli la velocidad del caudal de salida en (m/s) es: v(t ) 2·g·h(t )
(1)
Donde g es la aceleración de la gravedad. La relación entre el caudal de salida y su velocidad es por definición: q(t ) a·v(t )
(2)
El volumen del líquido en el tanque en el instante t es obviamente A·h(t) (m 3), y cambia debido a la diferencia entre el caudal de entrada y el caudal de salida: d
A·h(t ) u(t ) q(t ) dt
(3)
A la ecuación anterior se le denomina como balance de masa, ya que la densidad es constante. Sustituyendo (1) y (2) en (3) se obtiene la siguiente ecuación diferencial no lineal: d dt
h(t )
a· 2·g A
h(t )
1 A
·u(t )
(4)
Conocidas a, A y u(t), mediante (4) se puede obtener la altura h(t). Conocida ésta el caudal de salida es: q(t ) a· 2·g
h(t )
(5)
Si se introducen n variables internas xi(t) con i=1,...,n la ecuación diferencial (1.2) se puede descomponer en un sistema de n ecuaciones diferenciales de primer orden x1 (t ) f 1 ( x1 (t ),..., x n (t ), u1 (t ),...., um (t )) x 2 (t ) f 2 ( x1 (t ),..., x n (t ), u1 (t ),...., u m (t ))
: x n (t ) f n ( x1 (t ),..., xn (t ), u1 (t ),...., u m (t ))
(1.4)
Equivalentemente las ecuaciones anteriores se pueden escribir de forma más compacta usando la siguiente notación:
1-4
Identificación de sistemas
x (t ) f ( x(t ), u(t ))
(1.5)
x1 (t ) f 1 ( x, u) x (t ) f ( x, u ) 2 , f ( x, u ) 2 x(t ) : : x (t ) f ( x, u ) n n
(1.6)
donde
Las salidas del modelo se pueden calcular a partir de las variables internas x i(t) y de las entradas ui(t) usando las siguientes ecuaciones: y1 (t ) h1 ( x1 (t ),..., xn (t ), u1 (t ),...., um (t )) y 2 (t ) h2 ( x1 (t ),..., x n (t ), u1 (t ),...., u m (t ))
:
(1.7)
y p (t ) hn ( x1 (t ),..., x n (t ), u1 (t ),...., um (t ))
Equivalentemente las ecuaciones anteriores se pueden escribir de forma más compacta usando la siguiente notación: y(t ) h ( x(t ), u(t ))
(1.8)
1.2.2 Modelo en el espacio de estados La salida de un sistema dinámico depende no sólo del valor actual de la entrada sino de todos sus valores anteriores. En consecuencia no es suficiente con conocer u(t) para t t0 para poder calcular y(t) para t t0 también es necesario tener información del sistema. Dicha información es el estado del sistema dinámico que es un conjunto de cantidades físicas, cuyas especificaciones (en ausencia de excitación externa) determina completamente la evolución del sistema. La noción de estado de un sistema dinámico es una noción fundamental en Física. La premisa básica de la dinámica newtoniana es que la evolución futura de un proceso dinámico está completamente determinada por su estado actual. Considérese un sistema general de ecuaciones diferenciales de primer orden de la forma (1.5) con la salida dada en la forma (1.8)
1-5
TEMA 1: Modelos de sistemas continuos y discretos
x (t ) f ( x(t ), u(t )) y (t ) h ( x(t ), u(t ))
(1.9)
Para este sistema el vector x(t 0) define el estado del sistema en el instante t 0. Si f(x,u) es continuamente diferenciable y u es continua a trozos la ecuación diferencial (1.9) con x(t0)=x0 tiene una solución única para t t0. En consecuencia se ha establecido que las variables internas x i(t) i=1,..,n determinan el estado del sistema en el instante t. Las ecuaciones (1.9) definen el modelo en el espacio de estados, el vector x(t) es el vector de estado y sus componentes x i(t) son las variables de estado. El orden del modelo queda definida por la dimensión del vector x(t), que recordemos es n. El modelo en el espacio de estados (1.9) se dice que es lineal si f(x,u) y h(x,u) son funciones lineales de x y u: x (t ) A· x B·u y(t ) C · x D·u
(1.10)
En la expresión anterior A, B, C y D son matrices de dimensiones n x n, n x m, p x n y p x m, respectivamente. Usualmente D=0. Si u e y son escalares (m=p=1), B es entonces un vector columna y C es un vector fila. Si las matrices A, B, C y D son independientes del tiempo el modelo se dice que es lineal e invariante en el tiempo o LTI (Linear Time Invariant). Ejemplo 1.2: Sobre un móvil (ver Figura 1.2) que se mueve con una aceleración u(t) se sitúa una masa m sujeta a la pared del móvil por un muelle de constante de elasticidad k y un amortiguador de coeficiente de amortiguación b. u (t ) k
m
y (t )
b
Figura 1.2: Masa con resorte y amortiguamiento sobre móvil
1-6
Identificación de sistemas
Para este sistema la variable de entrada es la aceleración u(t) y la variable de salida es el desplazamiento y(t). La ecuación del movimiento de este sistema se obtiene aplicando la segunda ley de Newton: F m·a
Donde F es la suma de todas las fuerzas aplicadas sobre la masa m y a es el vector aceleración del cuerpo. En este sistema las fuerzas que están actuando son las correspondientes al muelle y al amortiguador, que actúan en la dirección horizontal: F k · y b·
dy dt
La aceleración total es:
a
d 2 y (t ) dt 2
u (t )
Con lo que la ecuación del movimiento es:
m·
d 2 y(t ) dt 2
b·
dy(t ) dt
k · y(t ) mu(t )
Si se definen las siguientes variables de estado:
x1
y
x 2
dy dt
Entonces la ecuación de estado que describe las dinámicas del sistema es:
0 1 x (t ) 0 x1 (t ) k b · 1 ·u (t ) x 2 (t ) m m x2 (t ) 1 Y la ecuación de salida es:
x1 (t ) y (t ) 1 0· ( ) x t 2
1-7
TEMA 1: Modelos de sistemas continuos y discretos
Ejemplo 1.3: Se considera la red eléctrica RLC de la Figura 1.3. La variable de entrada es la tensión aplicada u=vs y la de salida es la intensidad de corriente por la resistencia R, es decir, y=i1. Como variables de estado se pueden elegir la caída de tensión x1 =vc en el condensador C y la corriente x2=i2 a través de la inductancia L. R
i2 (t )
i1 (t ) vs (t )
+
-
C
vc (t )
L
Figura 1.3: Red eléctrica RLC
Aplicando las leyes de Kirchoff a este circuito se obtienen las siguientes expresiones: vs C · vc
R·i1 vc dvc dt
i1 i2
L·
di2 dt
Operando sobre estas expresiones se obtienen las ecuaciones de estado: dvc dt di 2 dt
1 1 1 vc i2 vs R·C C R·C
1
·vc L
En forma matricial:
1 1 1 x1 R·C C x1 · RC ·u x 2 1 0 x2 0
La ecuación de salida es:
1-8
L
Identificación de sistemas
y
1 R
u
1 R
x1
Ejemplo 1.4: Ra
ea (t )
R f
La
i f (t )
ia (t )
L f
eb (t )
T r (t ) (t )
J , c
Figura 1.4: Diagrama esquemático del motor de corriente continua excitado por separado
En la Figura 1.4 se representa un diagrama esquemático de un motor de corriente continua. En dicha figura Ra y La representan la resistencia y la inductancia de la armadura. eb(t) representa la fuerza contra-electromotriz debida a la rotación de los conductores de la armadura en el campo magnético. Análogamente, Rf y Lf indican la resistencia y la inductancia de la bobina del campo. Las no-linealidades y la dependencia de los parámetros con el tiempo de estas bobinas se han despreciado. Se supone que la bobina del campo (el estator) está conectada a una fuente de voltaje constante y la bobina de la armadura (el rotor) está conectada a una fuente de voltaje variable v(t). De esta forma, la intensidad de campo ef se puede considerar constante. El voltaje ea(t) puede variar para cambiar la velocidad angular (t) del rotor. El flujo magnético de la bobina del campo es una constante cuando if se supone constante. El torque Tr con el eje del motor es proporcional a ia por una constante Km del motor.
T r
K m ·ia
1-9
TEMA 1: Modelos de sistemas continuos y discretos
El voltaje eb(t) generado como resultado de la rotación, es proporcional a la velocidad de rotación del eje , por una constante Kg1 del generador: eb (t ) K g · (t )
Aplicando las leyes de Kirchoff al circuito de la armadura se obtiene: e a (t ) La ·
dia (t ) dt
Ra ·ia (t ) eb (t )
El torque del rotor Tr (t) y la velocidad angular están relacionados mediante la segunda ley de Newton de la dinámica: T r (t ) T d (t ) J ·
d (t ) dt
c· (t )
Donde Td(t) es el torque de la carga en el eje del rotor, c es la constante de rozamiento viscoso y J es el momento de inercia de la carga. Combinando estas ecuaciones se obtiene el siguiente sistema de ecuaciones diferenciales con coeficientes constantes: dia (t ) dt d (t ) dt
Ra La
K m
ia (t )
ia (t )
J
K g La
c J
(t )
(t )
1 J
1 La
ea (t )
T d (t )
Estas ecuaciones se pueden escribir en la forma matricial de ecuaciones de estado: R dia (t ) a dt La d (t ) K m dt J
K g
1 i (t ) La · a La c (t ) 0 J
0 e (t ) · a 1 T d (t )
J
Si se considera como salida del sistema la velocidad de rotación del motor, entonces la ecuación de salida es:
y
1
i (t ) 0 1· a (t )
En unidades consistentes, K m es igual a K g, pero en algunos casos la constante motor-torsión viene dada en otras unidades, como onzas-pulgadas por amperes, y la constante del generador debe de expresarse en unidades de voltios por 1000 rpm.
1-10
Identificación de sistemas
Si las variables de salida son el torque desarrollado por el eje del rotor y la velocidad de rotación, entonces se tiene como ecuación de salida:
y
K 0 i (t ) m · a 0 1 (t )
1.2.3 Función de transferencia La transformada de Laplace es un método operativo que se usa para resolver ecuaciones diferenciales lineales. Mediante su uso es posible convertir muchas funciones comunes, tales como funciones sinusoidales, sinusoidales amortiguadas y exponenciales, en funciones algebraicas de una variable compleja s=+j· . Considérese una función del tiempo f (t), la transformada de Laplace de f (t) se define como:
st L[ f (t )] F ( s ) f (t )·e ·dt
(1.11)
0
El proceso inverso de encontrar la función del tiempo f (t) a partir de la transformada de Laplace F(s) se realiza tomando la transformada inversa de Laplace . 1
f ( t ) L [ F ( s )]
1
j
2 j j
st
F ( s )e ds
(1.12)
Puesto que F(s) es una función racional, si descompone en fracciones simples es posible usando una tabla de transformadas de Laplace obtener la expresión de f(t). En la Tabla 1.1 se recogen las transformadas de Laplace de algunas de las funciones más habituales. Una de las propiedades más interesantes de la transformada de Laplace es la posibilidad de aplicarla sobre la derivada de orden k de la función f (t) k
L[
d
k
dt
k k 1 k 2 ( k 1) (0 ) f (t )] s ·F ( s ) s f (0 ) s f ( 0 ) ... f
(1.13)
Así en el caso de la primera ( k=1) y segunda ( k=2) derivada se obtienen, respectivamente, las siguientes expresiones: 1-11
TEMA 1: Modelos de sistemas continuos y discretos
L[
2
L[
d
d dt
f ( t )] s·F ( s ) f (0 )
f (t )] s ·F ( s ) sf (0 ) f (0 ) 2
2
dt
(1.14)
(1.15)
Otras propiedades bastante útiles de la transformada de Laplace son las siguientes:
Teorema del valor final .
lim sF ( s) lim f (t )
(1.16)
lim sF ( s) lim f (t )
(1.17)
s 0
t
Teorema del valor inicial .
s
t 0
Teorema de traslación en el tiempo
L[ f ( t a )u1 ( t a)] e F ( s) as
(1.18)
Donde a es número real positivo y u1 (t ) es la función escalón unidad. Supóngase el modelo de estados (1.10) de un sistema LTI con condiciones iniciales nulas. Sean U(s) e Y(s) las transformadas de Laplace del vector de entradas u(t) y del vector de salidas y(t) del sistema, respectivamente. Ambas se relacionan mediante la siguiente expresión: Y ( s ) G ( s )·U ( s )
(1.19)
donde G es una matriz de dimensión p x m que de denomina función de transferencia. Se puede demostrar que la función de transferencia se relaciona con las matrices A, B, C y D del modelo de estados a través de la siguiente relación: 1
G ( s ) C ·s· I A B D
(1.20)
Si u e y son escalares ( p=m=1), entonces G(s) es una función racional:
b1s m1 ... bn1 s bn n n U ( s ) s a1 s 1 ... a n1 s a n Y ( s )
1-12
b0 s
m
(1.21)
Identificación de sistemas
f(t)
0 A f ( t ) 0 At f (t ) 0 (t )
At
n
F(s) si t 0
1
si t 0 si t 0
A
si t 0
s
si t 0
A
si t 0
s
(t 0)
A·n ! s
e
a· t
2
(t 0)
n 1
1
cos( ·t ) (t 0)
sa s
sen ( · t ) ( t 0)
s 2 2 s
t·e
a· t
(t 0)
2
2 1
( s a)2 sa
· e ·cos ( ·t ) (t 0) a t
( s a ) 2 2 · e · sen ( ·t ) ( t 0) a t
( s a ) 2 2 Tabla 1.1. Transformadas de Laplace de algunas funciones
El grado n del denominador debe ser mayor o igual que el grado m del numerador para garantizar la causalidad del sistema y que el modelo tenga sentido físico, en caso contrario la salida del modelo en el instante actual dependería del futuro. Al denominador de la función de transferencia se le denomina polinomio característico y sus raíces son los polos de sistema. Normalmente los polos son idénticos a los autovalores de la matriz A de la ecuación (1.10). Algunos autovalores puede, sin embargo, corresponder a dinámicas que no pueden ser excitadas u observadas a partir del comportamiento entradasalida. Estos autovalores no se incluyen entre los polos. Por su parte las raíces del numerador constituyen los ceros del sistema. Los polos y los ceros de una función de transferencia se representan en un plano complejo denominado plano s que en el eje de abcisas contiene la parte real de los polos o ceros ( ). y en el eje de
ordenadas la parte imaginaria (j· ).
1-13
TEMA 1: Modelos de sistemas continuos y discretos
Si un sistema posee algún polo o par de polos complejos conjugados con su parte real positiva, entonces el sistema es inestable, en el caso contrario se dice que el sistema es estable. Por otra parte, si un sistema posee algún cero o par de ceros complejos conjugados
con su parte real positiva, se dice que el sistema es de fase no mínima (n.m.p) 2. En caso contrario, se dice que el sistema es de fase mínima (m.p) 3. Ejemplo 1.5: Para el sistema de masa con resorte y amortiguamiento sobre móvil del Ejemplo 1.2 la ecuación del movimiento era 2
m·
d y(t ) 2
dt
b·
dy(t ) dt
k · y(t ) mu(t )
Tomando la transformada de Laplace con condiciones iniciales nulas sobre la ecuación anterior m·s Y ( s) b·sY ( s ) k ·Y ( s) mU ( s) 2
y reordenando términos se obtiene que la función de transferencia del sistema es: G(s)
Y ( s ) U ( s )
m m·s
2
b·s k
1
s2
b
k
m
m
·s
Si se aplica la ecuación (1.26) se obtiene el mismo resultado.
Ejemplo 1.6: Para la red eléctrica RLC del Ejemplo 1.3 aplicando la ecuación (1.26) se obtiene la siguiente función de transferencia 1
1 2 1 s 1 1 s 1 1 0 · RC C · 1 R R·C · L G( s) RC 1 1 R 1 s 0 R s 2 s L R·C CL 2
n.m.p es el acrónimo derivado del término inglés non-minimum phase. m.p es el acrónimo derivado del término inglés minimum phase.
3
1-14
Identificación de sistemas
Ejemplo 1.7: Para el motor de corriente continua del Ejemplo 1.4 aplicando la ecuación (1.26)
K m 0
G ( s)
Ra 0 s L a 1 K m J
La c s J K g
1
1 La 0
0 · 1
J
se obtiene que la función de transferencia es: K m ·K g K m c · s La J J · La 1 · G ( s) K m 1 Ra Ra c K m ·K g · s s s J La La J J · La J · La
A la transformada inversa de Laplace de la función de transferencia G(s) 1
g (t ) L [G( s)]
1
j
2 j j
st
G( s) e ds
(1.22)
se le denomina función de respuesta a un impulso del sistema . Se puede demostrar que la salida del sistema en un instante de tiempo t se puede expresar en términos de la función de respuesta a un impulso y de la señal de entrada u(t) del sistema de la siguiente forma: t
y (t ) g ( v )u( t v ) dv
(1.23)
0
A esta expresión se le denomina integral de convolución . La convolución es una operación compleja sobre funciones definida por la integral de las dos funciones multiplicadas entre sí y desplazadas en el tiempo. Nótese que si la entrada fuese un impulso u(t)= (t) entonces t
y (t ) g ( v ) ( t v ) dv g ( t )
(1.24)
0
con lo que se demuestra así que g(t) es la respuesta a un impulso del sistema.
1-15
TEMA 1: Modelos de sistemas continuos y discretos
Se observa que la salida puede ser obtenida como una suma ponderada de valores pasados de la entrada, es decir, la salida es una convolución de la entrada en instantes anteriores con la función peso g(v). La función peso g(v) caracteriza completamente el comportamiento del sistema, de la misma forma que lo hace su ecuación diferencial.
1.3 MODELADO DE SISTEMAS DISCRETOS 1.3.1 Secuencias Las señales discretas se pueden modelar como secuencias, que son conjuntos ordenados de valores. El orden se indica mediante un subíndice k que es número entero y se representan por: { y0, y1, y2,.., }, o de forma abreviada por { yk}. Una forma alternativa de definir una señal discreta es mediante la posible función que define el término genérico de la secuencia. Por ejemplo: yk=1+0.5k-0.32k define la secuencia {1,1.41,1.242,...} cuando k=0, 1, 2, ... Las operaciones básicas que se pueden realizar con una secuencia son:
Suma o resta: { x k } { y k } {u k } { y 0 u 0 , y1 u1 , y 2 u 2 ,...}
Multiplicación por un escalar: { x k } ·{ y k } { · y 0 , · y1 , · y 2 ,...}
Retraso de una secuencia: { x k } { y k d } {0 0 ,0 1 ,...,0 d , y 0 , y1 , y 2 ,...}
Estas secuencias se pueden obtener como valores que a lo largo del tiempo y normalmente en instantes de tiempo igualmente espaciados por un periodo de muestreo T va tomando una variable determinada. Para estos tipos de secuencias obtenidas a partir del muestreo con periodo T de una señal continua es corriente usar la siguiente notación: y ( k ·T ) y (0), y (T ), y ( 2·T ),... k 0,1, 2,...
Si el periodo es T=1 s, entonces: 1-16
Identificación de sistemas
y ( k ) y (0), y (1), y ( 2),... k 0,1, 2,...
que es equivalente a la notación: y (k ) y k y 0 , y1 , y 2 ,... k 0,1, 2,...
Ejemplo 1.8: Considérese la planta P( s)
1 s 1
En la Figura 1.5 se muestra en línea continua la respuesta y(t) de la planta al ser excitada por una entrada escalón. Además se representa con círculos la respuesta muestreada con un periodo T=0.25 s. Los puntos muestreados forman la secuencia:
y ( k ·0.25) y (0), y (0.25), y (0.50),... 0, 0.2212, 0.3934, .... k 0,1, 2,...
1 0.9 0.8 0.7 0.6 ) t (
0.5
y
0.4 0.3 0.2 0.1 0 0
1
2 3 Tiempo (s)
4
5
Figura 1.5: Respuesta y(t) (línea continua) a un escalón de la planta P(s) y puntos muestreados (círculos) con T=0.25 s.
1-17
TEMA 1: Modelos de sistemas continuos y discretos
1.3.2 La transformada Z de una secuencia Trabajar con secuencias no parece lo más apropiado para obtener las características dinámicas y estáticas de los sistemas discretos. Por este motivo, se introduce la transformada Z que facilita el análisis matemático de las secuencias. La transformada Z en sistemas de control en tiempo discreto juega el mismo papel que la transformada de Laplace en los sistemas de control en tiempo continuo. Dada una secuencia { yk} su transformada Z se define mediante la siguiente ecuación: Y ( z ) Z [{y k } ]
y · z
i
i
y 0 y1 · z 1 y 2 · z 2 ...
(1.25)
i 0
La transformada Z de una función del tiempo y(t) que ha sido muestreada con un periodo T obteniéndose la secuencia de valores y(k· T) con k=0,1,2,... se define mediante la siguiente ecuación: Y ( z ) Z [ y(t ) ] Z [ y(k ·T ) ]
y(k ·T )· z
k
y (0) y(T )· z 1 y(2·T )·z 2 ...
(1.26)
k 0
Algunas de sus propiedades más importantes son:
Multiplicación por una constante. Z [ a·{y k } ] a· Z [{y k } ] a·Y ( z )
Carácter lineal de la transformación. Z [ a·{y k } b{u k } ] a· Z [{y k } ] b· Z [{u k } ] a·Y ( z ) b·U ( z )
Desplazamiento temporal: Z { y k d } z d d Z { y k d } z ·Y ( z ) z · y 0
d
·Y ( z )
z d 1 · y1 ... z· y d 1
(1.27) (1.28)
Teorema del valor final. Permite el cálculo del valor límite de la secuencia, si éste existe (todos los polos de X(z) se encuentran dentro del círculo unitario con la posible excepción de un solo polo en z=1), a partir del conocimiento de la función transformada, según la expresión:
1-18
Identificación de sistemas
lim{ y k } lim (1 z 1 )·Y ( z ) k
(1.29)
z 1
Ejemplo 1.9: Sea la función escalón unitario:
1 t 0 0 t 0
y (t )
Se trata de una función continua en el tiempo. Si dicha señal se muestrea con un periodo T se obtendría la siguiente secuencia:
y k 1,1,1,...,
k 0,1, 2,...
La transformada Z se calcula aplicando la ecuación (1.31): Y ( z ) Z [{y k } ]
y · z i
i
1 z 1 z 2 z 3 ...
i 0
1 1 z
1
z z 1
Ejemplo 1.10: Sea la función rampa unitaria:
t t 0 0 t 0
y (t )
Se trata de una función continua en el tiempo. Si dicha señal se muestrea con un periodo T se obtendría la siguiente secuencia:
y k 0, T , 2·T , ,...,
k 0,1, 2,...
La transformada Z se calcula aplicando la ecuación (1.31): Y ( z ) Z [{y k } ]
y · z
i
i
0 T · z 1 2·T · z 2 3·T · z 3 ... T · z 1 2· z 2 3· z 3
i 0
T ·
z
1
1 z
1 2
T · z
z 12
1-19
TEMA 1: Modelos de sistemas continuos y discretos
Tabla 1.2. Transformada z de algunas funciones elementales
La transformación en Z es biunívoca, pudiendo pasar a su secuencia asociada de forma inmediata. Así dada la transformada Z de una secuencia es posible obtener la secuencia original aplicando la transformada Z inversa, que se denota mediante Z-1. Es decir, Z 1 [Y ( z )] y (k ) y k
(1.30)
Si Y(z) viene expresada de forma racional existen diferentes métodos para obtener la transformada Z inversa, por ejemplo:
1-20
Identificación de sistemas
1) Método de expansión en fracciones simples . Se descompone en fracciones simples a Y(z) y se utiliza una tabla de transformadas elementales (Ver Tabla 1.2) para obtener
la transformada Z inversa de cada uno de las fracciones. 2) Método de la división directa . Se divide el numerador de Y(z) entre el denominador de Y(z), el cociente que se va obteniendo es la expansión de Y(z) en una serie infinita de potencias de z-1. Los coeficientes de cada una de las potencias z-1 son de acuerdo con (1.1) los elementos de la secuencia { y0, y1, y2,...}. Con este método rara vez es posible obtener la expresión para el término general { yk}.
1.3.3 Ecuaciones en diferencias Una ecuación en diferencias da el valor de la salida actual yk en función de los valores de las salidas anteriores y k-1,yk-2,... y de las entradas actual uk y anteriores u k-1,uk-2.... y k
f (u k , u k 1 ,..., u k m , y k 1 , y k 2 ,..., y k n )
La ecuación en diferencias permite representar el modelo con un número finito de términos. Si el sistema es LTI la ecuación en diferencias toma la siguiente forma: m
y k
n
bi ·u k i ai · y k i i 0
(1.31)
i 1
O de forma equivalente: y (k ) a1 · y (k 1) ... a n · y (k n) b0 ·u (k ) b1 ·u (k 1) ... bm ·u (k m) (1.32)
Si se define el operador retardo q-1 como 1 q · y (k ) y (k 1)
q· y (k ) y (k 1)
entonces la ecuación (1.37) se puede expresar como: 1 1 A(q ) y (k ) B(q ) u (k )
donde A(q ) 1 a1 ·q
... a n ·q n B (q 1 ) 1 b1 ·q 1 ... bm ·q m 1
1
1-21
TEMA 1: Modelos de sistemas continuos y discretos
Ejemplo 1.11: Se desea resolver la siguiente ecuación en diferencias:
2· y (k ) 2· y (k 1) y (k 2) u (k ) donde y(k)=0 para k<0 y
1 0
u (k )
k 0,1, 2 k 0
Los valores de la secuencia y(k) se obtienen a partir de la ecuación en diferencias: y (k )
2· y (k 1) y (k 2) u ( k ) 2
Los primeros valores de la secuencia son: y (0)
y (1)
y (2)
2· y (1) y (2) u (0) 0.5 2
2· y (0) y (1) u(1) 2·0.5 0 1 1 2 2 2· y (1) y (0) u (2) 2·1 0.5 1 1.25 2 2
Se va a resolver la ecuación en diferencias tomando la transformada Z:
2·Y ( z ) 2· z 1Y ( z ) z 2Y ( z )
1 1 z 1
Despejando Y(z): Y ( z )
1
1
z
3
· (1 z 1 ) (2 2· z 1 z 2 ) ( z 1)(2 z 2 2· z 1)
Expandiendo Y(z) en fracciones simples:
1 z 2 z 1 z 1 Y ( z ) z 1 2 z 2 2· z 1 1 z 1 2 2· z 1 z 2 z
1-22
Identificación de sistemas
Nótese que los polos involucrados en el último término cuadrático de Y(z) son complejos conjugados. Por lo tanto Y(z) se puede reescribir de la siguiente forma: Y ( z )
1 1 z 1
1 1 0.5· z 1 1 0.5· z 1 · · 2 1 z 1 0.5· z 2 2 1 z 1 0.5· z 2
Si se acude a una tabla de transformadas z, se encuentra que:
· z 1 ·sen( ·T ) X ( z ) x(k ) e a·k ·T ·sen( ·k ·T ) a ·T 1 2· a ·T 2 1 2·e ·cos( ·T )· z e · z e
a ·T
y que
1 e a·T · z 1 ·cos( ·T ) X ( z ) x(k ) e a·k ·T ·cos( ·k ·T ) a ·T 1 2·a ·T 2 1 2·e ·cos( ·T )· z e · z Para Y(z) se identifica que e
2·a ·T
0.5 1
cos( ·T )
2
Luego, se obtiene que ·T
4
sen( ·T )
1 2
Entonces la transformada Z inversa de Y(z) se puede escribir como:
1 2
1 2
a k T a k T y (k ) 1 ·e · · ·cos( ·k ·T ) ·e · · ·sen( ·k ·T )
Y sustituyendo valores: k
k
k · 1 1 1 1 k · y (k ) 1 · ·cos · ·sen 2 2 4 2 2 4
k 0,1, 2 ...
Conviene comprobar que el término general obtenido es el correcto, para ello se van calcular los primeros valores de la secuencia:
1-23
TEMA 1: Modelos de sistemas continuos y discretos
0
0
1 1 1 1 y (0) 1 · ·cos0 · ·sen0 0.5 2 2 2 2 1 1 1 1 ·cos · ·sen 1 2 2 4 2 2 4
y (1) 1 ·
2
2
1 1 1 1 y ( 2) 1 · ·cos · ·sen 1.25 2 2 2 2 2 2
1.3.4 Modelo en el espacio de estados Para sistemas de tiempo discreto, el modelo en el espacio de estados es: xk 1 y k
f ( xk , uk ) g ( xk , uk )
(1.33)
En el caso de sistemas lineales el modelo en el espacio de estados toma la siguiente forma: xk 1 y k
F k · xk M k ·uk C k · xk Dk ·uk
(1.34)
En la expresión anterior F k, M k, Ck y Dk son matrices de dimensiones n x n, n x m, p x n y p x m, respectivamente. La presencia del subíndice en las matrices indica que éstas varían con el tiempo. En el caso de un sistema LTI estas matrices son constantes, por lo que el subíndice desaparece.
1.3.5 Función de transferencia Supóngase el modelo de estado de un sistema LTI en tiempo discreto con condiciones iniciales nulas. Sean U(z) e Y(z) las transformadas z del vector de entradas u k y del vector de salidas yk del sistema, respectivamente. Ambas se relacionan mediante la siguiente expresión: Y ( z ) H ( z )·U ( z )
(1.35)
donde H es una matriz de dimensión p x m que de denomina función de transferencia en tiempo discreto.
1-24
Identificación de sistemas
Se puede demostrar que la función de transferencia H se relaciona con las matrices F, M, C y D del modelo de estados a través de la siguiente relación: 1
H ( z ) C · z· I F M D
(1.36)
Si u e y son escalares (p=m=1), entonces H(z) es una función racional:
b1 z m1 ... bn1 z bn n H ( z ) n U ( z ) z a1 z 1 ... a n1 z a n Y ( z )
b0 z
m
(1.37)
Si todos los polos de H(z) se encuentran dentro del círculo unidad el sistema es estable. La función de transferencia H(z) de un sistema en tiempo discreto también se define como H ( z )
h ·z
k
k
(1.38)
k 0
donde hk es la respuesta (supuesto condiciones iniciales nulas) de un sistema en tiempo discreto a un impulso: k
1 k 0 0 0 k
(1.39)
Transformando (1.38) al dominio del tiempo, se obtiene la siguiente expresión:
y k
hr ·uk r
(1.40)
r 0
Que permite obtener la respuesta del sistema a cualquier entrada, si se conoce la respuesta de un sistema en tiempo discreto a un impulso.
1.4 CONSIDERACIONES BÁSICAS SOBRE LA RESPUESTA TEMPORAL Y FRECUENCIAL DE UN SISTEMA LINEAL 1.4.1 Sistemas de primer orden Supóngase un sistema lineal continuo de primer orden de la forma:
dy (t ) dt
y( t ) Ku( t )
(1.41)
1-25
TEMA 1: Modelos de sistemas continuos y discretos
donde u(t) e y(t) son la entrada y la salida del sistema, respectivamente. Tomando la transformada de Laplace con condiciones iniciales nulas se obtiene la siguiente función de transferencia: G ( s)
Y ( s) U ( s)
K
s 1
(1.42)
Este sistema de primer orden queda caracterizado por dos parámetros: su ganancia estática K y su constante de tiempo . El sistema tiene un polo situado en s=-1/ .
Si se excita al sistema de primer orden (1.42) con una entrada impulso ( u(t)=(t) o U(s)=1) la salida en el dominio de Laplace es:
Y ( s ) G ( s)·U ( s)
K
s 1
Tomando la transformada inversa de Laplace sobre la expresión anterior, de acuerdo con la Tabla 1.1, se obtiene la respuesta temporal del sistema a un impulso: y (t )
K
·e
t
t 0
(1.43)
En la Figura 1.6 se muestra la respuesta a un impulso del sistema de primer orden (1.42) para tres valores distintos de la constante de tiempo supuesto una ganancia K=1. Se observa que el valor máximo de la respuesta es K/ el cual se alcanza cuando t=0. Si t= la salida toma el valor y ( )
K
·e 1 0.37·
K
(1.44)
Es decir es aproximadamente el 37% de su valor inicial. Además conforme t aumenta la salida tiende asintóticamente al valor 0. Si se dispone de la salida a un impulso de un sistema de primer orden de la forma (1.42) cuyos parámetros K y son desconocidos es posible estimar estos parámetros. La constante de tiempo es el instante de tiempo en que la salida toma el 37% de su valor inicial. Por su parte la ganancia K se obtiene a partir del valor inicial de la salida y de la constante de tiempo que se relacionan mediante la siguiente expresión:
1-26
Identificación de sistemas
K
y (0)·
(1.45)
2 1.8 1.6 1.4 1.2 ) t ( 1 y
τ=0.5
τ=1
0.8 0.6
τ=1.5
0.4 0.2 0 0
0.5
1
1.5
2
2.5 Tiempo (sec)
3
3.5
4
4.5
5
Figura 1.6: Respuesta a un impulso de un sistema de primer orden
Si se excita al sistema de primer orden (1.42) con una entrada escalón unidad ( r (t)=1 o R(s)=1/s) la salida en el dominio de Laplace es:
Y ( s ) G ( s )·U ( s)
K
1
s 1 s
Descomponiendo en fracciones simples se obtiene: Y ( s ) G ( s )·U ( s)
K s
K s 1
Tomando la transformada inversa de Laplace sobre la expresión anterior, de acuerdo con la Tabla 1.1, se obtiene la respuesta temporal del sistema a un escalón unidad:
t
y (t ) K (1 e ) t 0
(1.46)
En la Figura 1.7 se muestra la respuesta a un escalón unidad del sistema de primer orden (1.42) para tres valores distintos de la constante de tiempo supuesto una ganancia K=1. Se observa que conforme aumenta el tiempo la salida tiende asintóticamente al valor K, es decir, a su ganancia en el estado estacionario. En t=0 la salida vale 0. Para t= la salida toma el valor
1-27
TEMA 1: Modelos de sistemas continuos y discretos
1
y ( ) K (1 e ) 0.63· K
Es decir, es aproximadamente el 63% de su valor final.
1
τ=0.5 τ=1
0.8
τ=1.5 ) t ( 0.6 y
0.4
0.2
0 0
1
2
3
4 5 Tiempo (sec)
6
7
8
9
Figura 1.7. Respuesta a un escalón unidad de un sistema de primer orden
Para t=3 la salida toma el valor y (3 ) 0.95· K
Es decir es aproximadamente el 95% de su valor final. Para t=4 la salida toma el valor y (4 ) 0.98· K
Es decir, es aproximadamente el 98% de su valor final. Al instante t=4 se le considera el tiempo de asentamiento para sistemas de primer orden, es decir, el instante de tiempo a partir del cual la respuesta a un escalón unidad permanece dentro de una banda del 2% de su valor final. Aunque de acuerdo con (1.50) el estado estacionario se alcanza en tiempo infinito, en la práctica se considera que se alcanza el valor estacionario cuando se alcanza el 98 % del valor final, es decir, transcurrido un tiempo igual a cuatro constantes de tiempo. Otra característica importante de la respuesta a un escalón unidad del sistema de primer orden (1.42) es que su pendiente en t=0 es igual a:
1-28
Identificación de sistemas
y (0)
K
(1.47)
Luego la abcisa del punto de la intersección de la recta tangente al valor inicial con la recta horizontal de valor K, es precisamente la constante de tiempo . Recuérdese que la constante de tiempo también se puede estimar como el instante de tiempo en que la respuesta a un escalón unidad alcanza el 63 % de su valor final. En la Figura 1.8 se resumen los dos métodos para obtener la constante de tiempo de un sistema de primer orden.
1
0.8
0.6 ) t ( y 0.4
0.2
0 0
τ 1
2
3
4
5
6
7
8
9
Tiempo (sec)
Figura 1.8. Determinación de la constante de tiempo de un sistema de primer orden
Supóngase que la salida del sistema de primer orden (1.42) se encuentra en un valor estado estacionario y 1 al que ha llegado tras ser excitado con una entrada escalón de amplitud u1 Si en un cierto instante posterior es excitado con una entrada escalón de amplitud u=u2-u1, el valor de su salida cuando alcance el estacionario será y 2. A partir de esta información se pueden estimar los parámetros de la función de transferencia del sistema (1.42) de la siguiente forma: K
y u
y2 y1 u2 u1
0.632· K· u
(1.48)
(1.49)
1-29
TEMA 1: Modelos de sistemas continuos y discretos
Las expresiones (1.48) y (1.49) permiten establecer el comportamiento del sistema de primer orden (1.42) en función del valor de su constante de tiempo:
Si la constante de tiempo es positiva >0 entonces la salida está acotada. Por lo tanto el sistema es estable. Nótese que en este caso el polo s=-1/ se encuentra ubicado en el semiplano izquierdo del plano s.
Si la constante de tiempo es negativa <0 entonces la salida no está acotada y el sistema es inestable. Nótese que en este caso el polo s=-1/ se encuentra ubicado en el semiplano derecho del plano s.
Si la constante de tiempo fuese cero, entonces el sistema no sería dinámico, y la relación entre la entrada y la salida vendría dada por la ganancia K. Se observa que cuanto mayor es el valor de la constante de tiempo más dura la respuesta transitoria y la respuesta tarda más en alcanzar su valor final, es decir, su valor en el estado estacionario. En conclusión la constante de tiempo es un indicador de la rapidez de la respuesta transitoria del sistema.
1.4.2 Integrador Supóngase un sistema lineal continuo de primer orden de la forma: dy (t ) dt
Ku( t )
(1.50)
Donde u(t) e y(t) son la entrada y la salida del sistema, respectivamente. Puesto que la salida se obtiene integrando la entrada, a este sistema se le denomina integrador . Tomando la transformada de Laplace con condiciones iniciales nulas se obtiene la siguiente función de transferencia: G( s)
Y ( s) U ( s)
K s
(1.51)
El sistema tiene un polo situado en el origen del plano s, es decir, en s=0. A este elemento se le denomina integrador . Si se excita (1.51) con una entrada escalón unidad ( r (t)=1 o R(s)=1/s) la salida en el dominio de Laplace es:
1-30
Identificación de sistemas
Y ( s) G ( s )·U ( s)
K s
2
Tomando la transformada inversa de Laplace sobre la expresión anterior, de acuerdo con la Tabla 1.1, se obtiene la respuesta temporal del sistema a un escalón unidad: y (t ) K t
t 0
(1.52)
En la Figura 1.9 se muestra la respuesta a un escalón de un integrador con K=1 Step Response
1 0.9 0.8 0.7 e0.6 d u t i l 0.5 p m A0.4
0.3 0.2 0.1 0 0
0.1
0.2
0.3
0.4
0.5 Time (sec)
0.6
0.7
0.8
0.9
1
Figura 1.9. Respuesta a un escalón unidad de un integrador
De la respuesta a un escalón unidad se puede concluir que un integrador es equivalente a un sistema de primer orden con una constante de tiempo muy grande .
1.4.3 Efecto de un cero en la respuesta temporal de un sistema de primer orden Supóngase un sistema lineal continuo de primer orden de la forma:
dy (t ) dt
du (t ) y( t ) K u( t ) dt
(1.53)
Donde u(t) e y(t) son la entrada y la salida del sistema, respectivamente. Tomando la transformada de Laplace con condiciones iniciales nulas se obtiene la siguiente función de transferencia:
1-31
TEMA 1: Modelos de sistemas continuos y discretos
G ( s)
Y ( s) U ( s)
s 1
K
s 1
(1.54)
El sistema tiene un polo situado en s=-1/ y un cero situado en s=-1/ . La aparición de este cero es consecuencia de la existencia en la ecuación diferencial de la derivada de la entrada. Si se excita (1.54) con una entrada escalón unidad ( r (t)=1 o R(s)=1/s) la salida en el dominio de Laplace es: s 1 1 Y ( s) G ( s )·U ( s) K s 1 s
Descomponiendo en fracciones simples se obtiene: Y ( s) G ( s )·U ( s)
K s
) s 1
K (
Tomando la transformada inversa de Laplace sobre la expresión anterior, de acuerdo con la Tabla 1.1, se obtiene la respuesta temporal del sistema a un escalón unidad:
t y (t ) K 1 1 e
t 0
(1.55)
Se observa que si >0 conforme t aumenta la salida tiende asintóticamente al valor K, es decir, a su ganancia en el estado estacionario. La presencia del cero no afecta a este valor. Tampoco afecta a la estabilidad del sistema ya que no aparece en el término exponencial. En t=0 la salida toma el valor y (0)
K ·
(1.56)
A diferencia del valor 0 que tomaba el sistema de primer orden cuando no existía un cero. Esto es debido a que el sistema no es estrictamente causal, es decir, el orden del denominador es igual que el orden del numerador de la función de transferencia. Si <0, el valor inicial de la salida tiene signo contrario al valor que toma en el estacionario. Este tipo de respuesta se denomina respuesta de fase no mínima o respuesta
1-32
Identificación de sistemas
inversa. Nótese que en este caso el cero se encuentra situado en el semiplano derecho del
plano s, se dice que se tiene un cero de fase no mínima. En la Figura 1.10 se muestra la respuesta a un escalón unidad del sistema (1.54) para tres valores distintos del parámetro supuesto K=1 y =0.5.
4
3
β=2 2 ) t ( 1 y
β=0.7
0
β=−0.7 −1
−2 0
0.5
1
1.5 TIempo (sec)
2
2.5
3
Figura 1.10. Respuesta a un escalón unidad de un sistema de primer orden con cero
En un sistema de primer orden con cero el tiempo de asentamiento, es decir, el tiempo en que la respuesta del sistema llega al 98% de su valor final viene dado aproximadamente por la siguiente expresión:
t e
50· ·ln
(1.57)
Este tiempo es mayor que 3.91 si >2, recuérdese que 4 era el tiempo de establecimiento para un sistema de primer orden sin cero. Finalmente comentar que si se encuentra comprendido en el intervalo [0, 2 ] se produce una cancelación significativa del polo y el cero.
1.4.4 Respuesta temporal de un sis tema de segundo orden Supóngase un sistema lineal de segundo orden que tiene la siguiente función de transferencia entre la entrada y la salida
1-33
TEMA 1: Modelos de sistemas continuos y discretos
G( s)
Y ( s) R( s )
2
K · n
s
2
2· ·n · s n2
(1.58)
En la expresión anterior K es la ganancia estática, es el factor o coeficiente de amortiguamiento (adimensional) y
n es la frecuencia natural no amortiguada (rad/s). Este
sistema se puede expresar equivalentemente en la forma G( s)
n2 s ( j· d )
(1.59)
donde es la razón de amortiguamiento y d es la frecuencia amortiguada. Imag Par de polos complejos conjugados x
j· d
n
0
Real
x
Figura 1.11. Representación en el plano complejo de un par de polos complejos conjugados
De acuerdo con la Figura 1.11 se establece la siguiente relación entre d, n y : n
2
d 2 2
(1.60)
Además el factor de amortiguamiento se relaciona con y con n mediante la expresión cos
n
(1.61)
Luego ·
Con lo que
1-34
n
(1.62)
Identificación de sistemas
d n 1 2
(1.63)
Si se excita al sistema (1.58) con un impulso ( r (t)=(t) o R(s)=1) se puede demostrar que se obtiene la siguiente salida: y(t )
n
·e · ·t ·sen( n · 1 2 ·t )
(1.64)
n
1
En la Figura 1.12 se dibuja la salida para distintos valores de . 1
δ=0.1
0.8
δ=0.25 0.6
δ=0.5 δ=0.7
0.4
δ=1 n w / ) t ( y
0.2 0
−0.2 −0.4 −0.6 −0.8 0
2
4
6
8
10 t
12
14
16
18
20
Figura 1.12. Respuesta a un impulso de un sistema de segundo orden
Derivando (1.64) e igualando a 0, se puede obtener el instante de tiempo tp donde la salida alcanza su valor máximo:
t p
cos 1 n · 1 2
(1.65)
Evaluando (1.64) en tp se obtiene el valor máximo:
·cos1 y (t p ) n ·exp 2 1
(1.66)
1-35
TEMA 1: Modelos de sistemas continuos y discretos
Asimismo si se excita el sistema (1.58) con una entrada escalón unidad ( r (t)=1 o R(s)=1/s) se puede demostrar que se obtiene la siguiente salida (supuesto
y(t ) 1
1.8
1
<1):
·e · ·t ·sen( n · 1 2 ·t cos 1 )
(1.67)
n
1
2
δ=0.1
1.6
δ=0.25 1.4
δ=0.50
1.2
δ=0.7 ) t ( y
1
δ=1
0.8 0.6 0.4 0.2 0 0
1
2
3
4
5 wn·t
6
7
8
9
10
Figura 1.13 Respuesta a un escalón unidad de un sistema de segundo orden
En la Figura 1.13 se dibuja la salida (1.67) para distintos valores del factor de amortiguamiento , se observan los siguientes comportamientos:
Si 0<<1 los dos polos del sistema de segundo orden son complejos conjugados. En dicho caso la respuesta oscila antes de alcanzar el valor estacionario. Se dice que el sistema es subamortiguado .
Si =1 los dos polos del sistema de segundo orden son reales e iguales. En dicho caso la respuesta no oscila antes de alcanzar el valor estacionario. Se dice que el sistema posee amortiguamiento crítico.
Si >1 los dos polos del sistema de segundo orden son reales y distintos. En dicho caso la respuesta no oscila antes de alcanzar el valor estacionario. Se dice que el sistema es sobreamortiguado .
1-36
Identificación de sistemas
Si =0, los dos polos del sistema de segundo orden son complejos conjugados y no poseen parte real. En dicho caso la respuesta oscila con una amplitud constante y nunca alcanza el valor estacionario. Se dice que el sistema es oscilante.
Si <0, el sistema es inestable y la respuesta es oscilante con oscilaciones de amplitud cada vez mayor.
Si se deriva (1.67) y se iguala a 0 se puede obtener el instante de tiempo tp donde la salida alcanza su valor máximo: t p
n · 1
2
(1.68)
Sustituyendo tp en (1.67) se obtiene el valor máximo o máxima sobrelongación de la salida:
· M p 1 exp 2 1
y (t p ) y p
(1.69)
Se define la sobreelongación relativa M0 como: M 0
y p
yss
y ss
(1.70)
Siendo yss el valor que la salida alcanza en el estado estacionario.
1.4.5 Efecto de un cero en la respuesta temporal de un sistema de segundo orden Supóngase un sistema lineal de segundo orden que tiene la siguiente función de transferencia entre la entrada y la salida G( s)
Y ( s) U ( s)
K·n ( s 1) 2
s
2
2· ·n · s n2
(1.71)
En la expresión anterior K es la ganancia estática, es el factor o coeficiente de amortiguamiento (adimensional),
n es la frecuencia natural no amortiguada (rad/s) y es la
constante de tiempo del cero s=-1/ .
1-37
TEMA 1: Modelos de sistemas continuos y discretos
Este sistema se puede expresar equivalentemente en la forma G ( s ) G2 ( s ) sG2 ( s )
(1.72)
Donde G2 ( s )
2
K · n s
2
2· ·n· s n2
(1.73)
Si se excita (1.71) con una entrada escalón unidad ( r (t)=1 o R(s)=1/s) la salida en el dominio de Laplace es: Y ( s ) G ( s )·U ( s) G2 ( s)
1 s
1
sG2 ( s) Y2 ( s) sY2 ( s) s
Donde Y2 ( s) G2 ( s )
1 s
Es decir, Y2(s) es la transformada de Laplace de y 2(t) que es la respuesta a un escalón unidad de un sistema de segundo orden sin cero. Aplicando la transformada inversa de Laplace con condiciones iniciales nulas se obtiene que la respuesta a un escalón unidad del sistema de segundo orden con cero (1.71) es: y (t ) y2 (t )
dy2 (t ) dt
Luego se observa que dicha respuesta es igual a la respuesta del sistema de segundo orden sin cero más la derivada de esta señal ponderada por la constante de tiempo del cero. Si el sistema es sobreamortiguado, la función de transferencia pasa a tener la siguiente forma: G ( s)
Donde
Y ( s) U ( s)
K·n ( s 1) 2
( 1s 1)( 2 s 1)
(1.74)
1 y 2 son las constantes de tiempo de los dos polos reales. En este caso la
respuesta a un escalón se verá afectada por la posición relativa del cero con respecto a los 1-38
Identificación de sistemas
polos. Señalar que si un cero se sitúa cerca de un polo se cancelan en gran medida los efectos de los dos elementos en la respuesta. Tanto si se tiene un sistema sobreamortiguado como subamortiguado, la derivada de la salida no es nula en t=0, al contrario de lo que sucede en un sistema de segundo orden sin cero. La respuesta de un sistema de segundo orden con cero se clasifica en dos tipos atendiendo al signo de la constante de tiempo del cero:
Si >0 el cero s=-1/ se encuentra situado en el semiplano izquierdo del plano s y el sistema se dice que es de fase mínima. En este caso la respuesta temporal se verá afectada en forma de un aumento en la rapidez de la respuesta y en la sobreoscilación. Se distinguen los siguientes casos: 1. Si >2>1. La respuesta presenta una sobreoscilación tanto más acusada cuanto más se acerca el cero al origen respecto a la posición de los polos. 2. Si 2>>1. La respuesta se puede aproximar a la de un sistema de primer orden con polo s=-1/ 1, aunque debido a la cancelación del cero y el polo se produce un transitorio de pequeña magnitud que produce una deriva lenta de la salida hacia su situación en estado estacionario. 3. Si
2>>1. La presencia del cero tiende a acelerar la respuesta respecto
al caso sin cero. Si el cero está cerca del polo más alejado del origen, la respuesta cada vez más se aproximará más a la de un sistema de primer orden con constante de tiempo
2.
En este caso no se produce una
deriva lenta de la salida hacia su estado estacionario porque la dinámica despreciada se anula rápidamente. 4. Si 2>1>. Al alejar el cero del origen del plano complejo (y de los polos), la respuesta tiende a la que tendría el sistema de segundo orden con los mismos polos pero sin el cero.
Si <0 el cero s=-1/ se encuentra situado en el semiplano derecho del plano s y el sistema se dice que es de fase no mínima. En este caso en la respuesta 1-39
TEMA 1: Modelos de sistemas continuos y discretos
temporal a un salto. La derivada de y 2(t) se resta de y2(t) con lo que y(t) provocando una respuesta inversa a la dirección original de la respuesta del sistema durante un cierto periodo de tiempo. La respuesta inversa es tanto más pronunciada conforme cuanto más se acerca el cero al origen del plano complejo. En conclusión un sistema de segundo orden con un cero es capaz de presentar una amplia variedad de respuestas temporales en función de la posición de los polos y el cero.
1.4.6 Respuesta temporal de un sistema lineal con ganancia negativa La respuesta temporal de un sistema lineal con ganancia negativa es la misma que la de un sistema con ganancia positiva pero con el signo cambiado. A modo de ejemplo se muestra en la Figura 1.14 la respuesta a un escalón unidad del sistema de primer orden G1 ( s )
K
2s 1
para K=1 y K=-1. Step Response 1 0.8 0.6
K=1
0.4 0.2 ) t ( y
0
−0.2 −0.4
K=−1
−0.6 −0.8 −1 0
0.5
1
1.5 Tiempo (sec)
2
2.5
3
Figura 1.14. Respuesta a un escalón unidad de un sistema de primer orden con ganancia positiva (línea continua) y con ganancia negativa (línea discontinua)
1-40
Identificación de sistemas
1.4.7 Respuesta temporal de un sistema lineal con ceros en el semiplano derecho La respuesta temporal de un sistema lineal con ceros en el semiplano derecho, es decir, ceros de fase no mínima, se caracteriza por tener una respuesta inversa: la respuesta toma inicialmente un signo contrario al que tendrá cuando alcance el estado estacionario. A modo de ejemplo en la Figura 1.15 se muestra la respuesta a un escalón de un sistema de segundo orden subamortiguado y de un sistema de segundo orden sobreamortiguado, ambos sistemas poseen un cero de fase no mínima. Inicialmente la respuesta tiene una pendiente negativa con lo que evoluciona hacía valores decrecientes hasta alcanzar un cierto valor mínimo, a partir del cual la pendiente pasa a ser positiva y la respuesta evoluciona hacia valores crecientes, es decir, pasaría a tener el comportamiento esperado para un sistema de segundo orden. Señalar que a este valor mínimo, en el caso de sistemas subamortiguados, se le suele denominar con el nombre de bajaelongación , en contraposición al valor máximo que alcanzan la respuesta a un escalón de estos sistemas y que se denomina sobreelongación.
2.5 2 1.5 1 ) t ( y
0.5 0
−0.5 −1 −1.5 −2 0
2
4
6 Tiempo (sec)
8
10
12
Figura 1.15. Respuesta a un escalón unidad de un sistema de segundo orden subamortiguado (línea continua) y de un sistema sobreamortiguado (línea discontinua) con un cero en el semiplano derecho
1-41
TEMA 1: Modelos de sistemas continuos y discretos
1.4.8 Respuesta temporal de un si stema lineal con retardo Se dice que un sistema de una entrada y una salida posee un retardo (delay), también denominado tiempo muerto (dead time) o retraso de transporte (transport lag) td si al ser excitado en el instante t 0 en su entrada el sistema comienza a generar una salida a partir del instante t0+ td. Muchos procesos en la industria, así como en otras áreas, presentan retardos en su comportamiento dinámico. Los retardos son causados principalmente por fenómenos de transporte de información, energía o masa. Los retardos tienen una gran influencia (generalmente negativa) en la estabilidad de los sistemas en lazo cerrado. Además la existencia de retardos dificulta el diseño y análisis de controladores ya que cada acción realizada por la señal de control sobre la variable manipulada del proceso solo comenzará a afectar a la variable controlada cuando haya transcurrido el tiempo de retardo. La respuesta temporal de un sistema lineal con retardo es la misma que la respuesta temporal del sistema si no existiera retardo pero retrasada un tiempo t d. Se va ilustrar este hecho con un sistema lineal continuo de primer orden de la forma:
dy (t ) dt
y (t ) Ku(t t d )
(1.75)
donde u(t) e y(t) son la entrada y la salida del sistema, respectivamente. Además K es la ganancia estática,
la constante de tiempo, y t d el tiempo que tarda el sistema en responder
a la entrada o tiempo de retardo. Tomando la transformada de Laplace con condiciones iniciales nulas se obtiene: sY ( s ) Y ( s ) Ke
td s
U ( s)
(1.76)
Reorganizando se obtiene la siguiente función de transferencia: G ( s)
Y ( s) U ( s)
K
s 1
e
td s
(1.77)
Si se compara esta función de transferencia con la función de transferencia (1.42) se observa que la existencia de un tiempo de retardo t d introduce el término exponencial e t s . d
1-42
Identificación de sistemas
En el dominio de la frecuencia el término exponencial e t s asociado al retardo se puede d
usar directamente sin necesidad de recurrir a ninguna aproximación del mismo. Sin embargo cuando es necesario utilizar los ceros y los polos de una función de transferencia de un sistema con retardo, como en la técnica del lugar de las raíces o en los métodos de ubicación de polos, se requiere usar una aproximación racional del término de retardo. Una de las aproximaciones racionales más utilizadas es la aproximación de Pade de primer orden:
e
td s
t d
2
t d
2
s 1
(1.78)
s 1
Nótese que la aproximación de Pade del retardo posee un cero de fase no mínima. En general este tipo de ceros suponen una posible forma de modelar los retrasos. De acuerdo con lo explicado en la sección anterior la reacción a un cambio en forma de escalón en la entrada de un sistema con un cero de fase no mínima es inicialmente en un sentido pero acaba evolucionando en sentido contrario. Este tiempo que tarda en tomar la dirección correcta puede considerarse una forma de modelar el retardo. En la Figura 1.16 se muestra la respuesta a un escalón de un sistema de primer con retardo td=2 s. Se observa que la respuesta tiene la misma forma que la de un sistema de primer orden sin retardo pero retrasada un tiempo t d.
1 0.8
) t ( y
0.6 0.4 0.2 t
d
0 −0.2 0
1
2
3
4
5 6 Tiempo(seg)
7
8
9
10
11
Figura 1.16. Respuesta a un escalón unidad de un sistema de primer orden con retardo
1-43
TEMA 1: Modelos de sistemas continuos y discretos
En la Figura 1.17 se muestra la respuesta a un escalón de un sistema de primer con retardo puro t d=2 segundos y la del sistema considerando la aproximación de Pade de primer orden del retardo. Se observa que al modelar el retardo mediante una aproximación de Pade de primer orden el sistema comienza a responder en la dirección correcta en aproximadamente aproximadamente 1.4 segundos. Es decir, 0.6 segundos antes que si se considera el retardo puro. Con lo que podría pensarse que la aproximación no es muy buena. Sin embargo la pendiente de la respuesta es más pequeña, lo que propicia que ambas respuestas sean prácticamente iguales cuando la respuesta alcanza el 60% de su valor en el estacionario
1 0.8
) t ( y
0.6 0.4 0.2 0 −0.2 0
1
2
3
4
5 6 Tiempo(seg)
7
8
9
10
11 11
Figura 1.17. Respuesta a un escalón de un sistema de primer con retardo t d puro (línea continua) y la
del sistema considerando la aproximación de Pade de primer orden del retardo (línea punteada) .
1.4. 1.4.9 9 Especificacion es de la respuesta tempor temporal al de un sistema si stema lineal El comportamiento temporal de un sistema de cualquier orden puede ser especificado en términos de su respuesta transitoria a un escalón unidad. Dicha respuesta se puede caracterizar en función de los siguientes parámetros (ver Figura 1.18):
Máxima sobreelongación Mp. Es el máximo valor de la respuesta.
Tiempo de pico tp. Es el instante de tiempo en que la salida alcanza su valor máximo Mp.
1-44
Identificación de sistemas
Tiempo de asentamiento ts. Es el tiempo requerido para que la respuesta alcance y
permanezca dentro de una banda de una determinada anchura, típicamente el 2% o el 5% del valor final de la salida en el estacionario. Para un sistema de segundo orden o de orden superior con un par de polos complejos dominantes el tiempo de asentamiento para un criterio de error del 2% se puede demostrar que verifica la siguiente desigualdad t s
4 · n
(1.79)
Tiempo de subida tr . Es el tiempo requerido para que la respuesta, en su subida
inicial vaya desde el 0.1 hasta el 0.9 de su valor en el estado estacionario. 1.3 Mp
1.2
Banda del 2% de error
1.1 1 0.9 0.8 ) t ( y
0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 0
tr 2
tp 4
6
ts 8
10
12
14
16
18
20
t
Figura 1.18. Parámetros para caracterizar la respuesta de un sistema
Es importante tener en cuenta que la respuesta temporal de un sistema depende de las condiciones iniciales. Por lo tanto para comparar las respuestas temporales de diferentes sistemas es necesario considerar las mismas condiciones iniciales. En el caso de un sistema de segundo orden es posible y relativamente sencillo obtener expresiones analíticas para los parámetros de la respuesta temporal en función del factor de amortiguamiento y de la frecuencia natural n de dicho sistema.
1-45
TEMA 1: Modelos de sistemas continuos y discretos
En sistemas de orden superior a dos su obtención es más tediosa. Sin embargo si un sistema G(s) de orden superior a dos posee un par de polos complejos dominantes , que son aquellos cuya parte real se encuentra situada más cerca del eje imaginario que la del resto de polos del sistema, entonces su respuesta puede ser aproximada por la de un sistema con función de transferencia G r (s) (s) que contiene exclusivamente dichos polos dominantes y con ganancia igual a la del sistema original G(s). En consecuencia si un sistema tiene uno o dos polos dominantes, su respuesta a un escalón puede determinarse a partir de los resultados analizados en las secciones anteriores para sistemas de primer y segundo orden. Obviamente para realizar la aproximación se debe tener en cuenta la presencia de ceros que estén a una distancia del eje imaginario comparable, comparable, o inferior, a la de los polos dominantes. Si el sistema tiene un par de polos dominantes con comportamiento subamortiguado es posible estimar el factor de amortiguamiento y la frecuencia natural n de estos polos si se dispone de los valores de la sobreelongación Mp y tiempo de asentamiento ts de la respuesta a un escalón del sistema mediante las siguientes expresiones:
ln( M p 1) 2 ln( M p 1) 2 2
n
(1.80)
4 ·t s
1.5 CONSIDER CONSIDERACIONES ACIONES BÁSICAS BÁ SICAS SOBRE FRECUENC FRECUENCIAL IAL DE UN SISTEMA SISTEMA LINEAL L INEAL
(1.81)
LA
RESPUEST RESPUESTA A
1.5. 1.5.1 1 Defini Definició ción n de respuesta en en frecuenci a de un si stema lineal lineal Se denomina función de transferencia en el dominio de la frecuencia o más abreviadamente función de frecuencia o respuesta en frecuencia del sistema a la función G(j) que se obtiene sustituyendo s por j en la función de transferencia del sistema. G(j) es una función compleja que puede descomponerse en la suma de su parte real (Re) y su parte imaginaria (Im). G ( j ) Re[G ( j )] j Im[G ( j )]
De forma equivalente G(j ) puede expresarse de la siguiente forma: 1-46
(1.82)
Identificación de sistemas
G ( j ) G ( j ) ·e
j arg G ( j )
(1.83)
donde: G ( j )
(Re[G ( j )])2 (Im[G ( j )])2 Im[G ( j )] R e [ ( ) ] G j
arg G ( j ) arctan
(1.84)
(1.85)
G ( j ) es el módulo, amplitud o magnitud y arg G ( j ) es el argumento o fase.
Para un sistema lineal G(s) con una entrada u(t) y una salida y(t), se cumple que Y ( s) G( s)·U ( s)
(1.86)
Y ( j ) G ( j )·U ( j )
(1.87)
Haciendo s=j se obtiene
Que se puede expresar equivalentemente en la forma: Y ( j ) ·e
j arg Y ( j )
G( j ) ·e j arg G( j ) U ( j ) ·e j arg U ( j )
De la que se deducen las siguientes expresiones para la magnitud y la fase de G(j ): G ( j )
Y ( j ) U ( j )
arg G ( j ) arg Y ( j ) argU ( j )
Es decir | G ( j ) | se determina como el cociente entre la amplitud de la señal de salida y la amplitud de la señal de entrada. Mientras que la fase arg G ( j ) se determina como la diferencia entre la fase de la señal de salida menos la fase de la señal de entrada.
1-47
TEMA 1: Modelos de sistemas continuos y discretos
1.5. 1.5.2 2 Repr Representació esentació n gráfica gráfic a de la respuesta resp uesta en frecuenci frecu encia a de un sistema 1.5.2. 1.5.2.1 1 Magnit Magnit ud logarítmi ca
La magnitud logarítmica (logarithmic magnitude (Lm)) se define de la siguiente forma: Lm(G ( j )) 20·log10 G ( j )
(1.88)
y sus unidades son los decibelios (dB). Algunas propiedades útiles de la magnitud logarítmica son:
El valor en decibelios decibelios de números recíprocos recíprocos difieren sólo en un signo. Por ejemplo Lm(2)= 6.02 dB y Lm (½ )= -6.02 dB. Cuando un número se duplica su valor en dB aumenta en 6 dB. Por ejemplo, como Lm(0.5)= -6.02 dB entonces Lm(2·0.5)= Lm(2· 0.5)= Lm(2)+Lm(0.5)=6.02 -6.02= 0 dB número se multiplica multiplica en un fa factor ctor de 10 su valor valor en dB se se incrementa Cuando un número en 20 dB. Por ejemplo, como Lm(10)= 20 dB entonces Lm(10*10)=Lm(10)+Lm(10)=20+20= 40 dB. 1.5.2.2 1.5.2.2 Octav a y década
Se dice que el rango o banda de frecuencias [ f 1, f 2] posee una anchura de una octava si se verifica que f 2/f 1=2. Por ejemplo la banda de frecuencia [1, 2] (Hz) posee una anchura de una octava en anchura, al igual que la banda [17.4, 34.8] (Hz). El número de octavas en el rango de frecuencia [ f 1, f 2] es
f log10 ( f 2 / f 1 ) 3.32·log10 2 octavas log10 2 f 1
(1.89)
Se dice que el rango o banda de frecuencias [ f 1, f 2] posee una anchura de una década si se verifica que f 2/f 1=10. Por ejemplo la banda de frecuencia [1, 10] (Hz) posee una anchura de una década en anchura, al igual que la banda [2.5, 25] (Hz). El número de décadas en el rango de frecuencia [ f 1, f 2] es
f 2 décadas f 1
log10
1-48
(1.90)
Identificación de sistemas
1.5.2. 1.5.2.3 3 Tipos de diagramas en en el domi nio de la frecuenc ia
La función de transferencia en el dominio de la frecuencia de un sistema se suele representar, principalmente, principalmente, en tres tipos de diagramas:
Diagrama de Nyquist o diagrama polar . En el eje de abscisas se representa la parte
real de G(j ) y en el eje de ordenadas se representa su parte imaginaria. A este plano se le denomina también plano complejo .
Diagrama de Bode . Consta de dos gráficas. La primera gráfica representa la
magnitud logarítmica Lm(G(j)) en función de la frecuencia . En el eje de abscisas se usa escala logarítmica y en el eje de ordenadas escala lineal. La segunda gráfica representa la fase arg(G(j )) expresada en grados en función de la frecuencia . Tanto en el eje de abscisas como en el de ordenadas se usa escala lineal.
Diagrama de Nichols . En el eje de abscisas se representa la fase arg(G(j )) en
grados y en el eje de ordenadas se representa la magnitud logarítmica Lm(G(j)). Tanto en el eje de abscisas como en el de ordenadas se usa escala lineal. 1.5.2. 1.5.2.4 4
Conceptos im port antes asoc asoc iados a las representaciones de la respuest respuest a en frecuencia
Existen varios conceptos importantes asociados a las representaciones de la respuesta del sistema en el dominio de la frecuencia:
Frecuencia de corte c (rad/s). Para sistemas cuya amplitud a bajas frecuencias es un valor constante no nulo, es decir, el sistema no tiene en ni polos ni ceros en el origen, la frecuencia de corte se define como la frecuencia a partir de la cual la amplitud del sistema se reduce en 3 dB (70.7 %) respecto a la amplitud en =0. G ( j· c )
1 G ( j·0) 2
Lm(G ( j·c )) 20 log10 G( j· c )
1 20 log10 G( j·0) 2
1 log10 G( j·0 ·0) 20 lo 2 3.0103 Lm( G( j·0))
log10 20 lo
1-49
TEMA 1: Modelos de sistemas continuos y discretos
Frecuencia esquina e (rad/s). Es aquella frecuencia o frecuencias en las que la aproximación asintótica de la respuesta en frecuencia de un polo o un cero cambia de pendiente.
Ancho de banda o banda pasante. Es el rango de frecuencias por debajo de la frecuencia de corte: 0 c
Para sistemas con un comportamiento de filtro pasa-baja, es decir, que dejan pasar las bajas frecuencias y atenúan las altas frecuencias, su ganancia a bajas frecuencias será un valor constante distinto de cero. Para dichos sistemas el ancho de banda coincide con la frecuencia de corte. Para sistemas con un comportamiento de filtro pasa-alta, es decir, que dejan pasar las altas frecuencias y atenúan las bajas frecuencias, la ganancia de referencia para calcular el ancho de banda es la ganancia a alta frecuencia. Para sistemas con un comportamiento de filtro pasa-banda, es decir, que dejan pasar una banda de frecuencia pero atenúan las bajas y las altas frecuencias, el ancho de banda es la diferencia entras las frecuencias en las que su atenuación al pasar a través del sistema se mantiene igual o inferior a 3 dB comparada con la frecuencia principal, que se suele tomar como la central de la banda. El ancho de banda de un sistema da una indicación de las propiedades de la respuesta transitoria de un sistema de control, así como de las características al filtrado de ruido. El ancho de banda es una medida de la posibilidad que tiene el sistema de reproducir fielmente una señal de entrada. Generalmente la respuesta del sistema para valores de frecuencia superiores al ancho de banda estará atenuada. El ancho de banda es además una medida directa de la sensibilidad del sistema al ruido (un ancho de banda muy grande indica que el sistema es muy sensible a los ruidos de alta frecuencia).
1-50
Identificación de sistemas
1.5.3 Respuesta frecuencial de un sistema lineal genérico con tinuo La función de transferencia de un sistema lineal en tiempo continuo puede expresarse de la siguiente forma general:
s 2 2 l s 1 K ( l s 1) 2 l 1 l 1 nl nl e t s G( s) p 2 h s 2 s N s ( i s 1) 2 i 1 ni i 1 i 1 ni q
r
d
(1.91)
Se observa que esta función de transferencia posee los siguientes factores individuales: una ganancia K, q ceros reales, r pares de ceros complejos conjugados, N polos en el origen (integradores), p polos reales, h pares de polos complejos conjugados y un tiempo de retardo td. Sustituyendo s por j en (1.91) se obtiene lo siguiente:
j 2 2 l K ( l j 1) j 1 nl nl l 1 l 1 e t j G ( j ) 2 p h j 2 i N ( j ) ( i j 1) j 1 ni ni i 1 i 1 q
r
d
(1.92)
La magnitud logarítmica de G(j ) se obtiene como la suma de las magnitudes logarítmicas de cada uno de los factores individuales de que consta la función de transferencia:
j 2 2 l Lm( G( j )) Lm( K ) Lm( l j 1) Lm j 1 nl nl l 1 l 1 p h j 2 2 N i Lm(( j ) ) Lm( i j 1) Lm j 1 (1.93) ni ni i 1 i 1 q
r
Por su parte la fase de G(j ) expresada en grados se obtiene como la suma de las fases de cada uno de los factores individuales de que consta la función de transferencia:
1-51
TEMA 1: Modelos de sistemas continuos y discretos
j 2 2 l arg(G ( j )) arg( l j 1) arg j 1 arg(( j ) N ) nl nl l 1 l 1 p h j 2 2 arg( i j 1) arg i j 1 arg( e j t ) (1.94) ni ni i 1 i 1 q
r
d
Se concluye por tanto que el diagrama de Bode de un sistema genérico se puede obtener sumando la gráfica debida a cada factor individual. En las siguientes secciones se describe la respuesta frecuencial de cada uno de los posibles factores que pueden formar parte de una función de transferencia: ganancia, integrador, derivador, elemento de retardo, polo real, cero real, par de polos complejos conjugados y par de ceros complejos conjugados.
1.5.4 Respuesta frecuencial de una constante Supóngase una constante:
K
(1.95)
La magnitud logarítmica y la fase de una constante son: LmK
20·log10 0 180º
arg K
K
K 0 K 0
(1.96)
(1.97)
Se observa que tanto la magnitud logarítmica como la fase son independientes de la frecuencia. En consecuencia el diagrama de Bode de una constante es una línea horizontal en la curva de magnitud y otra línea horizontal en la curva de fase.
1.5.5 Respuesta frecuencial de un in tegrador Supóngase N polos en el origen o integradores: 1 N
s
Sustituyendo s por j se obtiene la respuesta en frecuencia:
1-52
(1.98)
Identificación de sistemas
1 ( j ) N
(1.99)
La magnitud logarítmica y la fase vienen dadas por las siguientes expresiones:
1 1 1 20·log10 20·log10 N 20· N ·log N N j j
Lm
(1.100)
1 90º· N j N
arg
(1.101)
Se observa que la magnitud tiene una pendiente -20·N dB/década. Conforme la frecuencia tiende a cero la magnitud va aumentando. Por el contrario conforme aumenta la frecuencia la magnitud va decreciendo. Por su parte la fase es siempre constante e igual a -90º·N. En la Figura 1.19 se representa el diagrama de Bode de un integrador (N=1). Se observa que un integrador atenúa las altas frecuencias. Es decir, tiene un comportamiento de filtro pasa-baja.
50 ) B d ( 0 d u t i n g −50 a M
−100 −2 10
−1
10
0
1
10
10
2
10
3
10
−89 −89.5
) º ( e −90 s a F
−90.5
−91 −2 10
−1
10
0
1
10
10
2
10
3
10
ω (rad/s)
Figura 1.19. Diagrama de Bode de un integrador
1-53
TEMA 1: Modelos de sistemas continuos y discretos
1.5.6 Respuesta frecuencial de un deriv ador Supóngase M ceros en el origen o derivadores s M
(1.102)
Sustituyendo s por j se obtiene la respuesta en frecuencia: ( j ) M
(1.103)
La magnitud logarítmica y la fase de los M derivadores vienen dadas por las siguientes expresiones: Lm
j 20·log M
M
10
j 20·log10 M 20· M ·log
M
arg j
(1.104)
90º· M
(1.105)
Se observa que la magnitud tiene una pendiente 20·M dB/década. Conforme la frecuencia tiende a cero la magnitud va disminuyendo. Por el contrario conforme aumenta la frecuencia la magnitud va aumentando. Por su parte la fase es siempre constante e igual a 90º·M. En la Figura 1.20 se representa el diagrama de Bode de un derivador (N=1). Se observa que un derivador atenúa las bajas frecuencias. Es decir, tiene un comportamiento de filtro pasa-alta. 50 ) B d 0 ( d u t i n g −50 a M
−100 −3 10
−2
10
−1
0
10
10
1
10
2
10
91 90.5
) º ( e 90 s a F
89.5 89 −3 10
−2
10
−1
0
10
10
1
10
ω (rad/s)
Figura 1.20. Diagrama de Bode de un derivador
1-54
2
10
Identificación de sistemas
1.5.7 Respuesta frecuencial de un elemento de retardo Supóngase un retardo puro t d e
st d
(1.106)
Sustituyendo s por j se obtiene la respuesta en frecuencia: e
j t d
(1.107)
La magnitud logarítmica y la fase del elemento de retardo vienen dadas por las siguientes expresiones:
Lm e
j t d
20·log
10
e
j td
20·log10 1 0
(1.108)
arg e j t t d
(1.109)
d
Se observa que un elemento de retardo no contribuye a la magnitud de un sistema pues tienen magnitud 1 (0 dB) pero introduce un desfase lineal con la frecuencia. En la Figura 1.21 se representa el diagrama de Bode de un elemento de retardo con td=2. ) B d ( d u t i n g a M
1
0
−1 −2 10
−1
10
0
10
1
10
2
10
0
) º ( −5000 e s a F−10000
−15000 −2 10
−1
10
0
10 ω (rad/s)
1
10
2
10
Figura 1.21. Diagrama de Bode de un elemento de retardo con t d=2
Los tiempos de retardo tienen una gran influencia en la respuesta en frecuencia de un sistema, puesto que constituyen un elemento de fase no mínima, que contribuye con un decremento extra de la fase el cual puede causar inestabilidad
1-55
TEMA 1: Modelos de sistemas continuos y discretos
1.5.8 Respuesta frecuencial de un polo real: sistema de primer orden Considérese un polo real: 1 · s 1
(1.110)
Sustituyendo s por j se obtiene la respuesta en frecuencia: 1 · j 1
(1.111)
La magnitud logarítmica y la fase vienen dadas por las siguientes expresiones:
1 1 20log10 20log10 1 1 j j 10log10 ( 2 2 1)
Lm
1 arctan( ) j 1
arg
1 2 2
1
(1.112)
(1.113)
Se observa que a bajas frecuencias, es decir, para 0 la magnitud logarítmica tiende al valor de 0 dB. Por su parte la fase tiende a 0º. Conforme aumenta la frecuencia la magnitud logarítmica se va haciendo cada vez más negativa con una pendiente asintótica de -20 dB/década. Por su parte la fase tiende a -90º. Señalar que si el polo fuese inestable <0 entonces la fase tiende a 90º, es decir, se comporta como un cero real. En definitiva un polo real tiene un comportamiento de filtro pasa baja, por lo que el ancho de banda de este sistema de primer orden es: 0 c
Aplicando su definición y operando se puede demostrar que la frecuencia de corte es: c
1-56
1
(1.114)
Identificación de sistemas
Se observa que cuanto menor sea la constante de tiempo, es decir, cuanto más rápido sea el sistema, mayor será su ancho de banda. En la Figura 1.22 se representa el diagrama de Bode de un polo real
0 ) B−20 d ( d u−40 t i n g a−60 M
−80 −2 10
−1
10
0
1
10
10
2
3
10
10
0 ) º ( e−50 s a F
−90 −2
10
−1
10
0
1
10
10
2
3
10
10
ω (rad/s)
Figura 1.22. Diagrama de Bode de un polo real
1.5.9 Respuesta frecuenc ial de un cero real Considérese un cero real · s 1
(1.115)
Sustituyendo s por j se obtiene la respuesta en frecuencia del cero · j 1
(1.116)
La magnitud logarítmica y la fase vienen dadas por las siguientes expresiones: Lm · j 1 20log10 · j 1
20log10 2 2 1
10log10 ( 1) 2
2
arg j 1 arctan( )
(1.117)
(1.118)
Se observa que a bajas frecuencias, es decir, para 0 la magnitud logarítmica tiende al valor de 0 dB. Por su parte la fase tiende a 0º.
1-57
TEMA 1: Modelos de sistemas continuos y discretos
Conforme aumenta la frecuencia la magnitud logarítmica se va haciendo cada vez más grande con una pendiente asintótica de 20 dB/década. Por su parte la fase tiende a +90º. Señalar que si el cero es de fase no minima ( <0) entonces la fase tiende a -90º, es decir, se comporta como un polo real. En la Figura 1.23 se representa el diagrama de Bode de un cero real
80 ) B60 d ( d u t i 40 n g a20 M
0 −2 10
−1
10
0
1
10
2
10
10
3
10
90 ) º ( e s45 a F
0 −2 10
−1
10
0
1
10
2
10
10
3
10
ω (rad/s)
Figura 1.23. Diagrama de Bode de un cero real
1.5.10 Respuesta frecuencial de un par de polos complejos conjugados: sistema de segundo orden Considérese un par de polos complejos conjugados expresados como un factor cuadrático en s: 1 s 2· ·s 1 2
(1.119)
2
n
n
Sustituyendo s= j· en la expresión anterior y reordenando se obtiene la respuesta en frecuencia 1
2 1 2 j·2· · n n
Las expresiones de la magnitud logarítmica y de la fase son: 1-58
(1.120)
Identificación de sistemas
2 2 2 1 2 Lm 10·log10 1 2 4· · 2 2 n n j 1 ·2· · 2 n n
(1.121)
1 2· · / n arg arctan 2 2 1 1 2 j·2· · 2 n n n
(1.122)
Se observa que a bajas frecuencias la magnitud tiende a 1, es decir a 0 dB y la fase a 0º. Mientras que para altas frecuencias la magnitud tiende a 0, es decir, la magnitud logarítmica se va haciendo cada vez más negativa con una pendiente asintótica de -40 dB/década. Por su parte, si el par de polos complejos es estable, es decir, se encuentran ubicados en el semiplano izquierdo del plano complejo entonces, la fase tiende a -180º. En caso contrario si los polos son inestables, entonces la fase tiende a 180º, es decir, se comporta como un par de ceros complejos conjugados estables. Si el par de polos complejos es subamortiguado entonces la representación gráfica de la magnitud en el diagrama de Bode presenta un pico de resonancia en =r que es la frecuencia de resonancia que está cerca de n. Derivando e igualando a 0 la expresión de la magnitud de un par de polos complejos conjugados se puede encontrar la frecuencia de resonancia r para la que se obtiene el valor máximo en la magnitud Mr r
n· 1 2· 2
(1.123)
Sustituyendo este valor en (1.83) se obtiene M r
1 2· · 1
2
(1.124)
En la Figura 1.24 se representa la magnitud logaritmica para distintos valores de .
1-59
TEMA 1: Modelos de sistemas continuos y discretos
15
δ=0.1 10
δ=0.25 5 ) B d ( | G |
δ=0.5 0
δ=0.7 δ=1
−5
−10
−15 −1 10
0
10 w (rad/s)
Figura 1.24. Amplitud de un sistema de polo complejo con n=0.5 rad/s y distintos valores de
Señalar que la magnitud del pico M r solo depende de . Conforme tiende a 0, r
n y M r . Para >0.707 no hay pico de resonancia y M r =1 El ancho de banda viene dado por la siguiente expresión 2 AB n 1 2
2 4 2 4 4
(1.125)
Cuando varía entre 0 y 1, el ancho de banda es directamente proporcional a la frecuencia natural n y varía entre 1.55 n y 0.64 n . Para =0.707, AB n Si los polos son reales, es decir, el sistema es sobreamoriguado, entonces el diagrama de Bode se construye a partir de los dos sistemas de primer orden que lo forman. Si un sistema G(s) de orden superior a dos posee un par de polos complejos dominantes , que son aquellos cuya parte real se encuentra situada más cerca del eje
imaginario que la del resto de polos del sistema, entonces una aproximación de una función de transferencia de alto orden que contenga sus polos dominantes tiende a reproducir la dinámica lenta del sistema, pasando por alto la rápida. En consecuencia la respuesta en frecuencia de la aproximación con polos dominantes no difiere mucho de la del sistema original a bajas frecuencias. Luego la aproximación con polos dominantes representa un modelo a baja frecuencia del sistema. Esto es algo esperable ya que los polos o ceros
1-60
Identificación de sistemas
rápidos (constantes de tiempo pequeñas o frecuencias naturales elevadas) contribuyen muy poco para valores bajos de la frecuencia.
1.5.11 Respuesta frecuencial de un par de ceros complejos conjugados Considérese un par de polos complejos conjugados expresados como un factor cuadrático en s: s
2
n2
2· ·s 1
(1.126)
n
Sustituyendo s= j· en la expresión anterior y reordenando se obtiene la respuesta en frecuencia
2 1 2 j·2· · n n
(1.127)
Las expresiones de la magnitud logarítmica y de la fase son: 2 2 2 2 2 Lm 1 2 j·2· · 10·log10 1 2 4· · 2 n n n n
2· · / n arg 1 2 j·2· · arctan 2 1 n n 2 n
(1.128)
2
(1.129)
Se observa que a bajas frecuencias la magnitud tiende a 1, es decir a 0 dB y la fase a 0º. Mientras que para altas frecuencias la magnitud tiende a infinito, es decir, la magnitud logarítmica se va haciendo cada vez más positiva con una pendiente asintótica de 40 dB/década. Por su parte, si el par de ceros complejos es estable, es decir, se encuentran ubicados en el semiplano izquierdo del plano complejo entonces, la fase tiende a 180º. En caso contrario si los polos son inestables, entonces la fase tiende a -180º, es decir, se comporta como un par de polos complejos conjugados estables.
1-61
TEMA 1: Modelos de sistemas continuos y discretos
Si el par de polos complejos es subamortiguado entonces la representación gráfica de la magnitud en el diagrama de Bode presenta un pico de resonancia en =r que es la frecuencia de resonancia que está cerca de n
1.5.12 Efecto de un cero en la respuesta frecuencial de un sist ema de primer orden Considérese el siguiente sistema de primer orden con un cero: G( s)
Y ( s) U ( s)
s 1
K
s 1
(1.130)
La forma de su respuesta en frecuencia dependerá de la posición relativa del polo s=-1/ con respecto al cero s=-1/ , es decir de los valores de las constantes de tiempo características y . Si > , con > 0 y > 0, el cero se encuentra a la izquierda del polo y ambos se encuentran en el semiplano izquierdo del plano s, al sistema se le denomina controlador, red o compensador de retraso de fase. En este caso si se representa el diagrama de Bode (ver
Figura 1.25) se puede observar que la magnitud presenta un valor constante a baja frecuencia y otro valor constante a alta frecuencia. La transición entre ambos valores se realiza con una pendiente -20 dB/década entre =1/ y =1/. Si < , con > 0 y > 0, el cero se encuentra a la derecha del polo y ambos se encuentran en el semiplano izquierdo del plano s, al sistema se le denomina controlador, red o compensador de adelanto de fase . En este caso si se representa el diagrama de Bode
(ver Figura 1.25) se puede observar que la magnitud presenta un valor constante a baja frecuencia y otro valor constante a alta frecuencia. La transición entre ambos valores se realiza con una pendiente 20 dB/década entre =1/ y =1/. Si el cero o/y el polo se encuentran en el semiplano derecho del plano complejo, se tiene un sistema de fase no mínima. En este caso la magnitud será similar a la explicada en los párrafos anteriores, pero la fase cambiará en función de la posición del polo y/o del cero en el semiplano derecho del plano complejo, así como de sus posición relativa. Se pueden llegar a introducir desfases de hasta 360º en función del cero.
1-62
Identificación de sistemas
Figura 1.25. Diagrama de Bode de un sistema de primer orden con cero en función de la posición relativa del cero y el polo [Guzman et al., 2012]
1.5.13 Efecto de un cero en la respuesta frecuencial de un sist ema de segundo orden El cero aporta una pendiente de 20 dB/década a partir de su frecuencia esquina 1/ y una fase que va de 0º a 90º. Por lo tanto debido al carácter aditivo de las gráficas logarítmicas de Bode, la respuesta en frecuencia cambiará su perfil en función de la posición relativa entre el cero y los polos del sistema.
1-63
TEMA 1: Modelos de sistemas continuos y discretos
BIBLIOGRAFÍA [Aström, K. J. y Wittenmark, 1984]
K. J. Aström, y B. Wittenmark. Computer Controlled Systems . Prentice-Hall, 1984.
[D’Azzo y Houpis, 1981]
J. J. D’Azzo, y C. H. Houpis. Linear control system analysis and design . McGraw-Hill. 1981.
[Dorf y Bishop, 2005]
R. C. Dorf, y R. H. Bishop. Sistemas de control moderno . 10ª Edición. Pearson- Prentice Hall. 2005.
[Dormido, 2004]
S. Dormido. Apuntes de la asignatura Control Digital. UNED 2004.
[Guzman et al., 2012]
J. L. Guzmán, R. Costa, M. Berenguel y S. Dormido. Control automático con herramientas interactivas. Pearson-UNED. 2012.
[Ogata, 1996]
K. Ogata. Sistemas de Control en Tiempo Discreto . Prentice Hall.1996.
[Ogata, 1998]
1-64
K. Ogata. Ingeniería de Control Moderna . Prentice Hall.1998.
TEMA 2
MODELOS DE PERTURBACIONES
2.1 INTRODUCCIÓN Una perturbación es una señal externa que afecta al comportamiento del sistema y cuyo valor no puede ser elegido o controlado, como por ejemplo el ruido que afecta a los sensores de medida o las ráfagas de viento y las turbulencias que afectan al vuelo de un avión. En consecuencia si se quiere disponer de un modelo realista de un sistema se hace necesario modelar también las perturbaciones que le afectan. La construcción de modelos para las perturbaciones de un sistema depende en gran medida de si se conoce la fuente o fuentes que originan las perturbaciones y de si son medibles o no. En el mejor de los casos las perturbaciones w(t) que afectan al sistema son perturbaciones medibles de origen conocido. Por ejemplo, en un panel solar la intensidad del sol en un determinado instante de tiempo es una señal de perturbación ya que su valor no puede ser elegido o controlado. Sin embargo, es perfectamente medible y su origen es conocido. Para este tipo de perturbaciones es posible construir modelos a partir de medición directa. En estos casos se pueden obtener modelos continuos del sistema de la forma:
x (t ) f ( x(t ), u(t ), w(t )) y(t ) h( x(t ), u(t ), w(t )) O modelos discretos
f ( xk , uk , wk ) y k h( x k , uk , wk )
xk 1
2-1
TEMA 2: Modelos de perturbaciones
Por otra parte una situación bastante común es que al examinar las variables de un sistema se observa que el comportamiento de las mismas se desvía del teóricamente previsto. Esta desviación es producida por perturbaciones de origen conocido (por ejemplo, el ruido de un sensor) o desconocido que no pueden ser medidas de forma directa. En consecuencia la presencia de estas perturbaciones se detecta debido a que influyen sobre otras variables del sistema que sí pueden ser medidas. Una forma bastante común de tratar estas perturbaciones no medibles es agruparlas en un término de perturbación w(t) que se añade a la salida del sistema y(t):
y (t ) z(t ) w(t ) donde z(t) es la salida sin perturbar. Se tiene por tanto el sistema que se muestra en la Figura 2.1. w(t) u(t)
z(t) Sistema
+
y(t)
Figura 2.1: Sistema con perturbación añadida a la salida
Las perturbaciones w(t) pueden ser modeladas como señales deterministas o como señales aleatorias (procesos estocásticos). Usualmente las entradas u(t) del sistema son señales deterministas por lo que si w(t) es una señal determinista entonces la salida y(t) también será determinista. Por el contrario si w(t) es un proceso estocástico entonces la salida y(t) también será un proceso estocástico. Este tema está dedicado al estudio de los posibles modelos que se pueden utilizar para las perturbaciones que afectan a un sistema. En primer lugar se realiza una clasificación de las perturbaciones atendiendo a su carácter. En segundo lugar se comenta cómo es posible reducir los efectos de las perturbaciones. En tercer lugar se describen los modelos deterministas de las perturbaciones. En cuarto lugar se incluyen los conceptos básicos de la teoría de procesos estocásticos. En quinto lugar se definen y caracterizan los modelos de procesos estocásticos. Dichos modelos resultan útiles para describir tanto a las perturbaciones como a las salidas del sistema. La parte final del tema se dedica al filtrado de procesos estocásticos estacionarios y a la factorización espectral.
2-2
Identificación de sistemas
2.2 CARÁCTER DE LAS PERTURBACIONES Comúnmente, atendiendo a su carácter, se distinguen tres tipos diferentes de perturbaciones:
Perturbaciones en la carga. Este tipo de perturbaciones influyen sobre las variables del proceso. En general este tipo de perturbaciones varían lentamente, y pueden ser periódicas. En sistemas mecánicos las perturbaciones en la carga se representan por fuerzas de perturbación, por ejemplo las ráfagas de viento sobre una antena estabilizada, las olas sobre un barco, la carga en un motor. En sistemas térmicos las perturbaciones en la carga podrían ser variaciones en la temperatura del medio ambiente.
Errores de medida. Este tipo de perturbaciones se introducen en los sensores de medida. Pueden existir errores estacionarios en algunos sensores debido a errores de calibración. Sin embargo, los errores de medida típicamente poseen componentes de alta frecuencia. Estos errores pueden poseer una cierta dinámica debido a la dinámica de los sensores. Un ejemplo típico es el termopar, que posee una contante de tiempo de entre 10 y 50 s dependiendo de su encapsulado. Por otra parte, pueden existir complicadas interacciones dinámicas entre los sensores y el proceso. Un ejemplo típico son las medidas de los giróscopos y las medidas del nivel de líquido en los reactores nucleares. En algunos casos no es posible medir la variable controlada directamente, entonces su valor es deducido a partir de las medidas de otras variables. La relación existente entre estas variables y la variable controlada puede ser bastante compleja. Una situación muy común es que un instrumento dé una rápida indicación con errores bastante grandes y otro instrumento dé una medida muy precisa pero a costa de un alto retardo.
Variaciones en los parámetros. Cuando se consideran sistemas lineales, la perturbación en la carga y el ruido de medida se introducen en el sistema de una forma aditiva. Los sistemas reales son, en la mayoría de los casos, no lineales, esto significa que las perturbaciones se introducirán en el sistema de una forma mucho más complicada. Puesto que los sistemas lineales son obtenidos mediante linealización de modelos no lineales, algunas perturbaciones aparecen entonces como variaciones en los parámetros del modelo lineal.
2-3
TEMA 2: Modelos de perturbaciones
2.3 REDUCCION DE LOS EFECTOS DE LAS PERTURBACIONES Las perturbaciones pueden ser reducidas actuando sobre su fuente, usando realimentación local o usando feedforward. Por otra parte técnicas de predicción pueden ser usadas para estimar perturbaciones no medibles.
2.3.1 Reducción en la fuente La forma más obvia de reducir los efectos de las perturbaciones es intentar actuar sobre la fuente que origina dichas perturbaciones. Esta aproximación está estrechamente ligada a la etapa de diseño del proceso. Algunos ejemplos típicos son:
Reducir las fuerzas de fricción en un servo usando cojinetes mejores. Ubicar un sensor en una posición donde las perturbaciones sean más pequeñas. Modificar la electrónica del sensor para que se vea afectado por menos ruido. Sustituir un sensor por otro que posea una respuesta más rápida. Cambiar el periodo de muestreo para obtener una representación mejor de las características de los procesos.
2.3.2 Reducción mediante realimentación l ocal Si las perturbaciones no se pueden atenuar en su fuente, se puede intentar entonces su reducción mediante realimentación local (ver Figura 2.2). Para usar esta aproximación es necesario que las perturbaciones se introduzcan en el sistema en una o varias posiciones bien definidas. También es necesario tener acceso a la variable medida que es resultado de la perturbación. Además es necesario tener acceso a la variable de control que entra al sistema en la vecindad de la perturbación. Las dinámicas que relacionan la variable medida con la variable de control deberían ser tales que se pueda utilizar un lazo de control de ganancia elevada. El uso de la realimentación es a menudo fácil y efectivo ya que no es necesario tener información detallada de las características de los procesos, siempre que una alta ganancia pueda ser utilizada en el lazo. En caso contrario, se necesitará un lazo extra de realimentación. Algunos ejemplos de realimentación local son:
En sistemas hidráulicos, la reducción en las variaciones en el suministro de presión en válvulas, instrumentos y reguladores mediante el uso de un regulador de presión.
2-4
Identificación de sistemas
térmicos, la reducción reducción de las variaciones en el control control de temperatura temperatura En sistemas térmicos, mediante la estabilización del suministro de voltaje. Perturbación
u
A
y
B
+
+
Realimentación local Pr oceso
Figura 2.2: Reducción de perturbaciones mediante el uso de realimentación local. La perturbación se introduce en el sistema entre los puntos A y B. Las dinámicas entre estos dos puntos deben ser tales que sea posible usar una alta ganancia en el lazo.
2.3.3 Reducción mediante feedforward Las perturbaciones que sean medibles pueden ser reducidas usando una estructura de tipo feedforward tipo feedforward.. El principio genérico de esta estructura se ilustra en la Figura 2.3. Se mide la perturbación y se aplica al sistema una señal de control que intenta contrarrestarla.
Perturbaci ón medida
Hw
Hff y
u
+
Hp
+ Pr oceso
Figura 2.3: Reducción de perturbaciones mediante el uso de una estructura feedforward
Si la funciones de transferencia que relacionan la salida y a la perturbación w y al control u son Hw y Hp, respectivamente, entonces la función de transferencia Hff del compensador compensador feedforward idealmente sería:
H ff
H p1 ·H w
2-5
TEMA 2: Modelos de perturbaciones
Si la función de transferencia Hff es inestable o no realizable (mayor número de ceros que de polos) se debe seleccionar alguna aproximación adecuada. El diseño de un compensador feedforward se basa a menudo en un simple modelo estático, es decir, Hff es una ganancia. La estructura feedforward es especialmente útil para perturbaciones generadas por cambios en la señal de referencia.
2.3. 2.3.4 4 Reducc Reducción ión mediante predicc ión La reducción de perturbaciones mediante predicción es una extensión de la técnica de feedforward que puede utilizarse cuando las perturbaciones no pueden ser medidas. Consiste en predecir la perturbación a partir de la medida de señales. La señal de feedforward se genera a partir de la perturbación predicha. Es importante observar que no es necesario predecir la propia perturbación en si misma sino que es suficiente con modelar una señal que represente el efecto de la perturbación sobre las variables del proceso más importantes.
2.4 MODELOS DETERMINISTAS DETERMINISTAS DE LAS LA S PERTURBACIONES PERTURBA CIONES En algunas ocasiones una perturbación se puede modelar como una señal temporal determinista. Entre las señales más frecuentemente utilizadas para representar a una perturbación (ver Figura 2.4) se encuentran:
El impulso y el pulso. pulso . Son realizaciones realizaciones simples de perturbaciones perturbaciones inesperadas de duración muy corta. Pueden representar tanto a perturbaciones en la carga como a errores de medida. Para sistemas continuos la perturbación es modelada como un impulso:
si t 0 u w (t ) (t ) 0 si t 0 Para sistemas discretos se modela como un pulso con amplitud unidad y una duración de un periodo de muestreo.
u wk
1 k 0
si k 0 si k 0
El pulso y el impulso son también importantes por motivos teóricos ya que la respuesta de un sistema lineal continuo en el tiempo está completamente
2-6
Identificación de sistemas
especificada por su respuesta a un impulso, mientras que la de un sistema discreto está determinada por su respuesta a un pulso.
El escalón. escalón. Se usa típicamente t ípicamente para representar representar una perturbación en la carga o un offset en una medida. Tiene la siguiente definición en tiempo continuo
1 t 0 0 t 0
u w (t )
La rampa. rampa. Es una señal que se utiliza para representar la deriva en los errores de medida así como a perturbaciones que de repente comienzan a desplazarse. En la práctica estas perturbaciones se encuentran acotadas, sin embargo el uso de una señal rampa suele ser una útil idealización. Tiene la siguiente definición en tiempo continuo
t t 0 0 t 0
y (t )
La sinusoide. sinusoide . Es el prototipo de una perturbación periódica. La posibilidad de seleccionar su frecuencia la hace idónea para representar tanto a las perturbaciones en la carga (de baja frecuencia) como al ruido de medida (de alta frecuencia). Tiene la siguiente definición en tiempo continuo
A·sen( ·t ) t 0 t 0 0
y(t )
Pulso
Escalón
Rampa
Sinusoide
Figura 2.4: Modelos deterministas de perturbaciones
2-7
TEMA 2: Modelos de perturbaciones
2.5 CONCEPTOS BÁSICOS B ÁSICOS DE LA L A TEORÍA DE PROCESOS ESTOCÁSTICOS Si las perturbaciones que afectan a un sistema tienen un carácter aleatorio, entonces deben ser modeladas usando modelos de procesos estocásticos o aleatorios. En esta sección se incluyen los conceptos básicos de la teoría de procesos estocásticos.
2.5. 2.5.1 1 Vari Variables ables aleator aleatorias ias Una variable aleatoria x(k) es una variable que puede tomar valores aleatorios en función de los resultados de algún experimento aleatorio. Es decir, los resultados aleatorios de un experimento se pueden representar por un número real x(k), llamado variable aleatoria. Para un experimento aleatorio, los posibles resultados se denominan espacio de muestra. muestra. Una variable aleatoria x(k) es una función definida para los k puntos del espacio de muestra, que toma valores reales en el rango [- ,+] asociados a cada uno de los k puntos que pueden ocurrir. La forma de especificar la probabilidad con que la variable aleatoria toma diferentes valores es mediante la función de distribución de probabilidad F(x), definida de la siguiente forma: F ( x )
P ( x ( k ) x )
Es decir, es la probabilidad de que la variable aleatoria x(k) tome valores menores o iguales a x. La función de distribución de probabilidad cumple las siguientes propiedades:
F (b ) F ( ) 0 F ( ) 1 F ( a )
si a
b
Si la variable aleatoria tiene un rango continuo de valores, entonces se puede definir la función densidad de probabilidad probabilidad f (x):
P x x(k ) x x x 0 x
f ( x) lim Se verifica que:
2-8
Identificación de sistemas
f ( x) 0
f ( x)dx 1
f ( x)
dF ( x) dx
La probabilidad de que x(k) tome un valor entre x y x+dx es dx es f (x)·dx. )· dx. En el caso de que x(k) tome valores discretos xi con probabilidades probabilidades pi distintas de cero, entonces la función f (x) se puede expresar como una serie de funciones de Dirac
por las
probabilidades probabilidades correspondientes: correspondientes:
f ( x)
p · ( x x ) i
i
i
Si se conoce la función de distribución de probabilidad o la función de densidad de probabilidad de una variable aleatoria x(k) es posible calcular la probabilidad de que la variable aleatoria tome un valor comprendido en un rango [x 1,x2]. En ocasiones no es posible determinar estas funciones exactamente, sin embargo es posible caracterizar la distribución de probabilidad mediante mediante el valor medio y la varianza de la variable aleatoria. El valor medio de una variable aleatoria escalar x(k), también denominado valor esperado o esperado o primer momento se momento se define de la siguiente forma:
E x(k) x
x· f ( x )dx
(2.1)
El valor medio es el centro de gravedad de la función de densidad de probabilidad de la variable aleatoria x. El valor cuadrático medio o medio o segundo momento de momento de x(k) se obtiene mediante la expresión
Ex (k) 2
2 x
x f ( x)dx 2
(2.2)
Si x no es un escalar entonces
2-9
TEMA 2: Modelos de perturbaciones
Ex(k)·x (k) T
x(k)·xT (k) f ( x)dx
2 x
Un parámetro que se utiliza en lugar del valor cuadrático medio es la raíz cuadrada positiva del mismo, conocido por su terminología anglosajona como rms de “root-mean squared”. squared”. La varianza de la variable aleatoria x(k) se define como
Var[x(k)]=E (x(k)-x )
2
(x(k)-x )2 f ( x)dx 2x x2 2 x
(2.3)
Si x no es un escalar:
E (x(k) - x ) (x(k) - x )
T
(x(k) - x )·(x(k) - x ) T f ( x )dx x2 x2
2 x
La raíz cuadrada de la varianza,
x, es por definición la desviación estándar de la
variable aleatoria. Si el valor medio es nulo, entonces la desviación estándar coincide con el valor rms. rms. La varianza es una medida de la variabilidad o dispersión del valor de la variable aleatoria con respecto a su valor medio. En consecuencia describe la extensión de la función de densidad de probabilidad de la variable aleatoria.
Ejemplo 2.1: Distribución Gaussiana o Normal Una variable aleatoria x(k) tiene una distribución gaussiana o normal normal (ver Figura 2.5) si su función densidad de probabilidad está dada por la siguiente expresión:
f ( x )
1 2 ·b
( x a ) 2
e
2b2
Se puede comprobar que a y b se corresponden con el valor medio y la desviación estándar de la variable aleatoria x(k)
x
E [ x(k )]
xf ( x)dx a
2 x
E [( x(k ) a) ] ( x a) 2 f ( x)dx b 2 2
2-10
Identificación de sistemas
2
Una notación bastante extendida para denotar a una distribución normal de media y varianza , es 2
N(, ). Así una distribución normal con media cero y varianza unidad se denotará como N(0,1). Por otra parte, como ocurre con cualquier función de densidad de probabilidad su integral o área en el rango (-.,) es igual a 1. Es decir que la probabilidad de que una variable aleatoria tome valores comprendidos entre (-.,) es del 100%. Considerando la función error que se define como:
erf ( x )
2
( 1) n · x 2 n1 n 0 n !·(2n 1)
x
e
t 2
2
·dt
0
es posible calcular que la probabilidad de que una variable aleatoria con distribución normal tome un valor comprendido entre
3· es del 99.7%. Mientras que la probabilidad de que tome un valor
comprendido entre 2· es del 95.4% y entre es del 68.3%.
0.3
0.25
x 0.3989 /0.2
0.15
0.2420 / x 0.1
0.05400.05 / x
0
0
1
2
3
x 2· x
4
x
5 x
x
x
6
x
7
x
8
2· x
9
10
Figura 2.5: Función densidad de probabilidad normal o gaussiana
La consideración simultánea de más de una variable aleatoria es a menudo necesaria y útil. En el caso de tener dos variables aleatorias x(k) e y(k), la probabilidad de que se den
2-11
TEMA 2: Modelos de perturbaciones
pares de valores en un determinado rango de valores está dada por la función de distribución de probabilidad conjunta F2(x, y).
F 2 ( x, y ) P x( k ) x & y (k ) y La correspondiente función de densidad de probabilidad conjunta se define como:
P x x(k ) x x& P y y ( k ) y y x 0 x y y 0
f 2 ( x, y ) lim
que verifica las siguientes propiedades:
f 2 ( x, y ) 0
2 F 2 ( x, y) f 2 ( x, y ) x y
f ( x, y)dxdy 1 2
Sean f x y f y las funciones de densidad de probabilidad de las variables aleatorias x(k) e y(k), si se verifica que
f 2 ( x, y ) f x ( x)· f y ( y ) entonces las dos variables son estadísticamente independientes. Es decir, el suceso x(k) x es independiente del suceso y(k) y. Una medida de la dependencia líneal de dos variables aleatorias x(k) e y(k) viene dada por la covarianza que se define de la siguiente forma:
Cov[x(k),y(k)] rxy
E (x(k)-x )(y(k)- y )
(x- )(y- ) f ( x, y)dxdy x
y
2
(2.4)
Que se puede expresar de forma equivalente como: E (x(k) - x )(y(k) - y )
E x(k)y(k) - x y(k) x(k) y x y Ex(k)y(k) Ex(k) ·Ey(k)
La covarianza cumple las siguientes propiedades:
2-12
Identificación de sistemas
Cov[x(k),y(k)]=Cov[y(k),x(k)] Cov[x(k),x(k)] Var[x(k)] Por otra parte si x(k) e y(k) son estadísticamente independientes entonces
Cov[x(k),y(k)]=E (x(k)-x )(y(k)-y ) E x(k)-x ·E y(k)- y 0 Para simplificar el estudio de la covarianza, ésta se suele normalizar dividiéndola por las desviación estándar de cada variable. A la covarianza normalizada se le denomina coeficiente de correlación:
xy
r xy
x y
(2.5)
Se verifica que
1 xy 1 El coeficiente de correlación proporciona una medida del grado de dependencia lineal entre las variables aleatorias x(k) e y(k). Si x(k) e y(k) son independientes entre si entonces
xy=0, y se dice que las variables aleatorias x(k) e y(k) no están correlacionadas. Si la distribución de probabilidad conjunta es normal y independientes. Si la distribución no es normal y
xy=0 entonces x(k) e y(k) son
xy=0 entonces x(k) e y(k) no están
correlacionados aunque no necesariamente son independientes. Si xy=1 entonces
y (k ) a b· x( k ) Mientras que si
xy=-1 entonces y (k ) a b· x( k )
Conforme
xy se acerca al valor 1 los valores de y(k) con respecto a x(k) se van
concentrando en las cercanías de una línea recta de pendiente positiva. Mientras que conforme
xy se acerca al valor -1 los valores de y(k) con respecto a x(k) se van
concentrando en las cercanías de una línea recta de pendiente negativa.
2-13
TEMA 2: Modelos de perturbaciones
2.5.2 Procesos estocásticos 2.5.2.1 Definiciones
Un proceso aleatorio o estocástico (señal aleatoria) se puede considerar como un conjunto de funciones o series temporales (ver Figura 2.6), cada una de las cuales se puede observar en el ensayo de un experimento. El conjunto puede incluir un número finito, un número infinito contable o un número infinito incontable de tales funciones. Al conjunto de tales funciones se les representa por:
x(t ), t T x(t , h) Usualmente se supone que t es el tiempo y T. Si se considera sistemas discretos entonces T es el conjunto de instantes de muestreo T={0,k,2·k,...} siendo k el periodo de muestreo. En el caso de procesos estocásticos continuos T es un conjunto de variables reales. Para un h fijo, h=h0, se tiene que x(t, h0) es una función del tiempo que se denomina realización. Mientras que para un instante de tiempo fijo, t=t0, se tiene que x(t0,h)=x(t0) es una variable aleatoria. Realizaciones
x(t , h ) Variables aleatorias x (t 1 )
x(t 2 )
x(t , h1 ) x(t , h2 )
x(t , h3 ) t
Figura 2.6: Tres realizaciones x(t, h 1), x(t, h2) y x(t, h3) de un mismo proceso estocástico x(t, h). Se detallan las variables aleatorias x(t 1) y x(t2) que se obtienen cuando se fija el tiempo a t=t 1 y t=t2
Los valores de un proceso aleatorio en n instantes de tiempo distintos constituyen n variables aleatorias. La función de distribución de probabilidad n-dimensional del proceso aleatorio de define como
F ( 1 ,..., n ; t 1 ,..., t n ) P{ x(t 1 ) 1 ,... x(t n ) n }
2-14
Identificación de sistemas
Un proceso aleatorio se denomina Gausiano o normal si todas las distribuciones de dimensión finita son normales. Para n=1 la función de distribución de probabilidad es:
F ( , t ) P[ x( t ) ] La función de densidad de probabilidad correspondiente se define
f ( , t )
dF ( , t ) d
La función valor medio de un proceso aleatorio x se define como:
(t) E x(t)
· f ( , t )d
(2.6)
La función varianza de un proceso aleatorio x se define como:
2
T T (t) Var[x(t)]=E x (t ) (t ) x (t ) (t ) (t ) (t ) ·f ( ,t )d (2.7)
La varianza da información del tamaño de las fluctuaciones del proceso con respecto a su valor medio. A la raíz cuadrada de la varianza se le denomina desviación estándar . Nótese que tanto el valor medio como la varianza son funciones del tiempo. La función de covarianza de un proceso aleatorio x se define como:
xx t1 , t2 cov x( t1 ), x( t2 ) E x (t1 ) (t1 ) x (t 2 ) (t 2 )
1 (t1 ) 2 (t2 ) · f ( 1, 2 ; t1, t 2 )d 1·d 2 T
T
(2.8)
La función de covarianza cruzada de dos procesos aleatorios x e y se puede definir de forma similar a la función de covarianza:
xy t1 , t2 cov x(t1 ), y (t2 ) E x(t1 ) x (t1 ) y(t 2 ) y (t 2 )
T
(2.9)
Un proceso aleatorio o estocástico se denomina estacionario si su distribución de probabilidad n-dimensional para x(t1), x(t2),..., x(tn) es idéntica a la distribución de x(t1+),
2-15
TEMA 2: Modelos de perturbaciones
x(t2+),..., x(tn+) para todo , n, t1,..., tn. La función valor medio de un proceso aleatorio estacionario es constante. La función de covarianza o autocovarianza de un proceso aleatorio estacionario es función del desplazamiento o retraso (lag) considerado:
x xx cov x(t1 ), x (t1 ) cov x (t ), x (t )
(2.10)
Nótese que el valor de la función de covarianza en el origen x 0 es la varianza del proceso. La función de covarianza cruzada de procesos aleatorios estacionarios también es función de :
xy cov x( t ), y ( t ) E[( x (t ) x )( y (t ) y )]
(2.11)
Se cumple que
xy yx Si la función de covarianza o autocovarianza es normaliza por x 0 se obtiene la función de correlación o autocorrelación, que se define de la siguiente forma:
x ( )
x x 0
x x2
(2.12)
Aplicando la desigualdad de Schwartz
r x
r x 0
se obtiene que
x ( )
1
Es decir, la magnitud de la función de correlación es menor que la unidad. El valor de
x() da idea de la magnitud de la correlación existente entre dos puntos del
proceso distanciados unidades de tiempo. Valores de
x() cercanos a uno significan que
existe una fuerte correlación positiva. Mientras que valores de
x() cercanos a menos uno
significan que existe una fuerte correlación negativa. Asimismo, si correlación.
2-16
x()=0 entonces no existe
Identificación de sistemas
De forma análoga puede definirse la función de correlación cruzada entre dos procesos x e y:
xy
xy ( )
x 0· y 0
xy x · y
(2.13)
que cumple las siguientes propiedades:
xy ( )
1
xy ( ) yx ( ) Si xy ( ) yx ( ) 0 entonces no existe correlación cruzada entre los procesos x e y, se dice entonces que los procesos no están correlacionados o que son estadísticamente independientes. La función de densidad espectral o espectro de potencia de un proceso aleatorio estacionario permite conocer la distribución en frecuencia del proceso, se define como la transformada de Fourier de su función de covarianza
xx ( )
1 ik xx ( k )e 2 k
(2.14)
Si se toma la transforma inversa de Fourier del espectro de potencia del proceso se obtendría la función de covarianza del proceso
xx ( k )
e
xx ( )d
ik
(2.15)
La densidad espectral cruzada de dos procesos aleatorios estacionarios x e y se define como la transformada de Fourier de su función de covarianza cruzada:
xy ( )
1
2
xy
(k )e ik
(2.16)
k
Si se toma la transforma inversa de Fourier de densidad espectral cruzada se obtendría la función de covarianza cruzada
2-17
TEMA 2: Modelos de perturbaciones
xy ( k )
e
xy ( )d
ik
(2.17)
En el caso de procesos aleatorios continuos se tiene:
xx ( )
1 it xx (t )e dt 2
xy ( )
1 xy (t )e it dt 2
(2.18)
(2.19)
xx ( )d
(2.20)
xy ( )d
(2.21)
xx ( t )
e
it
xy ( t )
e
it
Un proceso estocástico estacionario puede ser descrito por su valor medio, varianza y función de autocorrelación o función de densidad espectral. Nótese que si se conoce la función de densidad espectral se puede calcular la función de autocorrelación y viceversa.
2.5.2.2 Interpretació n de la func ión de cov arianza y de la densid ad espectral
Los valores de un proceso aleatorio x en n instantes de tiempo {t1, t2,..., tn} distintos constituyen n variables aleatorias x(t1), x(t2),...,x(tn). Supuesto que los n instantes de tiempo están equiespaciados un valor , es decir, ti+1-ti= i=1,...,n-1 y tomando el instante t1 como origen de referencia, entonces las n variables aleatorias se pueden denotar como x(0), x(),x(2),...,x((n-1)· ). Obsérvese que si se tomase t2 como origen entonces las variables aleatorias se denotarían como x(-),x(0),...,x((n-2)· ). En el caso de un proceso estocástico estacionario, se puede tomar cualquier instante como origen. La función de covarianza o autocovarianza de un proceso estocástico permite analizar la relación que existen entre los valores o variables aleatorias de dicho proceso. Es decir, como influye el valor de un proceso en un instante de tiempo en el valor de dicho proceso en los restantes instantes de tiempo, o equivalentemente como influye una variable aleatoria del proceso en las restantes variables aleatorias de dicho proceso. En consecuencia, analizar la forma de la función de covarianza aporta información sobre las interdependencias temporales del proceso (ver Figura 2.7).
2-18
Identificación de sistemas
La covarianza describe la relación entre las variables aleatorias de un mismo proceso estocástico
x(t )
La covarianza cruzada describe la relación entre las variables aleatorias de dos procesos estocásticos distintos
y (t )
t 1
t 2
t
Figura 2.7: Realizaciones de dos procesos estocásticos distintos x(t) e y(t). Se detallan las variables aleatorias x(t1), x(t2), y(t1) e y(t2) que se obtienen cuando se fija el tiempo a t=t 1 y t=t2
El significado de la función de covarianza cruzada es similar al de la función de covarianza pero extendido al caso de dos procesos estocásticos x e y. Es decir, permite analizar las interdependencias temporales existentes entre ambos procesos (ver Figura 2.7). El valor de la función de covarianza de un proceso estacionario en el origen x 0 es la varianza del proceso, que indica cómo de grandes son las fluctuaciones del proceso con respecto a su valor medio. La desviación estándar de las variaciones es igual a la raíz cuadrada de x 0 . La función de densidad espectral o espectro de potencia de un proceso aleatorio estacionario permite conocer la distribución en frecuencia del proceso. La presencia de picos en el espectro suelen indicar la existencia de frecuencias o armónicos dominantes. La integral
2
2
1
xx d
(2.22)
representa la potencia de la señal en el rango de frecuencias [ 1, encerrada por la curva de la densidad espectral en [ 1,
2]. Por tanto, el área
2] representa la potencia de la
señal en una cierta banda de frecuencia. Dicha área total es proporcional a la varianza de señal. Dos señales o procesos aleatorios x e y se dice que no están correlacionados si su densidad de potencia cruzada
xy es 0. 2-19
TEMA 2: Modelos de perturbaciones
2.5.2.3 Estim ación del valor medio, covarianza y densidad espectr al
Usualmente se suele disponer de N valores muestreados de una cierta realización de un proceso aleatorio estacionario x(t), en dicho caso la función valor medio, la función de covarianza o autocovarianza y la función de autocorrelación se estiman a través de las siguientes expresiones (también es habitual usar el símbolo k en lugar de
para referirse al
desplazamiento o retardo (lag)):
x
c xx ( ) ˆxx ( )
1
1
N
x(t )
(2.23)
N t 1 N
N
( x(t ) x )·( x (t ) x )
(2.24)
t 1
r xx ( ) ˆ xx ( )
c xx ( ) c xx (0)
(2.25)
Asimismo si también se dispone de N valores muestreados de otro proceso aleatorio estacionario y(t), la función de covarianza cruzada y la función de correlación cruzada entre x e y se estima con las siguientes expresiones:
1 N N ( x(t ) x )·( y (t ) y ) t 1 c xy ( ) ˆ xy ( ) N 1 ( y (t ) y )·( x (t ) x ) N t 1 r xy ( ) ˆ xy ( )
c xy ( )
0,1, 2...
(2.26)
1, 2,...
(2.27)
c xx (0)· c yy (0)
Por último la función densidad espectral o espectro de potencia se estima con la siguiente expresión:
ˆ x ( )
M
c ( )·W x
M
( )e i
(2.28)
M
donde WM() se denomina ventana de retardo (lag window) siendo M un entero positivo denominado anchura de la ventana o parámetro de truncación. La ventana de retardo es una función que sirve para enfatizar las componentes de frecuencia más importantes y despreciar las menos relevantes, de esta forma se logra suavizar la forma del espectro de
2-20
Identificación de sistemas
potencia. Una de las ventanas de retardo más utilizadas es la conocida como ventana de Hamming que tiene la siguiente expresión:
1 · ·1 cos W M ( ) 2 M 0
M
M
(2.29)
A las funciones estimadas a partir de N datos en la literatura inglesa también se les denomina con el término sample (muestra), donde este término hace referencia a la muestra de datos observados, así se habla del valor medio de la muestra (sample mean), autocovarianza de la muestra (sample autocovariance), etc.
2.5.2.4 Error de las esti mas
ˆ de una función F asociada a una señal aleatoria obtenida a partir de N La estima F ˆ cuya valores muestreados de una realización de dichas señal posee un cierto error F-F magnitud se encontrará comprendida dentro de un cierto intervalo
(L1 ,L 2 ) con una
probabilidad del P%. En consecuencia el valor real de la función se encontrará dentro del intervalo
ˆ ,F+l ˆ ) (F-l 1 2 con una probabilidad del P %. A dicho intervalo se le denomina intervalo de confianza del P%. Supuesto que la señal aleatoria tiene una distribución de probabilidad normal el intervalo de confianza del P% viene dado por la siguiente expresión:
ˆ n·ˆ , F+ ˆ n· ˆ ) (Fˆ es una estima del error o desviación estándar . En este caso al donde n=1, 2,3, … y ˆ . De intervalo de confianza del P% también se le denomina intervalo de confianza n·
ˆ sería equivalente a un intervalo de acuerdo con el Ejemplo 2.1 un intervalo de confianza 2 ˆ sería equivalente a un intervalo de confianza del 95.4% y un intervalo de confianza 3 confianza del 99.7%.
2-21
TEMA 2: Modelos de perturbaciones
Se puede demostrar [Box and Jenkins, 1976] que si supone que el proceso x(t) es de tipo ruido blanco (ver sección 2.6.1) entonces una estima del error o desviación estándar existente en el estimador de la función de autocorrelación (2.25) viene dada por la siguiente expresión
ˆ
1 N
(2.30)
Asimismo se puede demostrar [Box and Jenkins, 1976] que supuesto que los procesos x(t) e y(t) no están correlacionados y que uno de ellos es ruido blanco entonces una estima del error o desviación estándar del estimador de la función de correlación cruzada (2.27) viene dada por la siguiente expresión:
ˆ
1 N
(2.31)
2.5.2.5 Procesos estoc ástic os no estacion arios
Un proceso estocástico no estacionario se caracteriza porque sus propiedades estadísticas varían con el tiempo. Existen infinitas formas de no estacionaridad, por ejemplo si se consideran únicamente los dos primeros momentos de un proceso estocástico se tendrían las siguientes formas de no estacionaridad: valor medio variable con el tiempo y varianza constante, valor medio constante y varianza variable con el tiempo, y valor medio y varianza variables con el tiempo. El análisis de la representación gráfica de una serie temporal (realización) de un proceso estocástico permite detectar en muchas ocasiones la no estacionaridad del proceso. Si la serie temporal presenta derivas (drifts) y/o tendencias (trends) en su valor medio o/y en su pendiente el proceso será no estacionario.
Ejemplo 2.2 En la Figura 2.8 se representa un ejemplo de una serie temporal que presenta un comportamiento no estacionario en su valor medio (también denominado nivel). Se observa que esta serie presenta tres valores medios o niveles locales los cuales se han representado con rectas de trazo discontinuo. En la Figura 2.9 se representa un ejemplo de una serie temporal que presenta un comportamiento no estacionario en su valor medio y en su pendiente. Se observa que esta serie presenta tres tendencias locales de tipo lineal, las cuales se han representado con rectas de trazo discontinuo
2-22
Identificación de sistemas
Figura 2.8. Ejemplo de serie temporal no estacionario por variación de su valor medio
Figura 2.9. Ejemplo de serie temporal no estacionario por variación de su pendiente
En ocasiones puede ser difícil determinar por inspección visual si una serie temporal está asociada a un proceso estacionario o a un proceso no estacionario. Otro método para determinar la estacionaridad de un proceso es el análisis de la función de autocorrelación estimada. Una condición necesaria pero no suficiente para afirmar que la serie temporal es una realización de un proceso no estacionario es que la función de autocorrelación estimada decrezca muy lentamente. En consecuencia si dicha función decrece rápidamente el proceso es estacionario.
Ejemplo 2.3 En la Figura 2.10 se representa la función de autocorrelación estimada de una cierta serie temporal. Se observa que la autocorrelación decrece muy lentamente por lo que esta serie podría ser una realización de un proceso estocástico no estacionario.
2-23
TEMA 2: Modelos de perturbaciones
Sample Autocorrelation Function (ACF)
0.8 n o i t 0.6 a l e r r o c o 0.4 t u A e l p m 0.2 a S
0
−0.2 0
2
4
6
8
10 Lag
12
14
16
18
20
Figura 2.10.Ejemplo de función de autocorrelación estimada con decrecimiento muy lento
Como se verá en la sección 2.6.5 las series temporales que presentan derivas y/o tendencias pueden ser modeladas por modelos estocásticos no estacionarios de tipo ARIMA. Este tipo de series temporales no estacionarias presentan una cierta homogeneidad y pueden ser convertidas en series estacionarias diferenciándolas d veces, donde d normalmente suele ser 1 o 2.
2.6 MODELOS DE PROCESOS ESTOCÁSTICOS 2.6.1 Ruido blanco Se denomina ruido blanco en tiempo discreto a un proceso estocástico estacionario discreto x(t) cuya función de covarianza es:
2 xx ( ) 0
0 1, 2,...
(2.32)
En la Figura 2.11 se representa r xx() gráficamente. Obsérvese que r xx() es nula para todos los valores de
excepto en el origen ( =0) donde vale 2 que es la varianza del
proceso. Esto significa que el valor del proceso en un instante de tiempo t es independiente (no está correlacionado) de los valores del proceso en otros instantes de tiempo. El proceso estocástico ruido blanco puede por tanto ser considerado como una secuencia de variables aleatorias igualmente distribuidas e independientes.
2-24
Identificación de sistemas
Aplicando (2.14) es fácil obtener que su función de densidad espectral es:
xx
2
2·
(2.33)
Luego un proceso de ruido blanco se caracteriza por tener una densidad espectral constante para todas las frecuencias (ver Figura 2.11). La analogía con las propiedades espectrales de la luz blanca explican el nombre que recibe este proceso estocástico. En el caso del ruido blanco en tiempo continuo aplicando (2.18) sobre la densidad espectral (2.31) se obtiene que su función de covarianza es:
xx (t ) 2· ( )
(2.34)
Donde es la función delta de Dirac:
si 0 ( ) 0 si 0
r xx ( )
2
2
2
-2
-1
0
1
2
Figura 2.11. Representación gráfica de la covarianza y de la densidad espectral del ruido blanco en tiempo discreto
Ejemplo 2.4 En la Figura 2.12 se muestra 1000 muestras de una cierta serie temporal a. Asimismo en la Figura 2.13 se muestra la función de autocorrelación estimada de a. Se observa que la autocorrelación vale 1 en =0, además para 0 la autocorrelación toma valores que se pueden considerar cero ya que se encuentran todos encerrados dentro del nivel de confianza 3 o nivel de confianza del 99.7%. Por lo tanto, la serie temporal a se puede considerar que es una realización de un proceso ruido blanco.
2-25
TEMA 2: Modelos de perturbaciones
4 3 2 1 0 −1 −2 −3 −4 0
100
200
300
400
500 600 Sample Number
700
800
900
1000
16
18
20
Figura 2.12. Serie temporal a
Sample Autocorrelation Function (ACF)
1 n o 0.8 i t a l e r r 0.6 o c o t u A 0.4 e l p m a S 0.2
0 −0.2
0
2
4
6
8
10 Lag
12
14
Figura 2.13. Autocorrelación estimada de la serie temporal a
2-26
Identificación de sistemas
2.6.2 Procesos AR Considérese un proceso estocástico z t, la desviación de este proceso con respecto a un cierto origen, o con respecto a su media
si el proceso es estacionario, es:
zt
zt
(2.35)
Considérese además el proceso de ruido blanco a t con media E[at]=0 y varianza 2
var[at]= a
Si el proceso estocástico zt es generado mediante una ecuación en diferencias de la forma
zt donde
1 zt 1 ... n zt n at
(1 , ..., n ) son parámetros reales, entonces se dice que
(2.36)
zt es un proceso
autoregresivo de orden n o más abreviadamente un proceso AR(n). Considerando el operador retardo q -1 1 q · yt
yt 1
(2.37)
este proceso se puede escribir equivalentemente de la siguiente forma:
1 q
1
1
... n q n zt at
(2.38)
o
( q 1 ) zt at
(2.39)
donde
( q 1 ) 1 1 q 1 ... n q n
(2.40)
Por lo tanto
zt
1 a ( q1 ) t
(2.41)
2-27
TEMA 2: Modelos de perturbaciones
El proceso autoregresivo zt se puede considerar la salida de un filtro con función de transferencia
1 que es excitado con una entrada de ruido blanco. ( q1 )
A la ecuación
( q 1 ) 0 se le denomina ecuación característica del proceso y puede
expresarse de la siguiente forma:
( q 1 ) (1 p1q 1 )(1 p2 q 1 ) (1 pn q 1 ) 0 1
1
1
(2.42)
( q1 ) 0 .
Nótese que las raíces de
( q) qn 1 qn 1 ... n 0
(2.43)
Donde p1 , p2 ,, pn son las raíces de
( q 1 ) 0 son las reciprocas del polinomio
Por
lo
tanto
1 1 1 p1 , p2 ,, pn son
si
p1 , p2 ,, pn son las raíces de
las
raíces
de
( q1 ) 0
entonces
( q) 0 . 1
1
1
Para que el proceso sea estacionario todas las raíces p1 , p2 ,, pn de la ecuación característica
( q1 ) 0 deben encontrarse fuera del círculo unidad. O equivalentemente
las raíces p1 , p2 ,, pn de
( q) 0 deben encontrarse dentro del círculo unidad: pi
1
i 1, 2,..., n
(2.44)
Se puede demostrar [Box and Jenkins, 1976] que la función de autocorrelación de un proceso AR(n) estacionario se puede calcular a partir de la siguiente ecuación en diferencias:
1 1 2 2 ... n n
0
(2.45)
cuya solución general es:
1
1
1
A1 p1 A2 p2 ... An pn
Donde p1 , p2 ,, pn son las raíces de la ecuación característica proceso AR(n).
2-28
(2.46)
( q1 ) 0
del
Identificación de sistemas
Para que el proceso sea estacionario pi
1
i 1, 2,..., n . Con lo que si pi es una raíz
real entonces el término Ai pi tiende a 0 geométricamente cuando aumenta, es decir, se comporta como una exponencial amortiguada. Mientras que si pi y p j son raíces complejas conjugadas entonces contribuyen con un término
D sen(2 f F )
en la función de autocorrelación, que se corresponde con una oscilación sinusoidal amortiguada
2 f
con
factor
de
D pi
amortiguamiento
pj
y
frecuencia
1
cos Re( pi ) / D . En general, un proceso AR(n) estacionario se caracteriza por tener una función de
autocorrelación cuyo valor absoluto va decreciendo conforme aumenta el desplazamiento
como una suma de exponenciales amortiguadas y oscilaciones sinusoidales amortiguadas. Cuanto más alejadas se encuentren las raíces p1 , p2 ,, pn del círculo unidad más 1
1
1
rápido será el decrecimiento, y viceversa, cuanto más próximas se encuentren al círculo unidad más lento será el decrecimiento, es decir, más se acerca a un comportamiento no estacionario.
Ejemplo 2.5 Considérese el proceso AR(1):
xt
xt 1 at
2
Donde at es ruido blanco N (0, a ) . Este proceso es estacionario si
1 1 .
Se puede demostrar que su varianza y su función de autocorrelación son: 2 x
a2
1 2
xx ( )
0
Supóngase que 0.9 y a =1. En la Figura 2.14 se representa una realización de este proceso 2
AR(1). En la Figura 2.15 se representa la función de autocorrelación de este proceso AR(1). Se observa que según aumenta el desplazamiento la autocorrelación disminuye de forma exponencial.
2-29
TEMA 2: Modelos de perturbaciones
8 6 4 2 0 −2 −4 −6 −8 0
100
200
300
400
500 600 Sample Number
700
800
900
1000
18
20
Figura 2.14. Una realización de un proceso AR(1) con 0.9
Theorical Autocorrelation Function 1 0.9 0.8 0.7 0.6 ) τ ( 0.5 ρ
0.4 0.3 0.2 0.1 0 0
2
4
6
8
10 Lag τ
12
14
16
Figura 2.15. Función de autocorrelación de un proceso AR(1) con 0.9 Se va a considerar ahora que 0.9 y a =1. En la Figura 2.16 se representa una realización del 2
proceso AR(1). En la Figura 2.17 se representa la función de autocorrelación de este proceso AR(1). Se observa que según aumenta el desplazamiento disminuye.
2-30
el valor absoluto de la autocorrelación
Identificación de sistemas
8 6 4 2 0 −2 −4 −6 −8 0
100
200
300
400
500 600 Sample Number
700
800
900
1000
18
20
Figura 2.16. Una realización de un proceso AR(1) con 0.9
Theorical Autocorrelation Function 1 0.8 0.6 0.4 0.2 )
τ
(
ρ
0 −0.2 −0.4 −0.6 −0.8 −1 0
2
4
6
8
10 Lag τ
12
14
16
Figura 2.17. Función de autocorrelación de un proceso AR(1) con 0.9
2-31
TEMA 2: Modelos de perturbaciones
2.6.3 Procesos MA Si el proceso estocástico zt (ver sección anterior) es generado mediante una ecuación en diferencias de la forma
zt
at 1 at 1 ... m at m
(2.47)
donde (1 ,..., m ) son parámetros reales, entonces se dice que zt es un proceso de media móvil (moving average) de orden m o más abreviadamente un proceso MA(m). Considerando el operador retardo q -1 este proceso se puede escribir equivalentemente de la siguiente forma:
zt
1 1 q 1 ... m q m at
(2.48)
o
zt
( q 1 )·at
(2.49)
donde
( q 1 ) 1 1 q 1 ... m q m
(2.50)
El proceso de media móvil zt se puede considerar la salida de un filtro con función de transferencia
( q 1 ) que es excitado con una entrada de ruido blanco.
Un proceso MA(m) es siempre estacionario. Además su función de autocorrelación es distinta de cero únicamente en m puntos, sin considerar el lag =0.
Ejemplo 2.6 Considérese el proceso MA(1):
xt
at at 1
2
Donde at es ruido blanco N (0, a ) . Este proceso es siempre estacionario independientemente del valor de Se puede demostrar que su varianza y su función de autocorrelación son:
2-32
Identificación de sistemas
2
x
a2 (1 2 )
1 xx ( ) 2 1 0
0 1 2
Supóngase que 0.9 y a =1. En la Figura 2.18 se representa una realización de este proceso 2
MA(1). En la Figura 2.19 se representa la función de autocorrelación de este proceso MA(1). Se observa que la autocorrelación es nula a partir del desplazamiento =2. Nótese que el orden m=1 de este modelo coincide con el hecho de la autocorrelación es distinta en un único punto (=1) aparte de en =0.
8 6 4 2 0 −2 −4 −6 −8 0
100
200
300
400
500 600 Sample Number
700
800
900
1000
Figura 2.18. Una realización de un proceso MA(1) con 0.9 Theorical Autocorrelation Function 1.5
1
) τ ( 0.5 ρ
0
−0.5
0
2
4
6
8
10 Lag τ
12
14
16
18
20
Figura 2.19. Función de autocorrelación de un proceso MA(1) con 0.9
2-33
TEMA 2: Modelos de perturbaciones
2.6.4 Procesos ARMA Si el proceso estocástico zt (ver sección 2.6.2) es generado mediante una ecuación en diferencias de la forma
1 zt 1 ... n zt n at 1 at 1 ... m at m
zt
(2.51)
entonces se dice que zt es un proceso autoregresivo de media móvil o más abreviadamente un proceso ARMA(n,m). Considerando el operador retardo q -1 este proceso se puede escribir equivalentemente de la siguiente forma:
1 q
1
1
... n q n · zt 1 1 q 1 ... m q m · at
(2.52)
o
( q 1 )· zt ( q 1 )·at
(2.53)
Donde
( q 1 ) 1 1 q 1 ... n q n
(2.54)
( q 1 ) 1 1 q 1 ... m q m
(2.55)
Por lo tanto
zt
( q 1 ) a ( q1 ) t
(2.56)
El proceso de autoregresivo de media móvil zt se puede considerar la salida de un filtro con función de transferencia
( q 1 ) que es excitado con una entrada de ruido blanco. ( q 1 )
Un proceso ARMA(n,m) es estacionario si las raíces de
( q1 ) 0 se encuentran fuera
del círculo unidad. Además se caracteriza por tener una función de autocorrelación con un comportamiento similar al de un proceso AR.
2-34
Identificación de sistemas
Ejemplo 2.7 Considérese el proceso ARMA(1,1):
xt
xt 1 at at 1
2
Donde at es ruido blanco N (0, a ) . Este proceso es estacionario si
1 1 .
Se puede demostrar que su varianza y su función de autocorrelación son:
1 2 2· 2 · a 1 2 2 x
1 (1 )( ) xx ( ) · a2 2 1 · xx ( 1)
0 1 2
Supóngase que 0.5 , 0.9 y a =1. En la Figura 2.20 se representa una realización de este 2
proceso ARMA(1,1). En la Figura 2.21 se representa la función de autocorrelación de este proceso ARMA(1,1). Se observa que según aumenta el desplazamiento la autocorrelación disminuye exponencialmente.
6
4
2
0
−2
−4
−6 0
100
200
300
400
500 600 Sample Number
700
800
900
1000
Figura 2.20. Una realización de un proceso ARMA(1,1) con 0.5 , 0.9
2-35
TEMA 2: Modelos de perturbaciones
Theorical Autocorrelation Function 1 0.9 0.8 0.7 0.6 ) τ ( 0.5 ρ
0.4 0.3 0.2 0.1 0 0
2
4
6
8
10 Lag τ
12
14
16
18
20
Figura 2.21. Función de autocorrelación de un proceso ARMA(1,1) con 0.5 , 0.9
2.6.5 Procesos ARIMA Un proceso estocástico no estacionario posee una función valor medio o/y una función de covarianza que dependen del tiempo. Para conocer las propiedades estacionarias que subyacen en un proceso no estacionario es necesario diferenciarlo una o varias veces. Se define el operador diferenciación
de la siguiente forma:
(1 q1 )
(2.57)
Y el operador diferenciación d-ésima como
d (1 q 1 ) d
(2.58)
Sea zt un proceso estocástico no estacionario y w t el proceso estocástico que se obtiene de diferenciar d veces el proceso z t:
wt
d zt
(2.59)
Se considera que el grado de diferenciación d, necesario para obtener la estacionaridad ha sido alcanzado cuando la función de autocorrelación del proceso w decrece rápidamente o es 0 a partir de un cierto valor del desplazamiento .
2-36
t
Identificación de sistemas
La consideración de este operador permite definir los procesos autoregresivos integrados de media móvil o procesos ARIMA(n,d,m) como aquellos generados por la siguiente ecuación:
( q1 )·d zt ( q 1 )·at
(2.60)
Equivalentemente un proceso ARIMA zt puede considerarse la salida de un filtro con la siguiente función de transferencia que es excitado con una entrada de ruido blanco at :
zt
1 1 q 1 ... m q m ·at (1 q 1 ) d ·(1 1 q 1 ... n q n )
(2.61)
Un proceso ARIMA(n,d,m) es una extensión de un proceso ARMA( n,m) al caso de procesos estocásticos no estacionarios. Obsérvese, de hecho, que si en la ecuación anterior se sustituye zt por zt entonces un proceso ARIMA(n,0,m) es un proceso ARMA(n,m). Nótese también que un proceso ARIMA(0,0,0) es un proceso ruido blanco, un proceso ARIMA(0,0,m) es un proceso MA(m) y que un proceso ARIMA(n,0,0) es un proceso AR(n).
Ejemplo 2.8 El ejemplo más sencillo de proceso aleatorio no estacionario es el denominado como paseo aleatorio (random walk) que se obtiene mediante la siguiente ecuación en diferencias
xt
xt 1 at
2
donde at es ruido blanco N (0, a ) . Si se resuelve la ecuación de diferencias que representa un proceso paseo aleatorio se obtiene la siguiente solución: t
xt
x0 ai i 1
A partir de esta expresión se puede demostrar la varianza y la función de autocorrelación de un proceso paseo aleatorio son:
Var[ xt ] E [( xt
E[ xt ])2 ] t· a2
xx ( ) 1
0
2-37
TEMA 2: Modelos de perturbaciones
2
Supóngase que a =1. En la Figura 2.22 se representa una realización de un proceso paseo aleatorio. Se observa como la serie temporal tiene un comportamiento no estacionario ya que presenta diferentes valores medios o niveles locales. En la Figura 2.23 se representa la función de autocorrelación de este proceso.
10
5
0
−5
−10
−15 0
100
200
300
400
500 600 Sample Number
700
800
900
1000
18
20
Figura 2.22. Una realización de un proceso paseo aleatorio
Theorical Autocorrelation Function
1
0.8 ) τ ( 0.6 ρ
0.4
0.2
0 0
2
4
6
8
10 Lag τ
12
14
16
Figura 2.23. Función de autocorrelación de un proceso paseo aleatorio
La ecuación en diferencias de un proceso paseo aleatorio se puede expresar equivalentemente de la siguiente forma
2-38
Identificación de sistemas
(1 q 1 )· xt
at
De la que se deduce que un proceso paseo aleatorio es un proceso ARIMA(0,1,0). Nótese que la ecuación anterior se puede expresar también en la forma
xt
1 1 q 1
at
Con lo que un proceso paseo aleatorio se puede considerar la salida de un filtro con función de transferencia
1 1 q 1
que es excitado con una entrada de ruido blanco. Esta función de tranferencia
corresponde a la de un integrador en tiempo discreto. Luego un proceso paseo aleatorio se obtiene integrando ruido blanco. Nótese que si se diferenciara una vez la salida de este filtro se eliminarían los efectos de la integración y se obtendría como resultado la entrada del filtro: ruido blanco, que es una señal estacionaria. Es decir, se habría eliminado la no estacionaridad de la serie temporal introducida por el integrador.
2.6.6 Identificación del tipo de modelo estocástico a utili zar a partir de una serie temporal 2.6.6.1 Funció n de autoco rrelación parcial
La función de autocorrelación parcial kk es un instrumento matemático [Box and Jenkins, 1976] que permite determinar junto con la función de autocorrelación qué tipo de proceso estocástico básico (ruido blanco, AR, MA, ARMA o ARIMA) ha podido generar una determinada serie temporal. La función de autocorrelación parcial puede ser estimada ajustando por mínimos cuadrados los datos de la serie temporal a modelos AR( k) de órdenes k crecientes k 1,2,3,... De esta forma el coeficiente k del modelo AR(k) es precisamente el valor estimado ˆkk del coeficiente k de la función de autocorrelación parcial. El error o desviación estándar existente en la función de autocorrelación parcial estimada puede ser estimado a través de la siguiente ecuación [Box and Jenkins, 1976]:
1 ˆ [ ˆkk ] 1/2 N
k
p
(21)
2-39
TEMA 2: Modelos de perturbaciones
bajo la hipótesis de que se tiene una realización de un proceso AR( p). En los procesos estocásticos básicos la función de autocorrelación parcial presenta el siguiente comportamiento:
Ruido blanco. La función de autocorrelación parcial se comporta como la función de autocorrelación del ruido blanco, es decir, tiene un único valor distinto de cero en el lag =0.
AR(p). La función de autocorrelación parcial se comporta como la función de autocorrelación de un proceso MA(p), es decir, todos sus puntos son cero excepto en p además de en =0.
MA(q). La función de autocorrelación parcial se comporta como la función de autocorrelación de un proceso AR(q), es decir, decrece conforme aumenta el número de lags
como una suma de exponenciales amortiguadas y sinusoides
amortiguadas.
ARMA(p,q). La función de autocorrelación parcial se comporta como la función de autocorrelación de un proceso AR(q).
2.6.6.2 Procedimi ento de análisis
Supóngase que se dispone de N datos de una cierta serie temporal y se desea determinar el tipo de modelo estocástico básico que permite generarla, para posteriormente poder estimar sus parámetros (ver Tema 6). Una forma de determinarlo es analizar la representación de la serie temporal, su función de autocorrelación estimada y su función de autocorrelación parcial estimada. En primer lugar mediante el estudio de la representación de la serie temporal y de su función de autocorrelación estimada se debe determinar si la serie es estacionaria o no estacionaria (ver sección 2.5.2.4). Si la serie es no estacionaria entonces debe ser diferenciada el número de veces necesarias hasta conseguir que sea estacionaria. Nótese que el número de veces que se diferencie la serie estará fijando el valor del orden d de un modelo ARIMA(n,d,m). Una vez que ha conseguido que la serie temporal sea estacionaria se debe analizar su función de autocorrelación estimada (AE) y su función de autocorrelación parcial estimada (APE). En dichas funciones se debe dibujar el intervalo de confianza 2 o 3 calculados con
2-40
Identificación de sistemas
la hipótesis de que la serie ha sido generada por un proceso ruido blanco, de tal forma que si un valor de dicha función se encuentra dentro, sobre o ligeramente por encima del intervalo puede considerarse que su valor es nulo bajo dicha hipótesis. Se pueden dar los siguientes casos:
Si la AE tiene todos sus valores dentro del intervalo de confianza, exceptuando el punto en el lag
=0, entonces se puede modelar con un proceso de ruido
blanco.
Si la AE tiene m valores fuera del intervalo de confianza, exceptuando el punto en el lag =0, se puede modelar con un proceso MA(m).
Si el valor absoluto de la AE decrece como una suma de exponenciales amortiguadas y sinosuides amortiguadas conforme aumenta
entonces se
puede modelar con un modelo AR(n) o ARMA(n,m). Para discriminar si se trata de un modelo AR(n) o ARMA(n,m) se debe analizar la APE. Si se tratara de un proceso AR(n) la APE tendría n valores fuera del intervalo de confianza, exceptuando el punto en el lag =0. Con respecto a la elección de los órdenes del modelo se debe tener en cuenta lo siguiente:
La mayoría de series temporales aleatorias se pueden modelar mediante un modelo estocástico de primer o segundo orden. Esto implica que n=1, 2 y m=1, 2
El grado de diferenciación típicamente suele ser d=1 o d=2. Recuérdese que se considera que el grado de diferenciación d, necesario para obtener la estacionaridad ha sido alcanzado cuando la función de autocorrelación estimada de la señal diferenciada decrece rápidamente o se encuentra dentro del intervalo de confianza a partir de un cierto valor del desplazamiento . En este último caso el grado m del modelo ARIMA se determina como los m valores fuera del intervalo de confianza, exceptuando a =0,
Además a la hora de analizar la función de autocorrelación estimada conviene tener presente lo siguiente:
2-41
TEMA 2: Modelos de perturbaciones
Para considerar como válidos los resultados se debe dispone de una serie temporal con un número de muestras N igual o mayor a 50.
Es suficiente con considerar un número de desplazamientos no superior a N/4. En la práctica es suficiente con inspeccionar los primeros 20 desplazamientos:
=1, 2,…,20.
La función de autocorrelación estimada (AE) puede tener una alta varianza, lo que implica que puede diferir de la función de autocorrelación teórica (AT) que se puede calcular directamente si se conoce el modelo estocástico. Por ejemplo, la AE puede tener valores altos cuando en la AT correspondería valores pequeños ya que se estaría atenuando. También la AE puede tener rizados y tendencias que no aparecen en la AT. Para evitar estos problemas se debe disminuir la varianza, lo cual se consigue disponiendo de series temporales de mayor longitud N. Lo mismo se aplica a la función de correlación cruzada estimada.
Ejemplo 2.9 Considérese un cierto sistema 1 que es excitado con una señal de ruido blanco at de tipo N(0,1), la salida del sistema es una señal aleatoria yt. Se dispone de N=1000 datos de la entrada y de la salida. En la Figura 2.24 se representa la salida yt. Se observa que la señal presenta un comportamiento estacionario, por lo que no es necesario diferenciarla. Esta conclusión se comprueba calculando su función de autocorrelación estimada (ver Figura 2.25). Puesto que todos sus valores se encuentran dentro del intervalo de confianza del 99.7%, excepto en =0 y =1, la señal es estacionaria además se podría usar un modelo MA(1) para modelar el sistema. Supóngase que el sistema 1 es excitado con otra señal distinta de ruido blanco et de tipo N(0,1), la salida del sistema es la señal aleatoria zt. En la Figura 2.26 se representa su función de autocorrelación estimada. Se observa que aparte de los puntos =0 y =1 como ya sucedía en la anterior realización, también sobrepasan el intervalo de confianza del 99.7%, los puntos =2 , =10 y
=11. La existencia del punto =2 fuera del intervalo de confianza (o si estuviera muy próximo al límite) podría llevar a pensar en utilizar un modelo MA(2), aunque también podría atribuirse a la varianza existente en la serie temporal y considerar un modelo MA(1). La existencia de los puntos
=10 y =11 fuera del intervalo de confianza debe atribuirse a la varianza existente en la serie temporal.
2-42
Identificación de sistemas
8 6 4 2 0 −2 −4 −6 −8 0
100
200
300
400
500 600 Sample Number
700
800
900
1000
16
18
20
Figura 2.24. Señal aleatoria y t
Sample Autocorrelation Function (ACF) 1
n o i t a 0.5 l e r r o c o t u A e l p m 0 a S
−0.5 0
2
4
6
8
10 Lag
12
14
Figura 2.25. Función de autocorrelación estimada de la señal y t
2-43
TEMA 2: Modelos de perturbaciones
Sample Autocorrelation Function (ACF) 1
n o i t 0.5 a l e r r o c o t u A e l p m 0 a S
−0.5 0
2
4
6
8
10 Lag
12
14
16
18
20
Figura 2.26. Función de autocorrelación estimada la señal z t
En la Figura 2.27 se representa la función de correlación cruzada entre las entradas at e et. Puesto que todos sus valores se encuentran dentro del intervalo de confianza del 99.7% se concluye que no existe correlación entre ambas señales, son estadísticamente independientes. Señalar que aunque en esta ocasión no se ha presentado, dos señales no correlacionadas entre sí pueden presentar una función de correlación cruzada estimada con algunos puntos sobre o ligeramente fuera del intervalo de confianza debido a la varianza de las series.
Sample Cross Correlation Function (XCF) 0.08 0.06 n 0.04 o i t a l e r r 0.02 o C s 0 s o r C e−0.02 l p m a S−0.04
−0.06 −0.08 −20
−15
−10
−5
0 Lag
5
10
15
Figura 2.27. Función de Correlación cruzada estimada entre las señales a t y et.
2-44
20
Identificación de sistemas
Sample Cross Correlation Function (XCF) 0.5
n o i t a l 0 e r r o C s s o r C e l p−0.5 m a S
−1 −20
−15
−10
−5
0 Lag
5
10
15
20
Figura 2.28. Función de Correlación cruzada estimada entre las señales e t y zt.
En la Figura 2.28 se muestra la función de correlación cruzada estimada entre la entrada et y la salida zt. Se observa que todos sus valores se encuentran dentro del intervalo de confianza del 99.7%, excepto en =0 y =1, ello implica que el valor de la salida en un cierto instante t depende del valor de la entrada en dicho instante t y del valor de la entrada en el instante t-1. Con lo que se confirmaría que el modelo MA(1) es el correcto.
Ejemplo 2.10 Considérese un cierto sistema 2 que es excitado con una señal de ruido blanco at, de tipo N(0,1) la salida del sistema es una señal aleatoria zt. Se dispone de N=1000 datos de la entrada y de la salida. En la Figura 2.29 se representa la salida zt. Se observa que la señal presenta un comportamiento no estacionario debido a la existencia de valores medios o niveles locales. Esta conclusión se comprueba calculando su función de autocorrelación estimada (ver Figura 2.30) en la cual se observa un decrecimiento muy lento. Para eliminar la estacionaridad habrá que diferenciar la señal zt d veces. Si diferenciamos una vez la señal zt se obtiene la señal wt:
wt
zt zt 1
En la Figura 2.31 se representa la salida diferenciada wt. Se observa que parece presentar un comportamiento estacionario. Para confirmarlo en la Figura 2.32 se representa su función de
2-45
TEMA 2: Modelos de perturbaciones
autocorrelación estimada. Puesto que la autocorrelación presenta un decrecimiento rápido la salida diferenciada se puede considerar estacionaria y en consecuencia no hace falta diferenciarla más veces. Luego el grado de diferenciación es d=1.
300
200
100
0
−100
−200
−300 0
100
200
300
400
500 600 Sample Number
700
800
900
1000
16
18
20
Figura 2.29. Señal aleatoria z t
Sample Autocorrelation Function (ACF)
0.8 n o i t 0.6 a l e r r o c o 0.4 t u A e l p m 0.2 a S
0
−0.2 0
2
4
6
8
10 Lag
12
14
Figura 2.30. Función de autocorrelación estimada de la señal y t
2-46
Identificación de sistemas
8 6 4 2 0 −2 −4 −6 −8 −10 0
100
200
300
400
500 600 Sample Number
700
800
900
1000
16
18
20
Figura 2.31. Salida diferenciada w t Sample Autocorrelation Function (ACF)
0.8 n o i t a 0.6 l e r r o c o 0.4 t u A e l p m 0.2 a S
0
−0.2 0
2
4
6
8
10 Lag
12
14
Figura 2.32. Función de autocorrelación estimada de la salida diferenciada w t
Figura 2.33. Función de autocorrelación parcial estimada de la salida diferenciada w t
2-47
TEMA 2: Modelos de perturbaciones
Por otra parte, este decrecimiento exponencial de la función de autocorrelación estimada indica que la salida diferenciada wt puede ser generada por un proceso AR(n) o ARMA(n,m). Para discriminar qué tipo de proceso la genera se ha calculado la función de autocorrelación parcial estimada (ver Figura 2.33) Se observa que todos sus valores se encuentran dentro del intervalo de confianza excepto en =0,
=1 y =2, luego se trataría de un proceso AR(2).
En conclusión el sistema 2 podría modelarse como un modelo ARIMA(2,1,0).
2.7 FILTRADO DE PROCESOS ESTOCÁSTICOS ESTACIONARIOS Considérese un sistema dinámico de tiempo discreto estacionario con periodo de muestreo T=1 (ver Figura 2.34) y función de transferencia pulso H(z). Sea la señal de entrada u un proceso estocástico estacionario con media mu y densidad espectral
u. Si el
sistema es estable, entonces la salida y es también un proceso estacionario con media
m y ( k ) H (1)·mu (k )
(2.62)
y densidad espectral
y ( ) H (e i )· u ( )· H T (e i )
(2.63)
Además la densidad espectral cruzada entre la entrada y la salida está dada por la expresión
yu ( ) H (e i · )· u ( )
(2.64)
i
Este resultado tiene una sencilla interpretación física. El número H (e ) es la amplitud en el estado estacionario de la respuesta del sistema a una señal seno de frecuencia
. El
valor de la densidad espectral de la salida es entonces el producto de la ganancia de la i
2
potencia H (e ) y la densidad espectral de la entrada
u
u().
y
H(z) Figura 2.34. Sistema discreto estacionario
2-48
Identificación de sistemas
Por otra parte, la ecuación (2.64) indica que la densidad espectral cruzada es igual a la función de transferencia del sistema si la entrada es ruido blanco con densidad espectral unidad. Este resultado puede ser utilizado para determinar la función de transferencia pulso del sistema. Se va considerar ahora un sistema en tiempo continuo estable invariante en el tiempo con respuesta a impulso g. La relación entre la entrada y la salida de dicho sistema viene dada por:
t
y (t )
g (t s)·u(s)ds g (s)·u(t s)ds
(2.65)
0
Sea la señal de entrada u a un proceso estocástico con función valor medio mu y función de covarianza r u. El siguiente teorema es análogo al Teorema 3.3 enunciado para sistemas en tiempo discreto. Considérese un sistema lineal estacionario con función de transferencia G. Sea la señal de entrada un proceso estocástico estacionario en tiempo continuo con valor medio mu y densidad espectral
u. Si el sistema es estable, entonces la salida es también un proceso
estacionario con valor medio
m y
G (0)·mu
(2.66)
y densidad espectral
y ( ) G (i )· u ( )·G T (i )
(2.67)
La densidad espectral cruzada entre la entrada y la salida está dada por
yu ( ) G (i )· u ( )
(2.68)
Se denomina factorización espectral al problema de obtener el sistema lineal H(z)
H ( z ) K ·
( z z ) B( z) ( z p ) A( z) i
i
estacionario que al ser excitado por ruido blanco de covarianza unidad genera una salida cuya densidad espectral
y(), racional en cos , es conocida de antemano.
2-49
TEMA 2: Modelos de perturbaciones
Como la entrada es ruido blanco su densidad espectral es
u ( )
1 2·
Además como
z e
i
entonces por la ecuación (2.63) se tiene que:
y ( )
1
· H ( z )· H T ( z 1 ) 2·
Teorema de factorización espectral. Dada una densidad espectral función racional en cos
(), que sea una
, existe un sistema lineal con función de transferencia pulso
H ( z )
B( z ) A( z )
(2.69)
tal que la salida que se obtiene, cuando la entrada del sistema es ruido blanco, es un proceso aleatorio estacionario con densidad espectral
. El polinomio A(z) tiene todos sus
ceros dentro del círculo unidad. El polinomio B tiene todos sus ceros dentro del disco unidad o sobre el circulo unidad. De acuerdo con el teorema de factorización espectral es posible generar cualquier proceso aleatorio estacionario con densidad espectral racional como la salida de un sistema lineal estable al cual se le excita con ruido blanco. Por tanto es suficiente con estudiar cómo se comportan los sistemas cuando son excitados por ruido blanco. Todos los otros procesos estacionarios con densidad espectral racional pueden ser generados mediante el filtrado adecuado del ruido blanco.
2-50
Identificación de sistemas
BIBLIOGRAFÍA [Aström and Wittenmark, 1984]
K. J. Aström. Y B. Wittenmark. Computer Controlled Systems. Prentice-Hall, 1984.
[Bendat and Piersol, 1971]
J. S. Bendat y A.G. Piersol. Random Data: Analysis and Measurement Procedures. John Wiley & Sons, 1971.
[Box and Jenkins, 1976]
G. E. P. Box y G. M. Jenkins. Time Series Analysis: Forecasting and Control. Holden-Day. 1976.
[Jenkins and Watts, 1968]
G. M. Jenkins y D. G. Watts. Spectral Analysis and Its Applications. Holden-Day. 1968.
[Rivera, 2007]
D. E. Rivera. Introducción a la Identificación de Sistemas. Curso impartido en el Dpto. de Informática y Automática de la UNED del 17-28 de septiembre de 2007.
2-51
TEMA 3
CONSIDERACIONES GENERALES SOBRE LA IDENTIFICACION DE SISTEMAS
3.1 INTRODUCCIÓN El modelo matemático de un sistema se puede utilizar para calcular o decidir cómo se comporta el sistema. Una posible forma de realizar esto es resolviendo analíticamente las ecuaciones matemáticas que describen el sistema y analizando el resultado. Sin embargo, en muchas ocasiones no es posible encontrar una solución analítica, o ésta es tan complicada que no permite extraer conclusiones claras. En dichos casos las ecuaciones del modelo se deben resolver numéricamente con ayuda de un computador. Éste es precisamente el fundamento de la simulación de sistemas, que permiten realizar experimentos numéricos sobre el modelo de un sistema. Obviamente su principal desventaja es que los resultados de la simulación dependen de la calidad del modelo del sistema utilizado. De forma general los modelos matemáticos se pueden obtener de dos formas distintas:
Modelización matemática . Es un método analítico que usa las leyes físicas (como
las leyes de Newton o las leyes de Kirchoff) para describir la conducta dinámica del proceso. El modelado depende totalmente de la aplicación y a menudo tiene sus raíces en la tradición y en las técnicas específicas del área de aplicación. Generalmente, supone considerar el sistema dividido en subsistemas cuyas propiedades son conocidas de experiencias anteriores y de los que se tienen modelos matemáticos. El modelo del sistema completo se obtiene uniendo matemáticamente los modelos de los subsistemas considerados.
Identificación de sistemas . Se trata de un método empírico, es decir, requiere de
la realización de varios experimentos para obtener datos de entrada-salida del
3-1
TEMA 3: Consideraciones generales sobre la identificación de sistemas
sistema. Dichos datos se utilizan para estimar los coeficientes del modelo de tal forma que la salida del mismo coincida lo más posible con la salida real del sistema cuando ambos son excitados con la misma entrada. Ambas formas de modelización no se deben ver como separadas o excluyentes (ver Figura 3.1). En muchos casos los procesos son tan complejos que no es posible obtener un modelo usando únicamente principios físicos. En tal caso se requiere el uso de técnicas de identificación. No obstante para la elección de estas técnicas es importante todo el conocimiento físico previo que se tenga de la planta. También puede ocurrir que se obtenga un modelo a partir del análisis físico de la planta pero existan parámetros que no se conozcan y que puedan ser estimados mediante identificación.
Sistema Datos Entrada-Salida
Leyes físicas
Modelado físico
Identificación
Modelo del sistema Figura 3.1: Como construir un modelo de un sistema
Este tema se dedica a describir de forma general el procedimiento general de la identificación de sistemas. Será en lo siguientes temas cuando se expliquen los detalles de las diferentes etapas de que consta dicho procedimiento. También en este tema se introducen dos herramientas software que posibilitan la realización del procedimiento de identificación de sistemas: SITB la toolbox de identificación de Matlab e ITSIE una herramienta interactiva para la enseñanza de la identificación de sistemas.
3-2
Identificación de sistemas
3.2 PROCEDIMIENTO SISTEMAS
GENERAL
DE
IDENTIFICACIÓN
DE
En la Figura 3.2 se muestra un esquema del procedimiento general de la identificación de sistemas. En primer lugar hay que diseñar el experimento o experimentos a los que se va a someter al sistema. En dicho diseño resulta muy útil todo el conocimiento a priori que se tenga del sistema. El conocimiento a priori del proceso se basa, por ejemplo, en la comprensión general del proceso, en leyes físicas a las que éste obedece y en medidas previas. Todo ello permite disponer de una idea sobre el grado de linealidad del proceso, su varianza o invarianza con el tiempo, comportamiento integral o proporcional, constantes de tiempo dominantes, retardos, características del ruido, rango de algunos parámetros, valor de algunos de ellos, limitaciones de la estructura del modelo, etc. Además, en el diseño del experimento hay que seleccionar, entre otros aspectos, la señal de entrada (tipo, espectro y amplitud), el periodo de muestreo y la duración del experimento (número de medidas). Respecto a la selección de la señal de entrada que debe “excitar” al sistema, debe ser seleccionada para que genere información en el rango de frecuencias de interés. Dos tipos de entrada bastante utilizadas son las señales pseudoaleatorias binarias (PRBS) y las señales multiseno. Estas señales de entrada serán objeto de estudio en el Tema 4. Hay que tener en cuenta que pueden existir limitaciones físicas y económicas sobre la máxima variación de las señales de entrada y salida durante la realización del experimento. Por otro lado el aumento de la amplitud de la señal de entrada aumenta la relación entre la señal y el ruido del sistema, lo que hace que mejore la identificación. Respecto a la elección del periodo de muestreo, se debe seleccionar de acuerdo a las constantes de tiempo del sistema. Utilizar un periodo de muestreo muy pequeño supone tener una redundancia en los datos, con poco aporte de información en puntos nuevos. Por otro lado, utilizar un periodo de muestreo muy grande implica una mayor dificultad en la determinación de los parámetros que describen la dinámica del sistema. Una regla práctica es utilizar una frecuencia de muestreo alrededor de diez veces la anchura de banda de interés en el modelado.
3-3
TEMA 3: Consideraciones generales sobre la identificación de sistemas
Inicio Diseño de experimentos Adquisición y tratamiento de datos Conocimiento a priori del sistema
Selección del tipo y de la estructura del modelo Estimación de los parámetros del modelo
Validación del modelo
No
¿Modelo adecuado?
Si
Fin
Figura 3.2: Procedimiento general de identificación de sistemas
Una vez realizado el experimento los datos de entrada y salida registrados deben ser tratados matemáticamente antes de poder ser utilizados en el proceso de estimación de los parámetros del modelo. Por ejemplo si los datos son series temporales estacionarias entonces se les debe eliminar los valores medios. Si las series son no estacionarias, a las series temporales se les debe eliminar las tendencias o las perturbaciones de baja frecuencias que motivan la no estacionaridad. Una posible forma de eliminarlas es filtrar las series temporales usando un filtro pasa-alta. Por otra parte los datos experimentales, siempre que se disponga de suficientes datos, se dividen en dos partes: una se utiliza para identificar el modelo (datos para identificación) y otra para validarlo (datos para validación). A continuación se debe escoger un determinado tipo de modelo y proceder a su obtención usando los datos experimentales. Existen principalmente dos categorías de modelos: no paramétricos y paramétricos. 3-4
Identificación de sistemas
Los modelos no paramétricos vienen expresados como curvas o tablas que no pueden ser caracterizadas usando funciones con un número de parámetros finito. Algunos de los modelos no paramétricos más usuales son los obtenidos mediante:
Análisis de correlación. Genera la respuesta a un impulso o a un escalón del sistema
a partir de los datos de entrada-salida disponibles. De la representación gráfica de estas respuestas se pueden estimar los posibles retardos del sistema, el tipo de respuesta (oscilatoria, amortiguada, etc) y la ganancia estática.
Análisis espectral. Genera una estima de la función de la frecuencia del sistema y del
espectro del ruido. A partir de la función de la frecuencia del sistema se puede deducir que frecuencias atenúa o amplifica el sistema y en que rango (filtro pasabaja, pasa-banda o pasa-alta). Por su parte del estudio del espectro del ruido se puede deducir si las perturbaciones que afectan al sistema se pueden modelar como ruido blanco o se debe obtener un modelo específico para las mismas. Los modelos paramétricos quedan definidos por un conjunto finito de parámetros. Los parámetros del modelo se obtienen usando algún método de estimación o calibración de parámetros como el método de los mínimos cuadrados que se basa en la minimización del error de predicción, es decir, la diferencia entre la salida real medida y la salida generada por el modelo. Cuando se desea obtener modelos paramétricos una de las principales decisiones que se deben tomar es que tipo de modelo utilizar. Normalmente se desean identificar modelos lineales, algunos de los tipos de modelos discretos lineales más usuales son: ARX, ARMAX, OE y BJ. Siempre se suele elegir en primer lugar un modelo ARX ya que es el más sencillo de estimar. Una vez elegido el tipo de modelo, otra decisión que se debe tomar es decidir cuál es la estructura del mismo, es decir, los órdenes de los polinomios que definen el modelo. Lo más normal es estimar varios modelos distintos, es decir, trabajar con diferentes estructuras, y escoger el mejor modelo utilizando algún criterio de selección o información que también debe ser especificado. En general se debe escoger el modelo que con la menor complejidad (número de parámetros) resulte adecuado para el uso que se va hacer del mismo (control, simulación, predicción,...) Por último el modelo seleccionado debe ser validado. Entre los tests de validación más utilizados se encuentran los siguientes:
3-5
TEMA 3: Consideraciones generales sobre la identificación de sistemas
Comparación de la salida del modelo con la salida real del sistema usando la misma entrada. Siempre que sea posible, se debe realizar una validación cruzada , que
consiste en utilizar para realizar la validación un conjunto de datos de entrada-salida distinto al que se ha utilizado para estimar los parámetros del modelo.
Comparación de la respuesta en frecuencia del modelo con la respuesta en frecuencia estimada en el análisis espectral .
Análisis de los residuos. Los residuos son las diferencias entre la salida del modelo y
la salida real del sistema. Consiste en calcular la autocorrelación de los residuos y la autocorrelación cruzada de los residuos y la entrada. Si el resultado de la validación es negativo se debe considerar la opción de utilizar otras estructuras y otros tipos de modelos. Si de esta forma tampoco se consiguen buenos resultados habrá que plantearse la realización de nuevos experimentos sobre el sistema que permitan generar datos de entrada-salida que contengan un grado de información mayor. En consecuencia, tal y como se muestra en la Figura 3. 2, el procedimiento de identificación es iterativo. En general la identificación de sistemas resulta muy útil para obtener un modelo de un sistema cuando se dispone de poco o de ningún conocimiento a priori del mismo. En dicho caso al sistema se le considera como una caja negra. En la identificación de modelos de caja negra no suele importar tanto la estructura del modelo sino que el modelo genere una salida que se ajuste lo más posible a la salida medida experimentalmente. Por otra parte, la identificación también resulta útil cuando a partir del modelado físico se ha obtenido un determinado modelo cuyos parámetros hay que estimar. En este caso al sistema se le considera como una caja gris. En la identificación de modelos de caja gris lo importante es estimar los parámetros de un modelo predeterminado de tal forma que la salida del mismo se ajuste lo más posible a la salida del sistema medida experimentalmente.
3.3 HERRAMIENTAS SOFTWARE SISTEMAS
PARA
IDENTIFICACIÓN DE
3.3.1 SITB, la toolbox para identificación de sistemas de MATLAB MATLAB® es un aplicación software bastante potente que soporta un lenguaje de computación técnico de alto nivel y dispone de un entorno interactivo para el desarrollo de algoritmos, visualización de datos, análisis de datos y cálculos numéricos.
3-6
Identificación de sistemas
MATLAB puede ser utilizado en un amplio rango de aplicaciones de ingeniería y ciencia, como el procesamiento de señales y de imágenes, control, simulación, etc. La posibilidad de escribir en el lenguaje nativo de MATLAB librerías de funciones (denominadas toolboxes) permiten extender el uso de MATLAB a la resolución de toda clase de problemas en distintas áreas de aplicación. En 1987 Lennard Ljung, profesor del Departamento de Ingeniería Eléctrica de la Universidad de Linköpings (Suecia), escribió una toolbox de funciones de MATLAB para la identificación de sistemas denominada abreviadamente SIT o SITB acrónimo derivados de System Identification Toolbox. La última versión disponible de esta toolbox, en el momento de escribir estos apuntes, es la Versión 8.2 que se distribuye conjuntamente con la versión R2013a de MATLAB: ( ht t p: / / www. mat hwor ks. es/ pr oduct s/ sysi d/ ). Obviamente cada nueva versión de SITB ha ido añadiendo nuevas funciones y mejoras a la toolbox. Aunque no es necesario disponer de la última versión de SIT para poder aplicar el procedimiento de identificación de sistemas a un problema real. En estos apuntes los ejemplos se han realizado con la versión 6.0.1 de SITB (Matlab 7.0). Es importante recordar los problemas de compatibilidad que presentan las diferentes versiones de MATLAB, así un script desarrollado para una determinada versión no tiene asegurado que se pueda ejecutar completamente sin generar errores en otra versión distinta. La toolbox SITB contiene funciones para poder realizar todos los pasos del procedimiento general de identificación de sistemas, excepto la etapa de diseño de experimentos. Si se teclea en la línea de comandos de MATLAB la orden >>hel p i dent
aparece un listado con el nombre y la utilidad de todas las funciones de SITB. Para conseguir información detallado sobre el uso y la sintaxis de una función en particular de STIB se puede teclear el comando >>hel p [ nombr e de l a f unci on]
Existe un manual de ayuda de SITB en formato HTML que puede ser invocado desde la propia ventana de MATLAB. También existe una versión en PDF del manual de STIB (ht t p: / / www. mat hwor ks. es/ hel p/ t ool box/ i dent / ). Las funciones disponibles en SITB pueden agruparse, entre otras, en las siguientes categorías:
3-7
TEMA 3: Consideraciones generales sobre la identificación de sistemas
Presentación y tratamiento de datos . En esta categoría se engloban aquellas
funciones que permiten representar las series temporales de los datos de entrada - salida, seleccionar rango de datos, modificar el periodo de muestreo, eliminar valores medios y filtrar los datos
Estimación de modelos no paramétricos . Dentro de esta categoría se engloban
aquellas funciones que permiten realizar análisis de correlación y análisis espectral.
Estimación de modelos paramétricos . En esta categoría se engloban aquellas
funciones que permiten estimar por diferentes métodos los parámetros de diferentes tipos de modelos (ARX, ARMAX, OE, BJ,...). Así como generar familias de modelos con diferentes estructuras y seleccionar la más adecuada según diferentes criterios de información o selección.
Simulación y validación de modelos . En esta categoría se engloban aquellas
funciones que permiten simular la salida de un modelo ante diferentes entradas y compararla con los datos de la salida real, realizar análisis de los residuos y estudiar las posibles cancelaciones de ceros y polos que permitan reducir la complejidad del modelo. SITB emplea varios tipos de estructuras de datos en forma matricial que permiten representar los distintos elementos con los que trabaja. También SITB dispone de las funciones necesarias para la manipulación de estas estructuras de datos: creación de nuevas estructuras, extracción y modificación de valores almacenados, representación gráfica. Además dispone de funciones para convertir, cuando es posible, un tipo de estructura a otro tipo distinto. Aparte de poder invocar las funciones de SITB desde la línea de comandos de Matlab o desde un script, SITB también dispone de una interfaz gráfica de usuario (GUI) atractiva y sencillo que internamente invoca a las funciones de la toolbox pero sin que el usuario sea consciente de ello, ya que únicamente tiene que operar con el ratón sobre la interfaz gráfica. Al GUI de SITB (ver Figura 3.3) se le invoca con la siguiente orden: >>i dent
3-8
Identificación de sistemas
Figura 3.3. El interfaz gráfico de usuario
de STIB
3.3.2 ITSIE, una herramienta interactiva para la enseñanza de la identificación de sistemas En el año 2009 J.L. Guzman, profesor del Dpto. de Lenguajes y Computación de la Universidad de Almería, desarrolló junto con otros profesores, la herramienta software interactiva ITSIE (Interactive Tool for System Identification Education) para la enseñanza de la identificación de sistemas que se distribuye ( ht t p: / / aer . ual . es / I TSI E/ ) de forma gratuita. Obviamente ITSIE es mucho menos flexible y limitada que la toolbox SITB. Sin embargo, permite aprender fácilmente los fundamentos de la identificación de sistema y da soporte al diseño de experimentos (configuración de la señal de entrada), algo de lo que carece SITB. ITSIE está desarrollada en Sysquake ( ht t p: / / www. cal er ga. com/ i ndex. ht ml ), un lenguaje parecido al de MATLAB que posibilita de forma sencilla la creación de gráficos interactivos. ITSIE se distribuye gratuitamente como un fichero autoejecutable por lo que no requiere que se tenga instalado en el computador Sysquake. ITSIE presenta un interfaz gráfico de una única ventana (ver Figura 3.4) que incluye todas las etapas del procedimiento de identificación. El usuario interactúa sobre los elementos presentes en la ventana con el uso del ratón o del teclado. Cualquier modificación sobre algún elemento de la ventana se refleja inmediatamente sobre el resto de elementos.
3-9
TEMA 3: Consideraciones generales sobre la identificación de sistemas
Figura 3.4. Ejemplo de ventana de la herramienta ITSIE
La herramienta ITSIE presenta dos modos diferentes de ejecución:
Modo Simulación. En este modo se trabaja con la simulación de un proceso
conocido especificado por el usuario.
Modo datos reales. En este modo se trabaja con un conjunto de datos de entrada-
salida que deben ser cargadas en la herramienta. 3.3.2.1 Modo sim ulaci ón
En este modo de trabajo ITSIE ofrece las siguientes funcionalidades:
Definición de la planta y parámetros de simulación . La parte central de la ventana de
ITSIE en este modo tiene una zona denominada Si mul at i on par amet er s que permite modificar de forma interactiva las fuentes de ruido del proceso simulado. Otros parámetros de simulación, como el periodo de muestreo, se pueden configurar en una entrada del menú Par amet er s . Además el proceso simulado puede ser configurado a partir del menú Modes Si mul at i on. La configuración del modelo del proceso puede ser salvada en un fichero que puede ser cargado en la herramienta cuando se desee.
3-10
Identificación de sistemas
Diseño de la entrada . Existe una zona de definición de los parámetros de la entrada
con la que se excita el sistema denominada I nput si gnal par amet er s , que se encuentra localizada en la parte central superior de la ventana de ITSIE. En ella el usuario puede elegir el tipo de señal de entrada (PRBS o multiseno) y si desea especificar la señales directamente o seguir unas guías de diseño. En el primer caso los parámetros de la señal de entrada pueden ser modificados interactivamente mediante el uso de sliders o arrastrando en algunas de las figuras relacionadas a la entrada:
I nput
Si gnal
que
muestra
la
representación
temporal,
Aut ocor r el at i on que muestra la representación gráfica de la autocorrelación y Power
Spect r um que muestra la representación gráfica de su espectro de
potencia. En la figura Ful l I nput Si gnal se muestra la representación temporal de la señal de entrada completa, es decir, con todos los ciclos que se hayan especificado.
Selección del tipo y estructura del modelo y estimación de parámetros . En la central
de la ventana de ITSIE existen una zona con unas casillas que permiten seleccionar el tipo del modelo (ARX, ARMAX, OE, BJ, CRA) y unos deslizadores para seleccionar de forma manual la estructura del modelo. En el caso de un modelo ARX también es posible dejar que sea la herramienta quien elija la mejor estructura dentro de un rango de valores predeterminados el cual se especifica a través de una entrada del menú Par amet er s . La señal de entrada completa es la que es aplicada al proceso cargado en ITSIE para obtener la salida del proceso que se muestra en color negro en la figura Out put si gnal . Estos son los datos de entrada-salida que se utilizan para estimar los parámetros del modelo seleccionado. En la Figura Out put si gnal existe una línea vertical de color magenta que permite especificar
el rango de datos de entrada-salida que se van usar para estimación (ocupan una zona sombreada con amarillo claro situada a la izquierda de la línea) y los que se van usar para validación (los situados a la derecha de la línea).
Validación del modelo. Se muestra en tres figuras diferentes: St ep r esponses que
incluye la representación gráfica de la respuesta a un escalón del proceso cargado en ITSIE y del modelo seleccionado, Cor r el at i on f uncti on of r esi dual s que incluye la representación gráfica de la función de correlación de los residuos y Cr oss cor r el at i on f unct i on bet ween i nput
and pr edi ct i on er r or
que incluye la representación gráfica de la función de correlación cruzada entre la entrada y el error de predicción.
3-11
TEMA 3: Consideraciones generales sobre la identificación de sistemas
3.3.2.2 Modo dato s reales
Los datos de entrada salida se cargan mediante el menú Modes Real dat a. Los datos deben encontrarse en un fichero ASCII o en fichero . mat de MATLAB. En el caso de que se encuentren en un fichero ASCII los datos se deben organizar en tres columnas: tiempo, salida, entrada. Si se utiliza el formato MATLAB, el fichero . mat debe contener las variables t (tiempo), y (salida) y u (entrada). En este modo de trabajo el contenido de la ventana de ITSIE varía parcialmente con respecto al modo simulación. Las zonas que antes estaban dedicadas a configurar los parámetros de la señal de entrada y los parámetros de simulación ahora desaparecen. Ahora aparecen zonas que permiten configurar las estructuras de diferentes tipos de modelos.
BIBLIOGRAFÍA [Guzman et al., 2009]
J. L. Guzman, D. E. Rivera, S. Dormido y M. Berenguel. ITSIE: An interactive Software tool for system identification th
education. Proceeding of 15 IFAC Symposium on System
Identification (SYSID 2009). 2009. [Guzman et al., 2009b]
J. L. Guzman, D. E. Rivera, S. Dormido y M. Berenguel. ITSIE: Teaching system identification through interactivity .
Proceeding of 8 th IFAC Symposium on Advances in Control Education. 2009. [Ljung y Glad, 1994]
L. Ljung y T. Glad. Modelling of dynamic systems. Prentice Hall. 1994.
[Ljung, 2010]
L. Ljung. System Identification Toolbox 7. The Mathworks. 2010.
[Rivera, 2007]
D. E. Rivera. Introducción a la Identificación de Sistemas . Curso impartido en el Dpto. de Informática y Automática de la UNED del 17-28 de septiembre de 2007.
[Schoukens y Pintelon, 1991]
J. Schoukens, R. Pintelon. Identification of linear systems . Pergamon Press. 1991.
[Söderström y Stoica, 1989]
T. Söderström y P. Stoica, System Identification. Prentice Hall. 1989.
3-12
TEMA 4 DISEÑO DE EXPERIMENTOS Y TRATAMIENTO DE DATOS 4.1 INTRODUCCIÓN El éxito del procedimiento de identificación depende en gran medida de la calidad de los datos de entrada-salida que se adquieran del sistema. Para obtener datos que contengan la máxima información resulta fundamental realizar un diseño adecuado del experimento o experimentos a los que se va a someter el sistema. Dicho diseño debe contemplar aspectos tales como la selección del tipo y de las características (magnitud y duración) de la señal de entrada con que se va a “excitar” el sistema. Así como la elección del periodo de muestreo. También se debe procurar que los experimentos que se diseñen sean “amigables” con la planta o sistema a identificar, es decir, que no perturben en exceso su actividad normal ni puedan provocar la rotura de los actuadores. Una vez realizados los experimentos, los datos de entrada-salida deben ser representados gráficamente. A partir de dichas representaciones es posible detectar la existencia de comportamientos no estacionarios (derivas y/o tendencias en el valor medio y en la pendiente), la existencia de perturbaciones de alta frecuencia y la existencia de datos erróneos (outliers). Antes de poder ser utilizados para la estimación de modelos los datos deben ser tratados matemáticamente para eliminar las anomalías detectadas. Básicamente dicho tratamiento incluye la eliminación de valores medios y tendencias de las series temporales de entrada-salida. Así como el filtrado (si fuese necesario) de los datos para eliminar las perturbaciones de baja (derivas) y alta frecuencia, o para enfatizar un determinado rango de frecuencia de interés. En este tema en primer lugar se realizan unas consideraciones generales sobre la elección de la señal de entrada. En segundo lugar se describen las características de los principales tipos de señales de entrada. A continuación se realizan unas consideraciones sobre la elección del periodo de muestreo. Finalmente se describe el tratamiento
4-1
TEMA 4: Diseño de experimentos y tratamiento de datos
matemático que hay que realizar sobre los datos de entrada-salida obtenidos experimentalmente antes de poder utilizarlos en el proceso de identificación.
4.2 CONSIDERACIONES GENERALES SOBRE LA ELECCIÓN DE LA SEÑAL DE ENTRADA 4.2.1 Excitación persistente Una señal de entrada u(t) estacionaria o cuasi-estacionaria con un espectro de potencia
u() se dice de excitación persistente (EP) de orden o grado n si para todos los filtros de la forma
M n ( z ) m1 · z
1
... mn ·z n
(4.1)
la relación 2
j M n ( e ) · u ( ) 0
(4.2)
j M n ( e ) 0
(4.3)
implica que
En conclusión, una entrada u(t) es de EP de orden n si su espectro
u() es distinto de
cero en al menos n puntos del intervalo - < <. En general si se desea identificar un sistema de N parámetros se debe excitar con una entrada de EP de grado n
N. Si la señal de entrada fuese de EP de grado n < N no estaría
excitando suficientemente al sistema para identificar todos sus parámetros. Asimismo, para un sistema dinámico con ruido no correlacionado la estima es consistente (ver sección 6.4.3) si la señal de entrada es de EP de grado N, es decir, coincide con el número de parámetros que posee el modelo.
4.2.2 Características deseables en teoría para la entrada De forma general se puede utiliza el siguiente modelo lineal para modelar un sistema (Ver Figura 4.1):
y ( t ) G ( z )·u( t ) v( t )
4-2
(4.4)
Identificación de sistemas
G(z) es el modelo de la planta o sistema, u(t) es la entrada, v(t) es la perturbación e y(t) es la salida. De acuerdo con el teorema de factorización espectral (ver sección 2.7) la perturbación v(t) se puede considerar la salida de un filtro H(z) que es excitado por una señal de ruido blanco a(t):
v(t ) H ( z )·a (t )
(4.5)
Luego el modelo del sistema se puede expresar de la siguiente forma:
y ( t ) G ( z )·u( t ) H ( z )·a (t )
(4.6)
a(t)
H(z)
v(t) u(t) G(z)
+
y(t)
Figura 4.1. Modelo lineal de un sistema En general la perturbación v(t) es una señal aleatoria autocorrelacionada, por lo que la salida y(t) también será una señal aleatoria autocorrelacionada. La entrada u(t) puede ser determinista (PRBS, multiseno,...) o aleatoria, pero debe tener las siguientes características:
Debe poseer tanta potencia como sea posible, es decir, debe tener una EP de grado elevado para excitar el mayor número posible de frecuencias del sistema y conseguir que la salida contenga la máxima información posible.
Su duración debe ser lo mayor posible ya que, como se pondrá de manifiesto en sección 6.4.4, cuanto mayor es el número N de datos de entrada-salida que se recojan menor será la varianza de los parámetros del modelo del sistema que se estimen.
Su amplitud debe ser lo mayor posible ya que así aumenta la relación señal-ruido con lo se minimiza el efecto de la presencia de ruido en los sensores de medida.
4-3
TEMA 4: Diseño de experimentos y tratamiento de datos
No debe estar correlacionada con la perturbación. Es decir, no debe existir realimentación de la salida sobre la entrada (operación en lazo cerrado). Esta característica no siempre es requerida por todos los métodos de estimación de parámetros pero siempre es deseable.
Si el modelo corresponde a una linealización de un sistema no lineal, su validez estará limitada a un determinado rango de operación del sistema. Por lo que no se debe escoger la señal de entrada de modo que saque al sistema fuera de la zona de validez del modelo. No obstante, tras la identificación del modelo puede resultar interesante realizar otro experimento con una amplitud mayor para determinar la zona de validez de éste.
4.2.3 Características deseables en la práctica para la entrada: entradas “ amigables” con la planta. El término “amigable con la planta” (plant-friendly) proviene de la comunidad de control de procesos químicos y está motivado por el deseo de que los experimentos para identificación que se realicen sobre la planta o sistema no perturben en exceso el funcionamiento normal de la planta. Un experimento amigable con la planta es aquél que permite obtener, en un periodo de tiempo razonable, datos de entrada-salida para identificar un modelo adecuado de la planta manteniendo la magnitud de las entradas y las salidas dentro de unos rangos de valores predefinidos por el usuario. Una entrada amigable con la planta debería tener las siguientes características:
Tener una duración tan corta como sea posible. Con ello se consigue minimizar la cantidad de producto que genera la planta no utilizable para su venta debido a estar operando en condiciones fuera de las usuales. Además también se reduce el coste a la mano de obra cualificada que se debe encargar de realizar los test de identificación (lo que se conoce como coste de ingeniería).
No saturar los actuadores o exceder las limitaciones de movimiento de los mismos.
Producir la mínima perturbación de las variables controladas, es decir, introducir en las mismas una varianza baja y desviaciones pequeñas del punto de consigna.
4-4
Identificación de sistemas
De esta forma se consigue minimizar la variabilidad en la calidad del producto que genera la salida de la planta. Se observa que las características que debe reunir una entrada en la práctica para ser amigable con la planta están en contraposición con las características deseables en teoría. Por ejemplo en teoría la entrada debe tener una duración lo mas larga posible para así disminuir el error de varianza de las estimas del modelo. Sin embargo en la práctica lo recomendable es que su duración sea lo menor posible para minimizar la cantidad de producto no utilizable y reducir costes. En consecuencia, a la hora de diseñar la señal de entrada hay que llegar a un compromiso entre los requerimientos prácticos (amigables con la planta) y los teóricos (hostiles con la planta).
4.2.4 Índices para establecer el grado de amigabilidad de una entrada. Existen diversos índices para medir el grado de amigabilidad de una entrada. Entre ellos destacan: el índice de amigabilidad, el índice de comportamiento para señales de perturbación y el factor de cresta.
4.2.4.1 Índice de amigabili dad En [Doyle et al., 1999] definieron el índice de amigabilidad f de una secuencia de entrada arbitraria u k, k=1,...,N de la siguiente forma
f (%) 100 1
N 1 nT
(4.7)
donde N es la longitud de la secuencia de entrada y n T es el número de transiciones (es decir, situaciones donde u kuk+1) de la señal de entrada. Nótese que el factor de amigabilidad es un porcentaje. Una entrada se considera más amigable con la planta cuanto mayor es el valor de f. Una secuencia de entrada constante es una entrada “100% amigable con la planta”, mientras que una secuencia de entrada cuyo valor cambia en cada instante de tiempo es “0% amigable con la planta”.
4.2.4.2 Índice de comp ortamiento para señales de perturbación En [Godfrey et al., 1999] definieron el índice de comportamiento para señales de perturbación PIPS( Performance Index for Perturbation Signals)
4-5
TEMA 4: Diseño de experimentos y tratamiento de datos
2 u mean PIPS (%) 100 u max u min
2 2 u rms
(4.8)
donde urms es la raíz cuadrada del valor cuadrático medio (root mean squared (rms)) de la secuencia u, umean es su valor medio, umax es su valor máximo y umin es su valor mínimo. Nótese que PIPS es un porcentaje y sus valores caen por tanto entre el 0% y el 100%, lo cual lo hacen fácil de interpretar. Cuanto mayor es el valor de PIPS más amigable se considera la señal de entrada.
4.2.4.3 Factor de cresta El factor de cresta o CF (Crest Factor) de una señal se define [Guillaume et al., 1991] como el cociente entre la norma infinito o norma de Chebyshev l (u ) de la señal y la norma dos l 2 (u ) de la señal:
C F(u)
l (u ) l 2 (u )
(4.9)
La norma general l p se define en tiempo continuo de la siguiente forma:
1 N p l p (u ) · | u(t ) | ·dt N 0
1 / p
(4.10)
Mientras que en tiempo discreto se puede definir de la siguiente forma:
1 N p l p (u ) · | u k | N k 1
1 / p
(4.11)
Y la norma infinito se define como
l ( x ) max | x(t ) | t
(4.12)
El factor de cresta es un valor comprendido entre 1 e infinito que proporciona una medida de la distribución de los valores de la señal a lo largo de su rango posible de valores (span). Un factor de cresta pequeño significa que la mayoría de los valores de la secuencia de entrada caen cerca de los valores máximos y mínimos de la secuencia. Como consecuencia la entrada es amigable con la planta.
4-6
Identificación de sistemas
En la práctica dadas dos señales con el mismo espectro de potencia, se prefiere siempre la señal con el factor de cresta más pequeño puesto que contiene la misma potencia en un rango de valores más pequeño.
Ejemplo 4.1: Supóngase dos señales multiseno u 1 y u2 con idéntico espectro de potencia. Las fases de las componentes de señal u 1 se han considerado nulas, mientras que las fases de las componentes de la señal u2 se ha generado mediante la ecuación de fase de Schroeder (4.37). El factor de cresta de u 1 es 4.4721, mientras que el factor de cresta de u 2 es 1.8767.
Figura 4.2: Representación temporal de la señal multiseno: a) u 1 (parte superior). b) u 2 (parte inferior) En la Figura 4.2 ([Rivera, 2007]) se muestra la representación temporal de ambas señales. La señal u1 tiene unos valores inicial y final bastante altos con respecto al resto de valores. Por su parte la señal u2 tiene sus valores uniformemente distribuidos a lo largo del rango de valores. Luego se comprueba que la señal u 2 con menor factor de cresta resulta más amigable.
4.3 TIPOS DE SEÑALES DE ENTRADA 4.3.1 Señal escalón Una señal escalón se define de la siguiente forma en tiempo continuo
a t 0 0 0 t
u(t )
(4.13)
Su transformada de Laplace es 4-7
TEMA 4: Diseño de experimentos y tratamiento de datos
U ( s )
a s
(4.14)
Su definición en tiempo discreto es:
a 0
uk
k 0, 1, 2,... k 1, 2, 3
(4.15)
Su transformada z es
U ( z )
a
1 z 1
(4.16)
En la Figura 4.3 ([Rivera, 2007]) se representa la serie temporal y el espectro de potencia de un escalón de ejemplo.
Figura 4.3. Ejemplo de serie temporal y espectro de potencia de una entrada escalón
Una entrada escalón únicamente permite excitar las bajas frecuencias. Se puede demostrar que es una señal de EP de grado 1. Con este tipo de entradas únicamente se puede determinar un único parámetro: la ganancia estática del sistema. Este valor corresponde al comportamiento del sistema a frecuencia cero ( =0).
4.3.2 Señal pulso simple La señal pulso simple también denominada como señal pulso de media no nula se define de la siguiente forma en tiempo continuo
4-8
Identificación de sistemas
t 0
0 u(t ) a 0
0 t t
(4.17)
t t
Su transformada de Laplace es t s a·(1 e · )
U ( s )
s
(4.18)
Su definición en tiempo discreto es:
k 1, 2,...
0 uk a 0
0, 1, 2,...., N k N 1, N 2,.. k
N
t / T
(4.19)
Su transformada z es
U ( z )
a·(1 z
N
)
1 z 1
N t / T
(4.20)
En la Figura 4.3 ([Rivera, 2007]) se representa la serie temporal y el espectro de potencia de un pulso simple de ejemplo.
Figura 4.3. Ejemplo de serie temporal y espectro de potencia de una entrada pulso simple
Una señal pulso a diferencia de una señal escalón consigue excitar algo al sistema en un rango intermedio de frecuencia. Si se estrecha la anchura y se aumenta la amplitud de la señal pulso, ésta se puede aproximar a un impulso. Mientras que si se aumenta su anchura del pulso, éste se asemeja a la señal escalón.
4-9
TEMA 4: Diseño de experimentos y tratamiento de datos
4.3.3 Señal pulso doble La señal pulso doble también denominada como señal pulso doble de media nula se define de la siguiente forma en tiempo continuo
0 u(t ) a a
t 0
0 t t
(4.21)
t t
Su transformada de Laplace es
U ( s )
a·(1 2·e t ·s
e 2·t ·s )
s
(4.22)
Su definición en tiempo discreto es:
0 uk a a
k 1,2,... k 0, 1, 2,...., N
N t / T
(4.23)
k N 1, N 2,...
Su transformada z es
U ( z )
a·(1 2· z
N
z 2 N )
1 z 1
N t / T
(4.24)
En la Figura 4.5 ([Rivera, 2007]) se representa la serie temporal y el espectro de potencia de un pulso doble.
Figura 4.5. Ejemplo de serie temporal y espectro de potencia de una entrada pulso doble
4-10
Identificación de sistemas
Una señal pulso doble también consigue excitar algo al sistema en un rango intermedio de frecuencia. Sin embargo atenúa las bajas frecuencias, lo cual puede suponer un problema si la anchura del pulso
t no es lo suficiente grande.
4.3.4 Ruido blanco Se denomina ruido blanco en tiempo discreto a un proceso estocástico estacionario discreto x(t) cuya función de covarianza es:
2 r xx ( ) 0
0 1, 2,...
(4.25)
En la Figura 4.6 se representa r xx() gráficamente. Obsérvese que r xx() es nula para todos los valores de
excepto en el origen ( =0) donde vale 2 que es la varianza del
proceso. Esto significa que el valor del proceso en un instante de tiempo t es independiente (no está correlacionado) de los valores del proceso en otros instantes de tiempo. El proceso estocástico ruido blanco puede por tanto ser considerado como una secuencia de variables aleatorias igualmente distribuidas e independientes.
r xx ( )
2
2 2
-2
-1
0
1
2
Figura 4.6: Representación gráfica de la covarianza y de la densidad espectral del ruido blanco en tiempo discreto
Su función de densidad espectral es:
2 2·
(4.26)
4-11
TEMA 4: Diseño de experimentos y tratamiento de datos
Luego un proceso de ruido blanco se caracteriza por tener una densidad espectral constante para todas las frecuencias. La analogía con las propiedades espectrales de la luz blanca explican el nombre que recibe este proceso estocástico. En el caso del ruido blanco en tiempo continuo su función de covarianza es:
r xx (t ) 2 · ( )
(4.27)
Donde es la función delta de Dirac:
si 0 ( ) 0 si 0 El ruido blanco es una señal de EP de grado infinito y eso es así porque dispone de todas las frecuencias. En consecuencia es la señal de entrada idónea en teoría para identificar un sistema. Desafortunadamente, no es una señal que resulte amigable con la planta. Es por ello que se suele recurrir a señales cuyo espectro se puede aproximar en un cierto rango de frecuencias al ruido blanco, es decir, señales cuyo espectro es prácticamente constante en un cierto rango y que son más amigables con la planta. Las dos aproximaciones más utilizadas son la señal aleatoria binaria o señal RBS (Random Binary Signal) y la señal pseudoaleatoria binaria o señal PRBS (Pseudo-Random Binary Signal).
4.3.5 Señal binaria aleatoria (RBS) Una señal binaria aleatoria o señal RBS discreta es una señal que conmuta con una probabilidad p entre dos valores –a y a en instantes de tiempo equiespaciados t=h·Tsw donde h=0,1,2,… y Tsw es el periodo de conmutación. Obviamente los parámetros de diseño de esta señal son su amplitud a, su periodo de conmutación Tsw y la probabilidad de conmutación p. En la Figura 4.7 ([Rivera, 2007]) se muestra una posible realización de una señal RBS y su espectro de potencia. Se puede demostrar ([Davies, 1970], [Godfrey, 1993]) que la expresión asintótica del espectro de una señal RBS con p=0.5 es:
sin 2 ( ·T sw / 2) u ( ) a ·T sw · ( ·T sw / 2) 2 2
(4.28)
En la Figura 4.8 ([Rivera, 2007]) se muestra el espectro de potencia asintótico de una señal RBS con p=0.5, se observa que es prácticamente constante en el rango de
4-12
Identificación de sistemas
frecuencias comprendido entre [ ω , ω ] y que comienza a disminuir con oscilaciones para
> ω .
ω
Figura 4.7: Realización y espectro de potencia de una señal RBS. 300 muestras tomadas con periodo de muestreo unidad, T sw=3 minutos, a=1, p=0.5.
Figura 4.8: Espectro de potencia asintótico de una señal RBS con p=0.5
Al tratarse de una señal aleatoria el espectro de potencia de la misma tiene un cierto error, aunque la banda de confianza o banda de error no aparece representada ni en la Figura 4.7 ni en la Figura 4.8.
4-13
TEMA 4: Diseño de experimentos y tratamiento de datos
4.3.6 Señal binaria psedoaleator ia (PRBS) Una señal PRBS es una entrada periódica y determinista que se puede generar utilizando registros de desplazamiento y algebra Boolena (ver Figura 4.9 ([Rivera, 2007])).
Figura 4.9: Generación de una señal PRBS utilizando un registro de desplazamiento de n r bits y una puerta lógica XOR (OR-exclusiva).
Una señal PRBS posee las siguientes propiedades:
Tiene dos niveles ±a y puede cambiar de uno a otro sólo en ciertos intervalos de tiempo t=0, Tsw, 2 Tsw, 3 Tsw,… A Tsw se le conoce como tiempo de reloj o de conmutación.
Si se va a producir o no el cambio de la señal en un determinado intervalo está "predeterminado". Luego la señal PRBS es determinista y los experimentos se pueden repetir.
Es periódica con periodo T 0=N Tsw, siendo N un número entero impar.
Posee un grado N de excitación persistente.
Su rango de frecuencia es configurable por el usuario.
Las señales PRBS más utilizadas son las que se basan en secuencias de longitud máximas, para las cuales N=2 nr -1 siendo nr la capacidad del registro de desplazamiento.
La función de autocovarianza de una señal PRBS es periódica y se asemeja a la del ruido blanco (ver Figura 4.10 ([Rivera, 2007])).
4-14
Identificación de sistemas
Figura 4.10: Función de autocovarianza de una señal PRBS
Figura 4.11: Representación temporal y espectro de potencia de una señal PRBS. Periodo de muestreo unidad, T sw=3, a=1 y nr =4. La duración de un ciclo es de 45 minutos .
En la Figura 4.11 ([Rivera, 2007]) se muestra la representación temporal y el espectro de potencia de una señal PRBS de ejemplo. Se puede demostrar que ([Davies, 1970], [Godfrey, 1993]) la expresión asintótica del espectro de una señal PRBS es:
·T sw sin 2 a ·( N 1)·T sw 2 · u ( ) · T N sw 2
2
(4.29)
4-15
TEMA 4: Diseño de experimentos y tratamiento de datos
En la Figura 4.12 ([Rivera, 2007]) se muestra el espectro de potencia general de una señal PRBS, se observa que es prácticamente constante en el rango de frecuencias comprendido entre [
,
ω
ω
] y que comienza a disminuir osciladamente para
ω
> ω .
Figura 4.12: Espectro de potencia asintótico de una señal PRBS
El rango de frecuencias donde el espectro es constante se puede estimar a través de la siguiente expresión:
2· N ·Tsw
2.8 T sw
Si se aumenta el valor de N se consigue disminuir el valor de
(4.30)
,
ω
y en consecuencia el
rango de frecuencias se extiende más hacia las bajas frecuencias. Por otro lado si se disminuye el tiempo de conmutación T sw se consigue aumentar el valor de
ω
con lo que el
rango de frecuencia se extiende más hacia las altas frecuencias. Nótese que también se aumenta el valor de
,
ω
por lo que si se desea mantener el valor de
se
ω
debe aumentar N
para compensar. Si se compara una señal PRBS con una señal RBS se observa que desde el punto de vista frecuencial, el espectro de una señal PRBS es muy parecido al de una señal RBS. También desde el punto de vista temporal una señal RBS y de una señal PRBS son muy parecidas, solo si se tiene un registro de muestras suficientemente grande se podrá apreciar el carácter periódico de una señal PRBS que le distingue en el tiempo de una señal RBS.
4-16
Identificación de sistemas
La principal diferencia entre ambos tipos de señales es que una señal PRBS es determinista y por lo tanto reproducible experimentalmente, por eso siempre es preferible utilizar una señal PRBS a una señal RBS. Los parámetros de diseño de una señal PRBS son su amplitud a, el periodo de conmutación Tsw y la longitud nr del registro de desplazamiento. En [Rivera, 1992] se dan las siguientes expresiones como guías para ayudar a diseñar una señal PRBS:
T sw
2.8· Ldom s
(4.31)
H
N 2
nr
1
2· · s · dom T sw
(4.32)
Tanto Tsw como N son números enteros positivos. Además T sw debe ser un múltiplo entero del tiempo de muestreo T. El significado de los parámetros que aparecen en las expresiones (4.31) y (4.32) es el siguiente:
Ldom y H dom son las estimas inferior y superior, respectivamente, de la constante de tiempo dominante del proceso.
s es un factor entero positivo que permite especificar el valor de
,
ω
es decir,
cuanta información de baja frecuencia estará presente en la entrada. Cuánto mayor sea el valor de s más pequeño será el valor de
y
ω
más información
de baja frecuencia contendrá la entrada. También s es un factor que representa el tiempo de asentamiento del proceso. Por ejemplo, un valor límite inferior de frecuencia proceso, s=4 el 98% y
usando
ω
s=3 especifica el
el 95% del tiempo de asentamiento del
s=5 el 99%.
s es un factor entero positivo que permite especificar el valor de
ω
, es decir,
cuanta información de alta frecuencia estará presente en la entrada. Cuánto mayor sea el valor de s más grande será el valor de
ω
y más información de
alta frecuencia contendrá la entrada. También s es un factor que representa la velocidad de la respuesta en lazo cerrado del proceso, expresada como un
4-17
TEMA 4: Diseño de experimentos y tratamiento de datos
múltiplo del tiempo de respuesta en lazo abierto. Por ejemplo si
s=2, el
diseñador espera que la constante de tiempo del sistema en lazo cerrado sea la mitad que la del sistema en lazo abierto (es decir, dos veces más rápido) y ello requiere un mayor contenido de alta frecuencia en la entrada. Considerando los parámetros anteriores el rango de frecuencias donde el espectro es constante se puede estimar a través de la siguiente expresión
Nótese que si se aumenta
1 s ·
H dom
s L dom
(4.33)
s y s el rango de frecuencias se amplia y se incrementa la
resolución del espectro de la señal de entrada.
4.3.7 Señal multiseno Una señal suma de sinusoides, también denominada como señal multiseno, es una señal determinística periódica que puede expresarse, por ejemplo, de la siguiente forma: ns
us ( k ) ·
2· i ·cos( i ·k ·T i )
(4.34)
i 1
En la expresión anterior T es el tiempo de muestreo, ns es el número de sinusoides (es decir de armónicos) y
i es la potencia relativa de una sinusoide ( i>0 i=1,...,ns). Se verifica
que ns
1 i
i 1
Por otra parte, es un factor de escala para asegurar que la amplitud de la señal se encuentra entre los valores ±usat. La frecuencia de cada componente sinusoidal se calcula a través de la siguiente expresión:
i
2· ·i N ·T
donde N es la longitud de la secuencia. Se verifica que
4-18
(4.35)
Identificación de sistemas
ns
N
2
(4.36)
La fase de cada componente sinusoidal se puede calcular, por ejemplo, usando la ecuación de fase de Schroeder [Schroeder, 1970]: i
i
2· · j· j
(4.37)
j 1
Lo que minimiza la aparición de picos pronunciados en la serie temporal. En dicho caso a la señal multiseno, también se la denomina como señal de fase de Schroeder . Una sinusoide es una señal de EP de grado 2, con esta entrada se puede determinar la respuesta de un sistema a una determinada frecuencia, es decir, la amplitud con que se modifica la señal al pasar por el sistema y el desfase que se introduce. Por lo tanto, una señal formada por la suma de ns sinusoides es de EP de orden 2 ns. A modo de ejemplo, en la Figura 4.13 se muestra el espectro de potencia de una señal suma m de sinusoides diseñada como filtro pasa-baja, se observa que posee una parte constante (i0) en el rango de frecuencias comprendido entre [
,
ω
ω
] y es nulo ( i=0) en
el rango [ ω , π/T] .
i
0
i
*
2· N s ·T
*
0
T
Figura 4.13: Espectro de potencia de una señal suma de sinusoides diseñada como filtro pasa-baja.
En consecuencia el espectro de potencia de una señal multiseno está directamente especificado mediante la selección del factor de escalado , los coeficientes de Fourier
i, el
número de armónicos n s y la longitud de la señal N. En [Rivera et al., 1993] se dan las siguientes expresiones como guías para ayudar a diseñar una señal multiseno:
4-19
TEMA 4: Diseño de experimentos y tratamiento de datos
N
ns
L
2· · s · H dom T
N ·T · s
2· · Ldom
(4.38)
(4.39)
H
Los parámetros dom , dom , s y s tienen el mismo significado que en el caso de las señales PRBS explicadas en la sección anterior. Considerando los datos anteriores el rango de frecuencias donde el espectro es constante se puede estimar a través de la siguiente expresión
Nótese que si se aumenta
1 s ·
H dom
s L dom
(4.40)
s y s el rango de frecuencias se amplia y se incrementa la
resolución del espectro de la señal de entrada.
Ejemplo 4.2: Considérese la siguiente planta con retardo
P( s )
es s 1
con un periodo de muestreo T=0.3 minutos [Rivera et al., 1993]. Se va a considerar que
dom=1.5
minutos, αs= 2 y s=3. Sustituyendo estos valores en (4.38) y (4.39) se obtienen los siguientes valores para los parámetros de diseño de una señal multiseno: N=95 y n s=7. Además el periodo de un ciclo es de N·T=95·0.3=28.5 minutos. Se va a tomar como amplitud de la señal a=1.75.
Figura 4.14: Series temporales de la señal PRBS y de la señal multiseno del ejemplo.
4-20
Identificación de sistemas
Por otra parte sustituyendo el valor de estos parámetros en las expresiones (4.31) y (4.32) se obtiene los siguientes valores para los parámetros de diseño de una PRBS: T sw=2.1, N=15 y n=4. Además el periodo de un ciclo es N·T sw=15·2.1= 31.5 minutos. Se va a tomar como amplitud de la señal a=1.0. En la Figura 4.14 ([Rivera, 2007]) se muestra la representación temporal de la señal multiseno y de la señal PRBS. Se observa que la amplitud de la señal PRBS oscila en un rango de valores [-1,1] más pequeño que la amplitud de la señal sinusoidal que se mueve entre [-1,7,1.7] aproximadamente. Sin embargo la señal multiseno requiere de movimientos menos bruscos de los actuadores en comparación con la señal PRBS. En la Figura 4.15 ([Rivera, 2007]) se muestra la salida del sistema cuando es excitado con la señal multiseno y con la señal PRBS. Se observa que la amplitud de la señal de salida es muy parecida en ambos casos y muestra desviaciones similares del punto de operación nominal.
Figura 4.15: Series temporales de la salida del sistema cuando es excitado con la señal PRBS y con la señal multiseno del ejemplo.
Figura 4.16: Espectro de potencia de la señal PRBS y de la señal multiseno del ejemplo.
4-21
TEMA 4: Diseño de experimentos y tratamiento de datos
En la Figura 4.16 ([Rivera, 2007]) se muestra el espectro de potencia de ambas señales. Se observa que las dos señales tienen el mismo ancho de banda; sin embargo únicamente la señal multiseno es una autentica señal pasa-baja. Sin embargo esta señal no tiene suficiente excitación persistente para identificar las componentes de alta frecuencia, como por ejemplo las que poseen los modelos tipo FIR (ver sección 6.2.2). Una forma de corregir este problema es añadir armónicos a alta frecuencia pero solo como una fracción de la potencia a baja frecuencia. (ver Figura 4.17 ([Rivera, 2007]))
Figura 4.17: Serie temporal y espectro de potencia de la señal multiseno modificada Otra opción es diseñar la señal multiseno para que su espectro se parezca al de la señal PRBS en el rango de frecuencias de interés (ver Figura 4.18 ([Rivera, 2007]))
Figura 4.18: Serie temporal y espectro de potencia de la señal multiseno modificada para que se parezca a la señal PRBS en el rango de frecuencias de interés.
Otro aspecto a considerar en el diseño de las señales multiseno, es que la elección de los ángulos de fase
i de los armónicos de la señal no influye sobre la forma del espectro de
potencia. Sin embargo afectan al valor de los parámetros que se calculan para medir la amigabilidad de la señal de entrada con la planta, como es el caso del factor de cresta.
4-22
Identificación de sistemas
i de cada componente sinusoidal es posible
Eligiendo adecuadamente los valores
diseñar una señal multiseno con un espectro de potencia determinado y con un factor de cresta lo más pequeño posible. Para ello hay que resolver un problema de optimización no lineal que se puede enunciar de la siguiente forma: “ Dada la siguiente estructura de señal multiseno ns
u s ( k ) ·
2· i ·cos( i ·k ·T i )
(4.41)
i 1
y una densidad de potencia espectral (definida por los coeficientes de Fourier · 2· i i=1,..,,ns de cada uno de los componentes sinusoidales) obtener el vector de fases de las componentes sinusoidales óptimo p
1 , 2 , ..., ns
(4.42)
que minimiza el factor de cresta CF(us).” La resolución de este problema no se puede hacer de forma directa (derivando e igualando a cero) ya que la norma l (u ) incluida en la definición del factor de cresta es no diferenciable. Además la función objetivo es no convexa. Guillaume et al. (1991) propusieron aproximar la minimización de
l (u ) por la
minimización secuencial de normas l p (u ) donde p=4, 8, 16,.... Esta aproximación se basa en el algoritmo de Pólya que afirma que
lim p p
p
Donde
p es
p
la solución minimax. Puesto que la norma l 2 (u ) permanece invariante
con respecto a las fases
i, este método efectivamente aproxima la minimización del factor
de cresta. El vector de fases p es inicializado con las fases producidas por la ecuación de Schroeder (4.37). Aunque el algoritmo de Guillaume et al. (1991) no garantiza alcanzar el mínimo global, si permite evitar muchos mínimos locales y produce en la práctica resultados bastante buenos.
4-23
TEMA 4: Diseño de experimentos y tratamiento de datos
Nótese que a la formulación original del problema de optimización también se le podrían añadir restricciones sobre los valores mínimos y máximos permitidos en la entrada [Rivera et al., 2007]. Así como restricciones sobre el valor máximo permitido en las transiciones desde un valor uk al siguiente u k+1 de la entrada.
4.3.8 Conclusiones Con vistas a la reproducibilidad del experimento es conveniente usar una señal determinista que una aleatoria. Si se conoce el rango de frecuencias del sistema que se desea identificar entonces se puede elegir como señal de entrada una suma de sinusoides distribuidas de forma regular sobre dicho rango. Si no se conoce el rango lo mejor es utilizar una señal RBS o una señal PRBS.
4.4 ELECCIÓN DEL PERIODO DE MUESTREO El teorema del muestreo de Shannon afirma que si una señal x(t) en tiempo continuo es muestreada con un periodo de muestreo T, ésta podrá ser reconstruida a partir de la señal muestreada x*(t)=x(tk) tk=k·T k=1, 2, ..,N si se cumple la siguiente relación:
s
Siendo
2· 1
(4.43)
1 es la componente de más alta frecuencia presente en la señal de tiempo
continuo x(t) y
s es la frecuencia de muestreo s
2· T
(4.44)
En la práctica normalmente el periodo de muestreo se suele elegir para que se cumpla la relación
s
10·
1
(4.45)
La elección del periodo de muestreo en el proceso de toma de datos de entrada/salida del sistema a identificar está ligada a las constantes de tiempo de dicho sistema . Además se deben tener en cuenta los siguientes aspectos:
La existencia de un intervalo de tiempo fijo para el experimento . Como el periodo de muestreo no puede disminuirse una vez realizado el registro de los
4-24
Identificación de sistemas
datos conviene muestrear a una velocidad rápida y realizar después la estimación considerando valores dobles, triples, etc del valor de muestreo.
El número total de datos a registrar fijo . El periodo de muestreo se debe elegir entonces como un compromiso. Si es muy grande los datos contendrán poca información sobre la dinámica de alta frecuencia del sistema. Si el periodo es pequeño las perturbaciones pueden tener una influencia excesiva en el modelo y, además, puede haber poca información del comportamiento a baja frecuencia.
El objetivo final de la aplicación. Para los sistemas en lazo abierto se aconseja tomar entre 2 y 4 muestras en el tiempo de subida. Para sistemas en lazo cerrado se aconseja también ese número de muestras en el tiempo de subida del sistema en lazo cerrado o bien entre 8 y 16 muestras en una oscilación amortiguada del sistema. Otro valor que se suele indicar es el de realizar entre 5 y 16 muestras en el tiempo de asentamiento al 95% de la respuesta del sistema en lazo cerrado a un escalón de entrada.
La fiabilidad del modelo resultante . El uso de periodos de muestreo muy pequeños puede llevar a problemas prácticos, ya que los polos tienen a agruparse en torno al punto z=1 del plano complejo y la determinación del modelo se hace muy sensible a errores y perturbaciones, pudiendo resultar que pequeños errores en los parámetros tengan una influencia importante sobre las propiedades de entrada-salida del modelo. Además un muestreo muy rápido lleva a que el modelo sea de fase no mínima lo que puede causar problemas a la hora de diseñar la ley de control.
Ejemplo 4.3: Se tiene la siguiente expresión para la función de transferencia de una planta que posee a su entrada un retenedor de orden cero.
G ( s)
T s K ·(1 T 4 s)e d
(1 T 1s)(1 T 2 s)(1 T 3 s)
K 1; T 1 10; T 2
7; T 3 3; T 4 2; T d 4
El modelo discreto equivalente que se obtiene considerando un periodo de muestreo T es:
4-25
TEMA 4: Diseño de experimentos y tratamiento de datos
G ( z ) z
nk
b1 z 1 b2 z 2 b3 z 3 ) (1 a1 z 1 a2 z 2 a3 z 3 )
(b0
La ganancia es
K
b 1 a i
i
En la Tabla 4.1 se muestran los valores de los coeficientes de G(z) en función del periodo de muestreo T. Cuando el periodo de muestreo disminuye las magnitudes de los parámetros a se incrementan y la de los parámetros b disminuyen. Para un periodo de muestreo pequeño, por ejemplo T=1 s, se tiene
bi
ai
y
b
i
1 ai
ai
Se observa que pequeños errores en los parámetros pueden tener una influencia significativa en el comportamiento entrada-salida del modelo, ya que, por ejemplo, el valor de
b depende i
fuertemente de los valores de las cifras decimales cuarta y quinta.
T=1
T=4
T=8
T=16
a1
-2.48824
-1.49836
-0.83771
-0.30842
a2
2.05387
0.70409
0.19667
0.02200
a3
-0.56203
-0.09978
-0.00995
-0.00010
b0
0
0
0.06525
0.37590
b1
0.00462
0.06525
0.25598
0.32992
b2
0.00169
0.04793
-0.02850
0.00767
b3
-0.00273
-0.00750
-0.00074
-0.00001
bi
0.00358
0.10568
0.34899
0.71348
0.00358
0.10568
0.34899
0.71348
1+ ai
Tabla 4.1: Coeficientes de G(z) en función del periodo de muestreo.
Por otra parte la elección de un periodo de muestreo muy grande puede llevar a una simplificación excesiva del modelo dando este una descripción muy pobre de su comportamiento dinámico. En el ejemplo se ve que para T=8 s. el modelo se reduce prácticamente a un sistema de segundo orden, porque
4-26
Identificación de sistemas
a3 << 1
a
i
y b3 <<
b
i
Para T=16 s el modelo se reduce prácticamente a uno de primer orden.
La elección del periodo de muestreo T determina también el valor de la frecuencia de Nyquist N la cual se define de la siguiente forma:
N
S 2
T
(4.46)
La frecuencia de Nyquist establece la frecuencia más alta que puede contener una señal antes de que aparezca el fenómeno del aliasing. Este fenómeno consiste en el plegamiento de la función de densidad espectral de la señal para frecuencias mayores que la frecuencia de Nyquist. Es decir, que debido al fenómeno del aliasing las frecuencias en la señal más altas que la frecuencia de Nyquist son consideradas erróneamente como frecuencias más bajas. Para evitar el aliasing se recomienda usar un filtro antialiasing antes de muestrear la salida del proceso (ver Figura 4.19). Un filtro antialiasing es un filtro analógico de tipo pasabajas cuya frecuencia de corte se fija en la frecuencia de Nyquist.
Figura 4.19: Localización del filtro antialiasing
Obviamente si se utiliza un filtro antialiasing el modelo que se identifique a partir de los datos de entrada {u(k)} e {y(k)} incluirá también la dinámica del filtro.
4.5 TRATAMIENTO DE LOS DATOS Antes de iniciar el proceso de identificación es necesario realizar un tratamiento de los datos de entrada-salida medidos experimentalmente. Dicho tratamiento consta de las siguientes acciones: filtrado, eliminación de valores medios y detección de outliers.
4-27
TEMA 4: Diseño de experimentos y tratamiento de datos
Siempre hay que analizar si es necesario llevar a cabo cada una de estas acciones. Dependiendo de la calidad de los datos de que se dispongan pueden ser necesario realizar todas, alguna o ninguna de estas acciones.
4.5.1 Filtrado de los datos El filtrado de los datos de entrada-salida (u(t), y(t)) consiste en diseñar un filtro digital L(q) que puede ser un polinomio o una función racional del operador desplazamiento q que se aplica tanto a los datos de entrada u(t) como a los de salida y(t) (ver Figura 4.20):
y F (t ) L( q )· y (t ) u F (t ) L( q )·u(t )
(4.47)
Los datos de entrada-salida filtrados (u F(t), yF(t)) son los que se utilizan para identificar el modelo.
Figura 4.20: Filtrado de los datos de entrada-salida
Señalar que en la literatura L(q) recibe el nombre de prefiltro y a (uF(t), yF(t)) se les denomina datos prefiltrados. Asimismo a la operación de filtrar los datos de entrada/salida a través del filtro L(q) se le denomina operación de prefiltrado de datos . El diseño del filtro L(q) se realiza con el objetivo de conseguir uno o varios de los siguientes objetivos:
Eliminación del comportamiento no estacionario. Eliminación de las perturbaciones de alta frecuencia. Enfatizar el rango de frecuencias donde se desea que el ajuste del modelo a los datos experimentales sea mejor .
4-28
Identificación de sistemas
En las siguientes subsecciones se describe el diseño de un prefiltro para la consecución de cada uno de los objetivos enumerados. Se deja para la sección 6.4.3 la descripción del efecto que tiene el uso de un prefiltro sobre el espectro del error de predicción filtrado. Además en la sección 9.5 se describirá el diseño de un prefiltro para la identificación relevante para control.
4.5.1.1 Eliminación del comportamiento no estacionario Las derivas y/o tendencias en el valor medio o/y en la pendiente características de una serie temporal no estacionaria aparecen en el dominio de la frecuencia como componentes de baja frecuencia. En consecuencia si los datos presentan un comportamiento no estacionario, éste se puede eliminar filtrando los datos con un filtro pasa-alta, el cual atenúa las componentes de baja frecuencia existente en los datos. El filtro pasa-alta más simple es el diferenciador . Por ello la no estacionaridad de una serie temporal se puede eliminar diferenciando la señal d veces, tal y como se describió en la sección 2.6.5. En el caso de los datos de entrada-salida la diferenciación se realiza de la siguiente forma: 1 yF (t ) y (t ) y (t 1) (1 q ) y (t )
1 uF (t ) u (t ) u (t 1) (1 q ) u (t )
(4.48)
Luego el filtro L(q) que implementa la operación de diferenciación toma la forma: L( q) (1 q ) 1
(4.49)
Que se puede expresar equivalentemente en la forma:
L( z )
z 1 z
(4.49)
Si se representa su diagrama de Bode puede comprobarse que L(z) tiene un comportamiento de filtro pasa-alta. En Matlab existen varias funciones que dados los coeficientes del filtro realizan el filtrado de una señal. Este es el caso por ejemplo de la función f i l t er de la toolbox de procesamiento de señales.
4-29
TEMA 4: Diseño de experimentos y tratamiento de datos
Ejemplo 4.4: La función f i l t er de Matlab presenta la siguiente sintaxis:
v=f i l t er ( B, A, x) ; Donde x es la señal a filtrar, v es la señal filtrada, A y B son los coeficientes del filtro L(q) de acuerdo a la siguiente ecuación:
a1 ·v n
b1 · xn b2 · xn1 ... bnb1 · xnnb a 2 ·vn1 ... a na 1 ·vnna
Por ejemplo, para diferenciar una vez los datos de entrada y salida habría que ejecutar los siguientes comandos:
yf =f i l t er ( [ 1 - 1] , 1, y) ; uf =f i l t er ( [ 1 - 1] , 1, u) ;
4.5.1.2 Eliminación de las perturbacio nes de alta frecuencia Si el filtro antialiasing no ha sido diseñado correctamente o el periodo de muestreo no se ha elegido bien, entonces los datos pueden presentar ruido de alta frecuencia. Para eliminarlo se puede diseñar un filtro L(q) de tipo pasa-baja que atenúa las componentes de alta frecuencia.
4.5.1.3 Enfatizar el rango de frecuencias donde se desea que el ajust e del modelo a los datos experimentales sea mejor Para enfatizar el rango de frecuencias donde se desea que el modelo presente un mejor ajuste se debe usar un filtro pasa-banda. Usando un filtro de este tipo se consigue también eliminar el comportamiento no estacionario asociado a componentes de baja frecuencia y el ruido de alta frecuencia. La función i df i l t de la toolbox SITB permite implementar el filtrado de datos a través de filtros pasabanda de tipo Butterworth, de orden 5 por defecto.
Ejemplo 4.5 La función i df i l t de Matlab presenta la siguiente sintaxis:
zf =i df i l t ( z , f i l t er ) ;
4-30
Identificación de sistemas
Donde zf son los datos filtrados, z los datos de entrada-salida y f i l t er es la especificación del filtro la cual puede hacerse de diferentes formas. Por ejemplo, para implementar un filtro pasa-banda en el rango de frecuencias [7.5, 22.5] (rad/s) se debería ejecutar el siguiente comando
z f = i df i l t ( z , [ 7. 5, 22. 5] ) ;
Ejemplo 4.6 Como se estudiará en el Tema 6 un modelo paramétrico de tipo ARX se ajusta con un énfasis en el comportamiento de alta frecuencia presente en los datos de entrada-salida, lo cual no es deseable en general. Este efecto puede ser compensado prefiltrando los datos con un prefiltro L(q) de tipo pasabaja o pasa-banda. Un método bastante útil y sencillo para diseñar este prefiltro consiste en obtener un modelo ARX usando los datos originales (u(t),y(t)). Supóngase que el modelo ARX identificado es
A1 ( q) y (t ) B1 ( q )u( t nk ) e(t ) El prefiltro se define entonces como:
L( q)
1 A1 ( q)
4.5.2 Eliminación de valores medios En la identificación de sistemas lineales, los valores medios en los datos de entrada salida deben ser eliminados ya que pueden contribuir al error de sesgo en las estimas de los parámetros (ver sección 6.4.3). No sucede así en la identificación de sistemas no lineales donde los valores medios son importantes y no deben ser eliminados, ya que de lo contrario se introduce error de sesgo. Una forma de eliminar los valores medios de los datos de entrada/salida es fijar una tendencia polinomial a la entrada y la salida mediante regresión lineal
y * ( t ) m0 m1t ... mr t r u* ( t ) n0 n1t ... ns t s y después calcular los datos eliminando las tendencias:
4-31
TEMA 4: Diseño de experimentos y tratamiento de datos
y ( t ) y ( t ) y * ( t ) u ( t ) u ( t ) u * ( t ) Es a estos datos a los que se aplica el algoritmo de identificación. Si los grados r y s son cero el procedimiento consiste simplemente en calcular los valores medios de las señales
y
u
*
*
1 N
1 N
N
y( t ) t 1
N
u(t ) t 1
y sustraerlos de las medidas. Con valores de r >0 y s>0 se modela una tendencia polinomial. En Matlab la función det r end de la SITB permite eliminar los valores medios y las tendencias lineales de los datos de entrada/salida.
Ejemplo 4.7 Se van a considerar como datos de entrada/salida los suministrados a modo de ejemplo en el fichero
dr yer 2. mat de la toolbox SITB de Matlab. En la Figura 4.21a se representan las series temporales de la entrada y salida originales. Se observa que tanto la entrada como la salida presentan un valor medio no nulo. En la Figura 4.21b se representan las mismas series temporales pero con los valores medios eliminados. y1
y1
7
2
6
1
5
0
4
−1
3
0
10
20
30
40
50
60
70
80
−2
0
10
20
30
u1 2
6
1
5
0
4
−1
0
10
20
30
40
50
60
70
80
50
60
70
80
u1
7
3
40
50
60
70
80
−2
0
10
20
(a)
30
40
(b)
Figura 4.21: Representación gráfica de las series temporales de entrada y salida: (a) Originales. (b) Tras eliminar los valores medios.
4-32
Identificación de sistemas
La secuencia de comandos de Matlab necesaria para obtener estas figuras es la siguiente:
l oad dr yer 2 Ts=0. 08; %Per i odo de muest r eo dat os0 = i ddat a( y2, u2, Ts) ; f i gur e ( 1) pl ot ( dat os0) dat os1=det r end( dat os0) ; f i gur e ( 2)
pl ot ( dat os1) También se observa que la entrada es una señal RBS o PRBS (sólo puede saberse si es una PRBS si se tiene un registro suficientemente largo de datos donde pueda observar su periodicidad) y que no parece existir ruido de alta frecuencia ya que ni la entrada ni la salida poseen fluctuaciones pequeñas y rápidas en sus valores temporales.
Señalar que con este método se pueden eliminar tanto valores medios como tendencias de tipo polinomial, por lo que si una señal no estacionaria presenta tendencias de este tipo pueden ser eliminadas usando este método sin necesidad de diferenciarla previamente.
4.5.3 Detección de outliers Cuando se realizan los experimentos ocurre a veces que hay grandes errores en las medidas. Estos errores, denominados outliers, pueden estar causados por perturbaciones, errores en las transmisiones de datos, fallos en la conversión, etc. Es importante detectar y eliminar esos errores antes de analizar los datos, ya que su influencia cambiará en gran medida los resultados de la identificación. Los outliers aparecen como picos en la secuencia de errores de predicción o residuos, que como se estudiará en el Tema 6, se definen como la diferencia entre la salida y medida experimental y la salida estimada yˆ por el modelo:
k
y k yˆ k
k 1,..., N
Una forma bastante usual de tratar los outliers es hacer un test de presencia de outliers y ajustar los datos erróneos. En este caso se obtiene un modelo ajustando los datos sin prestar atención a los outliers. Después se obtienen los residuos k y se representan gráficamente. Se detecta la existencia de posibles picos en la secuencia k . Si por ejemplo
4-33
TEMA 4: Diseño de experimentos y tratamiento de datos
algún valor | k | para algún cierto valor j es anormalmente grande entonces el dato j de la salida medida experimental y j se modifica. Una modificación sencilla es tomar
y j
0.5· y j 1 y j 1
Otra posibilidad es tomar como valor y j el valor estimado:
y j
yˆ j
La secuencia de valores obtenida haciendo las sustituciones anteriores se utiliza para obtener un nuevo modelo.
BIBLIOGRAFÍA [Davies, 1970]
W. D. T. Davies. System Identification For Self-Adaptative Control. Wiley Interscience. 1970.
[Godfrey, 1993]
K. Godfrey. Perturbation Signals For System Identification . Prentice Hall. 1993.
[Godfrey et al., 1999]
K. Godfrey, H. A Barker, A. J. Tucker. Comparison of perturbation signals for linear system identification in the frequency domain. IEE Proceedings of Control Theory and Applications. Vol. 146 , No. 6, pp. 535 – 548. 1999.
[Guillaume et al, 1991]
P. Guillaume, J. Schoukens, R. Pintelon, factor
minimization
approximation
using
methods.
I. Kollar. Crest-
nonlinear
IEEE
Chebyshev
Transactions
on
Instrumentation and Measurement, Vol: 40 , No 6, pp. 982989. 1991. [Ljung y Glad, 1994]
L. Ljung y T. Glad. Modelling of dynamic systems. Prentice Hall. 1994.
[Ljung, 1999]
nd
L. Ljung. System Identification: Theory for the user . 2 Edition. Prentice Hall.1999.
[Ljung, 2010]
L. Ljung. System Identification Toolbox 7. The Mathworks. 2010.
4-34
Identificación de sistemas
[Rivera, 1992]
D. E. Rivera. Monitoring tools for PRBS testing in system identification. Paper 131d, AIChE Nationa Meeting, Miami Beach. 1992.
[Rivera et al., 1993]
D. E Rivera, X. Cheng, D. S. Bayard. Experimental design for robust process control using Schroeder-phased input signals. Proceeding of American Control Conference 1993. Pp. 895 – 899. 1993.
[Rivera et al., 2003]
D. E Rivera, L. Hyunjin, W. B. Martin, H. Mittelmann. “PlantFriendly” system identification : a challenge for the process th
industries. Proceeding of 13 IFAC Symposium on System Identification (SYSID 2003). 2003. [Rivera, 2007]
D. E. Rivera. Introducción a la Identificación de Sistemas . Curso impartido en el Dpto. de Informática y Automática de la UNED del 17-28 de septiembre de 2007.
[Rivera et al., 2007]
D. E. Rivera, H. Lee, H. D Mittelmann, M. W. Braun. Highpurity distillation using plant-friendly multisine signals to identify a strongly interactive process. Control Systems Magazine, IEEE Vol. 27 ,No : 5 pp.72-89. 2007.
[Schroeder, 1970]
M. Schroeder. Synthesis of low-peak-factor signals and binary sequences with low autocorrelation (Corresp.), IEEE Transactions on Information Theory. Vol. 16. No.1.pp. 85 89. 1970.
4-35
TEMA 5 IDENTIFICACIÓN DE MODELOS NO PARAMÉTRICOS
5.1 INTRODUCCIÓN Un modelo de un sistema se considera no paramétrico si viene expresado en forma de tabla o gráfica. Este tipo de modelos no pueden ser usados de forma directa para simulación. Pese a esta limitación los modelos no paramétricos pueden aportar información importante sobre las características temporales o frecuenciales del sistema que puede ser utilizada en la etapa de estimación o validación de modelos paramétricos. Considérese el sistema representado en la Figura 5.1, que posee una entrada u(t), una salida y(t) y está sometido a una perturbación v(t).
Figura 5.1: Sistema a identificar
Supóngase que se disponen de N muestras (con periodo de muestreo T unidad) de la señal de entrada { u(t)} t=1,2,...,N y de la señal de salida { y(t)}. Si se supone que el sistema es lineal e invariante en el tiempo discreto de forma general dicho sistema se puede expresar mediante la siguiente ecuación:
5-1
TEMA 5: Identificación de modelos no paramétricos
y(t ) G ( q )·u(t ) v(t )
(5.1)
donde G(q) es la función de transferencia del sistema G(q)
g (k )·q
k
(5.2)
k 1
expresada en términos del operador desplazamiento q q 1 ·u(t ) u(t 1)
(5.3)
Los números {g(k)} son denominados la respuesta a un impulso del sistema. Obviamente, g(k) es la salida del sistema en el instante k si la salida es un impulso (pulso) en el instante cero. A partir de la respuesta a un impulso se puede obtener la respuesta a un escalón. Por otra parte, la función de transferencia evaluada sobre el circulo unidad ( q=ei) genera la función de la frecuencia i G(e )
(5.4)
En (5.1) el término v(t) es una perturbación estocástica no medible (ruido). Sus propiedades pueden ser expresadas mediante su espectro de potencia
v ( )
(5.5)
que se define mediante
v ( )
R ( )·e
i · ·t
v
(5.6)
donde Rv() es la función de covarianza de v(t): Rv ( ) E [ v(t )·v(t )]
(5.7)
Alternativamente, se puede considerar que la perturbación v(t) se obtiene filtrando ruido blanco e(t) de media nula y varianza a través de un filtro H(q) v(t ) H ( q )·e(t )
5-2
(5.8)
Identificación de sistemas
En ese caso el espectro de potencia de v(t) toma la siguiente forma (ver sección 2.7): 2
v ( ) · H (ei )
(5.9)
Si se sustituye (5.8) en (5.1) se obtiene y(t ) G ( q )·u(t ) H ( q )·e(t )
(5.10)
Esta ecuación da la descripción en el dominio temporal del sistema mientras que G(ei) y v() constituyen su descripción en el dominio frecuencial. Tanto la respuesta a un impulso {g(k)} (o a un escalón) como la función de frecuencia del sistema G(ei) son una colección de puntos que pueden ser representados en una gráfica o recopilados en una tabla. Se trata por lo tanto de modelos no paramétricos del sistema. Lo mismo ocurre con el espectro de la perturbación del sistema v(). La respuesta a un impulso {g(k)} (o a un escalón) de un sistema permite obtener información sobre la constante de tiempo y el retardo del sistema. Así como sobre la ganancia en el estado estacionario. Los dos métodos más utilizados para obtener una estima de la respuesta a un impulso de un sistema son:
Análisis del transitorio. Se trata de un método empírico que consiste en excitar al sistema con un impulso (o pulso) o un escalón y registrar la respuesta que es la que se estudia para obtener la información deseada.
Análisis
de correlación. Consiste en obtener una estima de la respuesta a un
impulso del sistema usando las estimas de las funciones de correlación cruzada calculada a partir de los datos de entrada-salida del sistema. La función de frecuencia G(e j) del sistema proporciona información sobre el comportamiento en frecuencia del sistema: si amplifica o atenúa, filtrado de frecuencias, rango de frecuencias de interés, etc. Los tres métodos más utilizados para obtener una estima de la respuesta en frecuencia del sistema son:
Análisis de frecuencia. Se trata de un método empírico que consiste en excitar al sistema con una sinusoide pura a diferentes frecuencias. Supuesto que el sistema también es lineal la salida será otra sinusoide desfasada. A partir de los datos de la magnitud y la fase de la entrada y de la salida a una determinada frecuencia se
5-3
TEMA 5: Identificación de modelos no paramétricos
puede obtener la magnitud y la fase de la función de frecuencia a dicha frecuencia.
Análisis de Fourier . Consiste en generar una estima de la función de frecuencia del sistema a partir de las transformadas de Fourier de la entrada y de la salida del sistema. A la estima obtenida de esta forma se le denomina estima de la función de frecuencia empírica o ETFE (Empirical Transfer Function Estimate).
Análisis espectral. Consiste en generar una estima de la función de frecuencia del sistema a partir del cálculo de las estimas de los espectros de potencia de la entrada y la salida, y del espectro de potencia cruzada entre la entrada y la salida. Dicho espectros se estiman a su vez a partir de las funciones de correlación asociadas que se calculan a partir de los datos de entrada-salida. Este método también permite obtener una estima del espectro de potencia de la perturbación. Este tema está dedicado a describir las características básicas de los principales métodos utilizados para obtener una estima de la respuesta a un impulso y de la función de frecuencia de un sistema, que son modelos no paramétricos del sistema. En primer lugar se describen los métodos para obtener una estima de la respuesta a un impulso: el análisis del transitorio y el análisis de correlación. A continuación se describen los métodos para obtener una estima de la función de frecuencia del sistema: el análisis de frecuencia, el análisis de Fourier y el análisis espectral.
5.2 ANÁLISIS DEL TRANSITORIO Se denomina análisis del transitorio al estudio de la respuesta de un sistema excitado con una entrada impulso (o pulso) o una entrada escalón. De dicho análisis se puede obtener la siguiente información:
Variables del sistema afectadas por la entrada . Esto simplifica la obtención de diagramas de bloques del sistema y la decisión sobre que influencias pueden ser despreciadas.
Constante de tiempo dominante del sistema . Lo que posibilita decidir que relaciones en el modelo pueden ser descritas como estáticas, es decir, tienen constantes de tiempo significativamente más rápidas que la escala de tiempo con la que estemos trabajando.
5-4
Identificación de sistemas
Retardo existente entre la salida y la entrada . Es decir, el tiempo que transcurre desde que se excita el sistema hasta que este responde.
Característica (oscilatoria, subamortiguada, amortiguamiento crítico, monótona,...) de la respuesta a un escalón y magnitud de la ganancia en el estado estacionario . Esta
información resulta de gran utilidad en la validación del modelo paramétrico identificado. En general el análisis del transitorio es un método excelente para conseguir de forma rápida y sencilla información relevante del sistema, como por ejemplo: constante de tiempo, retardo y ganancia estática. El análisis del transitorio es uno de los métodos de identificación más ampliamente usados de forma práctica en la industria. Nótese que con la información que se obtiene con este método es posible construir un modelo de primer orden del sistema, lo que en algunas ocasiones resulta suficiente. Una desventaja de este método es que la información que proporciona sobre el sistema es limitada. Por otra parte los límites prácticos existentes en la amplitud de la entrada, junto con las perturbaciones y los errores de medida pueden dificultar la obtención de esta información con un grado razonable de precisión.
0.6
0.8
0.5
0.7
0.4 0.6 0.3 0.5
0.2 0.1
0.4
0
0.3
-0.1 0.2 -0.2 0.1
-0.3 -0.4 0
5
10 15 Tiempo (segundos)
(a)
20
25
0 0
5
10 15 Tiempo (segundos)
20
25
(b)
Figura 5.2. Respuesta medida experimentalmente a un impulso y a un escalón de un cierto sistema
5-5
TEMA 5: Identificación de modelos no paramétricos
Ejemplo 5.1: En la Figura 5.2 se muestra la respuesta de un sistema medida experimentalmente a un impulso y a un escalón. Del análisis de las mismas se puede deducir que no parece existir retardo entre la entrada y la salida. Se observa que la respuesta es subamortiguada, por lo que podría probarse a modelar el sistema con un modelo de segundo orden. Además se observa que la ganancia en el estacionario tiende a 0.5. También podrían estimarse otros parámetros del sistema como el tiempo de subida o el tiempo de asentamiento.
5.3 ANÁLISIS DE CORRELACIÓN No es necesario usar un impulso como entrada para estimar directamente la respuesta a un impulso de un sistema. Supóngase un sistema en tiempo discreto cuya respuesta a un impulso {gk} viene dada por la siguiente expresión: y(t )
g ·u(t k ) v(t )
(5.11)
k
k 0
Sea {u(t)} una señal que es una realización de un proceso estocástico con valor medio cero y función de covarianza Ru(): Ru ( ) E [u(t )·u(t )]
(5.12)
Supóngase que {u(t)} y {v(t)} no están correlacionadas, lo que implica que el sistema está en lazo abierto. La función de covarianza cruzada entre la entrada u y la salida y se determina de la siguiente forma: R yu ( ) E [ y(t )·u(t )]
(5.13)
Sustituyendo (5.11) en (5.13) y desarrollando se obtiene la siguiente expresión: R yu ( )
g · E [u(t k )·u(t )] E [v(t )·u(t )] g · R ( k ) k
k
k 0
u
k 0
Si la entrada u(t) es ruido blanco entonces su función de covarianza es:
si 0 Ru ( ) 0 si 0 5-6
(5.14)
Identificación de sistemas
donde es la varianza. Además la función de covarianza cruzada (5.14) entre la entrada y la salida es R yu ( ) ·g
(5.15)
Se observa que la función de covarianza cruzada es proporcional a la respuesta a un impulso. Por supuesto esta función no es conocida, pero puede ser estimada a partir de los datos experimentales de la entrada y la salida del sistema mediante la siguiente expresión:
1 N N ˆ R yu ( ) · y(t )·u(t ) N
(5.16)
t 1
Usando este estimador y de acuerdo con la expresión (5.15), es posible obtener la siguiente estima para la respuesta a un impulso N
gˆ
1
N ( ) · Rˆ yu
(5.17)
Si la entrada u(t) no es ruido blanco, se puede filtrar la secuencia de datos de la entrada usando un filtro de blanqueo L(q) tal que la secuencia filtrada (ver sección 4.5.1): u F (t ) L( q )·u(t )
(5.18)
se pueda considerar aproximadamente ruido blanco. El filtro de blanqueo L(q) a menudo se calcula describiendo u(t) como un proceso AR A( q )·u(t ) e(t )
Nótese que L(q)=A(q). Este polinomio se estima usando el método de los mínimos cuadrados (se explica en el Tema 6). Si se filtra la señal de entrada a través de L(q), entonces también hay que filtrar la secuencia de salida y y F (t ) L( q )· y(t )
(5.19)
De esta forma la estima de la función de covarianza cruzada se calcula usando los datos filtrados
5-7
TEMA 5: Identificación de modelos no paramétricos
1 N N ˆ R y u ( ) · y F (t )·u F (t ) N
F F
(5.20)
t 1
Calculando además la estima de la varianza de la entrada:
1 N 2 ˆ N · u F (t ) N
(5.21)
t 1
la estima para la respuesta a un impulso usando la expresión se calcula mediante la siguiente expresión Rˆ y F uF ( ) N
gˆ
N
ˆ N
(5.22)
Dados unos datos de entrada u(k) y salida y(k), k=1,...,N, cuyos valores medios han sido eliminados:
y ( k ) y ( k )
1 N
N
y(t );
u ( k ) u( k )
t 1
1
N
u(t );
N t 1
1. Filtrar las señales usando un filtro de blanqueo.
y F ( k ) L( q )· y (t );
u F ( k ) L( q )·u (t );
2. Calcular la estima de la función de covarianza entre la entrada y la salida.
Rˆ y F uF ( ) N
1
N
y
·
N
F
(t )·u F (t )
t 1
3. Calcular la estima de la varianza de la entrada.
1 N 2 ˆ N · u F (t ) N
t 1
4. Calcular la estima de la respuesta a un impulso.
gˆ
N
Rˆ y N F uF ( )
ˆ N
Cuadro 5.1. Pasos del análisis de correlación
5-8
Identificación de sistemas
Si se conoce la estima de la respuesta a un impulso es sencillo calcular la estima de la respuesta a un escalón unidad usando (5.2) y (5.1). Puesto que la decisión de blanquear las secuencias se realiza tras estudiar la función de correlación de la entrada, a este procedimiento de obtención de la estima de la respuesta a un impulso también se le conoce como análisis de correlación . En el Cuadro 5.1 se resumen los principales pasos del análisis de correlación. La función cr a (correlation analysis) de la toolbox SITB de Matlab implementa este análisis. Otra forma de obtener una estima de la respuesta a un impulso es usando un modelo FIR (ver sección 6.2.2). Este método es implementado por la función i mpul se de la toolbox SITB de Matlab. Para obtener una estima de la respuesta a un escalón se puede usar la función step de esta toolbox.
Ejemplo 5.2: Se van a considerar como datos de entrada/salida los suministrados a modo de ejemplo en el fichero
dr yer 2. mat de la toolbox SITB de Matlab. En la Figura 5.3 se muestra la respuesta estimada a un impulso y a un escalón usando la función cr a. De estas figuras se puede extraer información relativa al retardo del sistema, el tipo de respuesta y la ganancia estacionaria. En la respuesta estimada a un impulso se observa que el sistema presenta un retardo de tres muestras. En la respuesta estimada a un escalón se confirma la existencia de este retardo y se deduce además que la respuesta del sistema es sobreamortiguada con un valor aproximado de la ganancia en el estacionario de 0.88. Step response estimate
Impulse response estimate 0.9
2
0.8 0.7
1.5
0.6 0.5
1
0.4 0.3
0.5
0.2 0.1
0
0
−0.5 0
5
10 lags
(a)
15
20
−0.1 0
5
10
15
20
25
lags
(b)
Figura 5.3. Respuesta estimada a un impulso (a) y a un escalón (b)
5-9
TEMA 5: Identificación de modelos no paramétricos
La secuencia de comandos de Matlab utilizada para obtener estas figuras es la siguiente:
l oad dr yer 2 Ts=0. 08; %Per i odo de muest r eo dat os0 = i ddat a( y2, u2, Ts) ; %El i mi naci ón de val or es medi os dat os1=det r end( dat os0) ; %Sel ecci onar l os pr i mer os 500 punt os par a est i mar . d_est =dat os1( 1: 500) ; %Est i mar l a r espuest a a un i mpul so medi ant e anál i si s de cor r el aci ón f i gur e ( 1) i r =cra(d_est , 20, 10, 1) ; %Cal cul ar l a r espuest a a un escal ón a par t i r de l a r espuest a a un i mpul so f i gur e ( 2) sr =cumsum( i r ) ; pl ot ( s r , ' o' ) ; xl abel ( ' l ags' ) ; t i t l e( ' St ep r es pons e es t i mat e' ) ;
Las propiedades básicas del análisis de correlación se pueden resumir en los siguientes puntos:
El resultado del análisis de correlación son modelos no paramétricos que no se pueden utilizar para simulación directamente.
Al igual que sucedía con el análisis del transitorio permite estimar de forma rápida las constantes de tiempo, los retardos o las ganancias estacionarias del sistema.
Para su realización no es necesario disponer de datos de entrada- salida del sistema obtenidos con una entrada con un alto grado de excitación (PRBS, multiseno,...). De hecho se pueden utilizar incluso señales con una razón señal-ruido pequeña siempre y cuando se disponga de un número de puntos N suficientemente grande.
El análisis de correlación, como se describe aquí, presupone que la entrada no está correlacionada con las perturbaciones. Esto significa que este análisis no funcionará correctamente cuando los datos son tomados de un sistema en lazo cerrado, es decir, con realimentación de su salida.
Permite detectar la existencia de realimentaciones en los datos (ver sección 6.6.2).
5-10
Identificación de sistemas
5.4 ANÁLISIS DE FRECUENCIA Un sistema lineal queda determinado de forma única por su respuesta a un impulso o por su respuesta en frecuencia G(i ) (la transformada de Laplace de la respuesta a un impulso evaluada en s=i ) o G(e j) si el sistema ha sido muestreado. Una posible forma de estimar la respuesta en frecuencia G(i ) es usando el método del análisis en frecuencia que se describe a continuación Si un sistema lineal con función de transferencia G(s) se excita con una entrada de tipo sinusoidal (o cosenoidal) u(t ) u0 ·cos( ·t )
(5.23)
entonces la salida en el estacionario es también de tipo sinusoidal y(t ) y0 ·cos( ·t )
(5.24)
donde
G(i ) ·u0
(5.25)
arg G(i )
(5.26)
y0
Excitando al sistema con una entrada sinusoidal de amplitud u 0 a diferentes frecuencias
i i=1,...,N y midiendo las fases i y las amplitudes yi de la salida es posible obtener la magnitud |G(ji)| y la fase argG(j i) del sistema a las diferentes frecuencias i usando las expresiones anteriores. Se puede construir así una tabla [ i, |G(ji)|, argG(ji)] o representaciones gráficas del modulo y de la fase de G frente a la frecuencia. Se tiene por lo tanto una estima en forma de tabla o gráfica de la función G(j ). Al método descrito de obtención de una estima de la función G(j ) se le conoce como análisis de frecuencia .
Ejemplo 5.3 En la Figura 5.4 se muestran representados en un diagrama de Bode los puntos de magnitud (en decibelios) y de fase (en grados) a catorce frecuencias de la función de transferencia de un cierto sistema que han sido estimados mediante análisis de frecuencia.
5-11
TEMA 5: Identificación de modelos no paramétricos
Diagrama de Bode de Gp(we) a velocidad 20 nudos 10 ) B d (
0
d u t i n g -10 a M
-20 -1 10
10
0
10
1
200 100 ) g 0 e d ( e s -100 a F
-200 -300 -1 10
0
10 Frecuencia de encuentro we (rad/s)
10
1
Figura 5.4. Estima de la función de transferencia de un cierto sistema usando análisis de frecuencia
El análisis de frecuencia proporciona un modelo no paramétrico de la respuesta en frecuencia de un sistema. Aunque también es posible usar la información que proporciona para estimar un modelo paramétrico, tal y como se describirá en la sección 7.4.2. El análisis de frecuencia tiene las siguientes propiedades básicas:
Es fácil de implementar y no requiere de un procesamiento complicado de los datos.
Para su aplicación no es necesario realizar ninguna suposición acerca de la estructura del sistema, excepto que debe ser lineal.
Es fácil concentrarse en rangos de frecuencia de especial interés, como por ejemplo las frecuencias de resonancia.
Proporciona como resultado básico un modelo no paramétrico en forma de tabla o de gráfica de N puntos de magnitud y fase de la función G(j ). Como el resto de modelos no paramétricos no pueden usarse de forma directa para simulación.
El análisis de frecuencia implica la realización de un número de experimentos sobre la planta igual o superior al número de frecuencias para los que se desea
5-12
Identificación de sistemas
estimar G(j). Debe recordarse (ver sección 4.2.3) que muchos sistemas, especialmente los usados en la industria de procesos, no pueden ser usados libremente para la realización de cualquier tipo de experimentos.
5.5 ANÁLISIS DE FOURIER Sea un sistema lineal que puede ser descrito mediante la función de transferencia G(s). Si la entrada tiene energía finita, entonces se cumple la siguiente relación entre la entrada y la salida del sistema: Y ( ) G (i )·U ( )
(5.27)
Donde Y() y U() son las transformadas de Fourier de la entrada y la salida, respectivamente. Si se conocieran Y( ) y U() entonces la función G(i ) podría ser calculada despejándola de la expresión anterior: G (i )
Y ( ) U ( )
(5.28)
Normalmente, se dispone de información sobre la entrada u(t) y la salida y(t) durante un intervalo finito de tiempo 0 t S. Las transformadas de Fourier de la entrada y la salida en dicho intervalo se pueden calcular a través de las siguientes expresiones: S
YS ( )
y(t)·e
S
it
U S ( ) u( t)· e i t · dt
· dt
0
(5.29)
0
Con lo que se puede construir la siguiente estima de la función de frecuencia:
ˆ
Gˆ N ( j )
Y N ( ) U N ( )
(5.30)
A (5.30) se le denomina estima de la función de transferencia empírica o ETFE (Empirical Transfer Function Estimate) ya que se construye directamente a partir de los datos experimentales sin ninguna otra suposición sobre el sistema salvo que es lineal. Si la entrada es u(t ) u0 ·cos( *t )
(5.31)
5-13
TEMA 5: Identificación de modelos no paramétricos
de acuerdo con (5.29) su transformada de Fourier es U S ( )
u0· S
S
2
k ·
*
;
k 1, 2,...
(5.32)
Aplicando (5.30) se obtiene la siguiente expresión para la ETFE:
2 ˆ ( )·cos( · )· ( )· ( · )· Gˆ S ( j * ) y t t dt j y t sen t dt * * u0 ·S 0 0 S
S
(5.33)
Si únicamente se dispone de valores muestreados de la entrada u y la salida y, (u(kT),y(KT)), k=1,...,N, lo cual suele ser lo habitual, entonces se utilizan las siguientes aproximaciones para las transformadas de Fourier de la entrada y la salida: Y N ( )
1
N
y(kT )·e N ·
ikT
,
1
N
u( kT )· e N
U N ( )
k 1
·
i kT
(5.34)
k 1
donde T es el periodo de muestreo y S=N·T. Nótese que estas expresiones pueden ser calculadas eficientemente en =r·2/N, r=0,...,N-1, usando la transformada rápida de Fourier o FFT (Fast Fourier Fransform). N se ajusta para que sea una potencia de 2. Se puede demostrar [Ljung y Glad, 1994] que una cota para el error existente en la ETFE respecto a la G(i ) real viene dada por la siguiente expresión:
2·cu ·c g | V ( ) | ˆ | Gˆ S ( j ) G( j ) | S | U S ( ) | | U S ( ) |
(5.35)
donde VS() es la transformada de Fourier de la perturbación v(t) sobre el intervalo [0,S]. Además se debe cumplir que: u(t )
cu
g ( ) ·d c
g
0
Para una señal con energía infinita la transformada de Fourier típicamente tiene la siguiente magnitud
| U S ( ) | S ·const 5-14
Identificación de sistemas
En el caso de un sinusoide pura con frecuencia 0 entonces
| U S (
0
) | S ·const
Analizando la expresión (5.35) se concluye que si la entrada contiene sinusoides puras (y la señal de perturbación no) la función de transferencia puede ser estimada a través de la ETFE con una precisión arbitraria en las frecuencias de las sinusoides, cuando el intervalo de tiempo tiende a infinito. Para entradas que no contienen sinusoides puras, la ETFE tiene un error para S grandes que es igual a la razón V S()/US() entre el ruido y la señal para la frecuencia en cuestión. Además el hecho de que en la práctica se usan señales en tiempo discreto en vez de señales en tiempo continuo introduce discrepancias adicionales entre la ETFE y la función de transferencia real además del error que indica la expresión (5.35). Para periodos de muestreo T pequeños en comparación con la dinámica del sistema, estas discrepancias adicionales suelen ser pequeñas. El análisis de Fourier tiene las siguientes propiedades básicas:
Es fácil y eficiente de usar (especialmente si se utiliza la FFT). La ETFE es una estima bastante buena de la función de frecuencia G(j) si se usan sinusoides puras como entradas. En caso contrario, la ETFE fluctúa bastante, con lo que únicamente proporciona una aproximación bastante grosera de la función real. El comando e t f e de la toolbox SIT de Matlab permite calcular la ETFE a partir de los datos de entrada-salida de un sistema.
Ejemplo 5.4 En la Figura 5.5 se muestra el diagrama de Bode (en línea punteada) de la función de transferencia G(i) real de un cierto sistema y la ETFE (en línea continua) construida a partir de datos de entradasalida del sistema. Se observa como la ETFE supone una estima bastante razonable de la función de transferencia G(i) hasta aproximadamente =0.8 rad/s. Por encima de este valor oscila bastante y no es una estima fiable.
5-15
TEMA 5: Identificación de modelos no paramétricos
From u1 to y1
0
10
e d u t i l p m A
−2
10
−2
−1
10
) s e e r g e d (
0
10
1
10
10
0 −500
e s a −1000 h P
−1500 −2 10
−1
0
10
1
10
10
Frequency (rad/s)
Figura 5.5. Función de transferencia real (línea punteada) de un cierto sistema y ETFE (línea continua)
5.6 ANALISIS ESPECTRAL 5.6.1 Periodograma Basándose en la definición del espectro de potencia o función de densidad espectral de una señal u dada en la sección 2.5.4 una estima natural del mismo es la siguiente:
1
ˆˆ N u ( ) ·| U N ( ) |2 , N
2· ·k N
, k 1, 2,..., N
(5.36)
donde U N ( )
N
u(k ) e
i k
(5.37)
k 1
ˆˆ A la estima N ( ) de la función de densidad espectral de una señal se le denomina periodograma .
5-16
Identificación de sistemas
La representación gráfica del periodograma de una señal de forma general suele presentar las siguientes propiedades: 1) Los armónicos de la señal (sinusoides puras) se manifiestan en la representación gráfica del periodograma como picos pronunciados. 2) El periodograma fluctúa bastante (alta variabilidad) 3) Suavizar a ojo la representación gráfica del periodograma proporciona una imagen bastante razonable del contenido de frecuencia de la señal.
Ejemplo 5.5 Se van a considerar como datos de entrada/salida los suministrados a modo de ejemplo en el fichero
dr yer 2. mat de la toolbox SITB de Matlab. En la Figura 5.6 se muestra la representación del periodograma del espectro de potencia de la entrada y de la salida. Power spectrum for signal y
Power spectrum for signal u
1.4
2.5
1.2 2
1 r 1.5 e w o P
r 0.8 e w o P0.6
1
0.4 0.5
0 0
0.2
10
20 Frequency (rad/s)
30
0 0
40
10
20 Frequency (rad/s)
30
40
(b)
(a)
Figura 5.6. Representación gráfica del periodograma de las series temporales de (a) entrada y (b) salida.
La secuencia de comandos de Matlab utilizada para obtener estas figuras es la siguiente (la escala lineal de las figuras se ha configurado en las propiedades de las figuras generadas) :
l oad dr yer 2 Ts=0. 08; %Per i odo de muest r eo dat os0 = i ddat a( y2, u2, Ts) ; %El i mi naci ón de val or es medi os dat os1=det r end( dat os0) ; %Sel ecci onar l os pr i mer os 500 punt os par a est i mar . d_est =dat os1( 1: 500) ; %Est i mar el per i odogr ama de l a ent r ada y l a sal i da u=get ( d_est , ' I nput Dat a' ) ; per i o_ u = et f e( u, [ ] , [ ] , 0. 08) ; 5-17
TEMA 5: Identificación de modelos no paramétricos
y=get ( d_est , ' Out put Dat a' ) ; per i o_ y = et f e( y, [ ] , [ ] , 0. 08) ; f i gur e ( 1) bode( per i o_u) f i gur e ( 2) bode( per i o_y) Estas representaciones permiten visualizar las componentes de frecuencia existentes en la entrada y la salida. Por lo que además de identificar los armónicos dominantes de la señales se puede saber si existen perturbaciones de baja frecuencia o de alta frecuencia y en consecuencia si es necesario filtrar las señales. También de estas representaciones es posible deducir el comportamiento del sistema, es decir, si es pasa baja, pasa alta o pasa banda y si atenúa o amplifica la entrada. Para este ejemplo de la representación gráfica del espectro de potencia estimado de las series temporales de entrada y salida, se puede deducir que el sistema posee un comportamiento pasa baja y que atenúa la entrada. Además como no aparecen en la salida componentes a frecuencias distintas de las excitadas por la entrada eso indica también que no existen perturbaciones ni de baja ni de alta frecuencia.
Otro aspecto importante a considerar a la hora de valorar la bondad de la estima de un espectro es el de la resolución en frecuencia que proporciona. La resolución en frecuencia de la estima de un espectro hace referencia a la capacidad para poder distinguir en el espectro componentes de frecuencia de la señal muy cercanas entre si. Si existe una buena resolución de frecuencia las componentes de frecuencia que están cerca pueden ser separadas. En el caso del periodograma obtenido para una señal de la que se dispone de N datos la resolución de frecuencia es bastante buena y toma el valor 2 /N (radianes/unidad de tiempo). Este resultado se deduce del hecho de que la expresión (5.37) con que se construye el periodograma proporciona la transforma de Fourier discreta a las frecuencias
=2h/N, h=1,...,N. Entre estas frecuencias la transformada de Fourier consiste de valores interpolados trigonométricamente. En resumen la principal ventaja del periodograma de una señal es que su resolución en frecuencia es bastante buena. Por contra su principal inconveniente es su alto grado de fluctuación o variabilidad.
5-18
Identificación de sistemas
En las siguientes secciones se examinan diferentes métodos para reducir la varianza de la estima del espectro de potencia. El precio que se paga por esta reducción de la varianza es un empeoramiento de la resolución de frecuencia.
5.6.2 Periodograma promedio: Método de Welch Una forma clásica de reducir la varianza de una estima es utilizar el método de Welch que consiste en tomar como estima el valor promedio de un determinado número de estimas independientes. En este caso, la señal se divide en R segmentos de longitud M y se construye el periodograma de cada uno de los R segmentos:
( k )
N ( ) , k=1,...,R.
La estima del espectro es el valor promedio de estos periodogramas:
N ( )
1 R
R
M
( )
(5.38)
k 1
Seleccionando la longitud de los segmentos como una potencia de 2, el cálculo del periodograma puede realizarse eficientemente usando la transformada rápida de Fourier. Puesto que los R periodogramas están no correlacionados (si no existe solapamiento) la varianza de la estima ˆ N ( ) se reduce en un factor R. Sin embargo, el precio a pagar por esta reducción de la varianza es que se empeora la resolución de frecuencia en la estima, que aumenta de 1/N (radianes/unidad de tiempo) (N es la longitud original de los datos) a 1/M=R/N (radianes/unidad de tiempo) (M=N/R es la longitud de los segmentos no superpuestos). El acuerdo entre la varianza y la resolución de frecuencia está por lo tanto determinado por el número de segmentos R que se consideren. A mayor número R de segmentos menor varianza pero peor resolución.
5.6.3 Suavizado del periodograma: El método de Blackman - Tukey 5.6.3.1 Descrip ción del proc edimiento
Otro procedimiento para suavizar un periodograma es promediando sobre un cierto número de frecuencias vecinas:
N ( )
WM ( )· N ( )d
(5.39)
5-19
TEMA 5: Identificación de modelos no paramétricos
En la expresión anterior W M ( ) es una función denominada función ventana o ventana frecuencial que sirve para enfatizar las componentes de frecuencia más importantes y
despreciar las menos relevantes. De esta forma se logra suavizar la forma del espectro de potencia que proporciona el periodograma que recordemos tiene un alto grado de variabilidad. La función de ventana cumple la siguiente propiedad
W
( )·d 1
M
(5.40)
Normalmente W M ( ) suele estar centrada entorno a =0. El parámetro M, a veces denominado como parámetro de truncación, describe la anchura de la ventana de frecuencia, ya que M es inversamente proporcional a la anchura de la ventana. Por ejemplo, una ventana rectangular de anchura 1/M viene descrita por la siguiente función
M W M ( ) 0
si | |
1
2 M 1 si | | 2 M
(5.41)
1. Elegir la ventana temporal wM(). 2. Elegir el tamaño de ventana M. 3. Calcular la estima de la covarianza de la señal para =0,...,M. N
1 N Rˆ ( ) u
u(t )·u(t )
N t 1
4. Calcular la estima de Blackman-Tukey
N ( )
M
w
M
( ) Rˆ Nu ( )· e i
M
Cuadro 5.2: Pasos para construir la estima de Blackman-Tukey del espectro de potencia de una señal
5-20
Identificación de sistemas
La anchura de la ventana se corresponde con la resolución en frecuencia de la estima suavizada
N ( ) . Normalmente, se utilizan otros tipos de ventanas distintas de la
rectangular con lo que es posible dar más peso a los valores centrales de frecuencia. Se puede demostrar [Ljung y Glad, 1994] que la expresión (5.39) puede ser escrita equivalentemente de la siguiente forma: M
w
N ( )
M
( ) Rˆ u N ( )· e i
(5.42)
M
En la expresión anterior w M() es la función ventana expresada en el dominio del tiempo. A esta función también se le denomina como ventana temporal o ventana de retardo (lag window). w M ( )
WM ( )·e i d
(5.43)
Mientras que Rˆ u N ( ) es la estima de la función de covarianza de la entrada:
1 N Rˆ ( ) u
N
u(t )·u(t )
N t 1
(5.44)
A la estima del espectro de potencia dada por la ecuación (5.42) se le conoce como estima de Blackman-Tukey. En el Cuadro 5.2 se resume el procedimiento para poder
obtener la estima de Blackman-Tukey. En las expresiones anteriores se supone que w M() ha sido elegida para ser cero si ||>M. Esto implica que existen requerimientos especiales a la hora de escoger la ventana WM() (una ventana rectangular no sería válida). Además en (5.44) se ha supuesto que u(t)=0 cuando t se encuentra fuera del intervalo [1,N]. 5.6.3.2 Elección de la func ión de ventana
El par de transformadas de Fourier w M() WM() determina las propiedades de la estima de Blackman-Tukey del espectro de potencia de una señal. Para una anchura M dada de la ventana temporal w M() es deseable tener una función de frecuencia W M/) tan alta y estrecha como sea posible. No existe una solución óptima para este problema. Una ventana muy utilizada es la conocida como ventana de Hamming (ver Figura 5.10) que tiene la siguiente expresión:
5-21
TEMA 5: Identificación de modelos no paramétricos
1 · ·1 cos M w M ( ) 2 M 0 M
(5.45)
Su transformada de Fourier es:
1 2
W M ( ) D M ( )
1 D M ( ) D M ( ) 4 M M
(5.46)
donde
1 sin ( M )· 2 D M ( ) sin( / 2) La anchura efectiva de la ventana frecuencial A(M) (ver Figura 5.7) que da la resolución de frecuencia puede ser calculada a través de la siguiente expresión: 1/ 2
2 A( M ) M ·W M ( )·d
(5.47)
En el caso de la ventana de Hamming se obtiene que A( M )
1 · 2 M
(5.48)
Se observa que es inversamente proporcional a la anchura M de la ventana temporal. Puede demostrarse [Ljung y Glad, 1994] que la resolución de frecuencia de la estima del espectro de frecuencia de Blackman-Tukey es aproximadamente igual a M 2
(5.49)
Además la varianza de la estima del espectro de frecuencia de Blackman-Tukey es aproximadamente igual a M
2·
5-22
N
·( u ( )) 2
(5.50)
Identificación de sistemas
1
20
0.9 0.8
15
0.7 0.6
10
0.5 0.4
5
0.3 0.2
0
0.1 0 −20
−15
−10
−5
0 Tiempo
5
10
15
20
−5 −2
−1.5
−1 −0.5 0 0.5 1 Frecuencia (radianes/unidad de tiempo
(a)
1.5
2
(b)
Figura 5.7. Ventana de Hamming en el dominio temporal (a) y en el dominio frecuencial para M=20 (línea continua) y M=5 (línea discontinua).
5.6.3.3 Elección del tamaño de ventana
La elección del valor de M, de acuerdo con (5.49) y (5.50), es un compromiso entre la resolución de frecuencia y la varianza (variabilidad). Si M se hace cada vez más grande (Figura 5.7) la ventana frecuencial W M() se hace más alta y estrecha, mientras que la ventana temporal w M() se hace cada vez más ancha. Ello implica que la resolución de frecuencia mejora pero a costa de que la varianza del espectro aumente. Para un espectro con picos de resonancia estrechos se hace necesario escoger un valor de M grande y aceptar por tanto la existencia de una alta varianza. Por el contrario para un espectro más plano, valores de M pequeños funcionan bastante bien, con lo cual la varianza se reduce. De forma práctica, lo que se suele hacer es probar con un conjunto de diferentes valores de M y ver cual funciona mejor. Normalmente se comienza con un valor pequeño de M y se va aumentando hasta que el espectro presenta un equilibrio en el compromiso entre resolución de frecuencia y varianza. Un valor típico para el espectro sin resonancias muy estrechas es M[20,30]. Valores mayores de M puede que sean necesarios para resonancias estrechas.
5.6.4 Estimación de la densidad espectral cruzada La obtención de una estima del espectro de potencia cruzada entre dos señales u e y es análoga a la obtención de una estima del espectro de potencia de una señal explicada en las secciones anteriores.
5-23
TEMA 5: Identificación de modelos no paramétricos
A partir de los valores muestreados y(k) e u(k) k=1,...,N la función de covarianza cruzada se estima a través de la siguiente expresión:
1 N Rˆ ( ) yu
N
y(t )·u(t )
N t 1
(5.51)
Y el espectro de potencia cruzada se estima mediante la siguiente expresión: ˆ N ( ) yu
M
w
M
N ( ) Rˆ yu ( )·e i
(5.52)
M
La función de ventana w M() es la misma que la utilizada en la expresión (5.42) y las mismas consideraciones sobre como elegirla realizadas en la sección anterior son aplicables en este caso.
5.6.5 Estima de la función de frecuencia usando análisis espectral Considérese el sistema dado por la siguiente expresión: y(t ) G ( q )·u(t ) v(t )
(5.53)
donde y(t) es la salida, u(t) la entrada y v(t) la perturbación. Si la entrada u(t) es independiente de la perturbación v(t), entonces el espectro de potencia la salida es 2
y ( ) G(ei ) · u ( ) v ( )
(5.54)
Y el espectro de potencia cruzada entre la entrada y la salida es:
yu ( ) G (e i )· u ( )
(5.55)
A partir de las estimas de los espectros (5.42) y (5.52) es posible obtener una estima de la función de frecuencia G(e jT) del sistema:
ˆ N yu ( ) j T ˆ G N (e ) N ˆ u ( )
(5.56)
Además también es posible obtener una estima del espectro de la perturbación v():
5-24
Identificación de sistemas
1. Elegir la ventana temporal wM(). 2. Elegir el tamaño de ventana M. 3. Calcular Rˆ y ( ), Rˆ u ( ) y Rˆ yu ( ) para |k|M. N
N
N
N
1 N Rˆ ( ) u
u(t )·u(t )
N t 1 N
1 N Rˆ ( ) yu
y(t )·u(t )
N t 1 N
1 N Rˆ ( ) v
v(t )·v(t )
N t 1
4. Calcular la estima del espectro de u e y, así como la estima del espectro cruzado entre y e u:
u ( ) N
M
w
( ) RˆuN ( )· e j
M
M
N ˆ ( ) y
M
w
M
( ) Rˆ y N ( )·e i
M
yu ( ) N
M
w
M
N ( ) Rˆ yu ( )· e i
M
5. Obtener la estima de la función de frecuencia y del espectro de la perturbación
Gˆ N (e
i T
ˆ N yu ( ) ) N ˆ u ( )
yu ( ) v ( ) y ( ) N u ( ) N
N
2
N
Cuadro 5.3. Obtención de una estima de la función de frecuencia y del espectro de la perturbación mediante análisis espectral.
5-25
TEMA 5: Identificación de modelos no paramétricos
2
yu ( ) v ( ) y ( ) N u ( ) N
N
N
(5.57)
A este procedimiento de cálculo de las estimas de la función de la frecuencia y del espectro se le conoce como análisis espectral y se resume en el Cuadro 5.3. La función spa (spectral analysis) de la toolbox SIT de Matlab implementa el análisis espectral del Cuadro 5.3. La función de frecuencia estimada a partir de datos muestreados G T(e jT) no difiere mucho de la función de frecuencia estimada continua G(j ) en la región de frecuencias de interés. Además la experiencia muestra que la estima de G(j ) es poco fiable a altas frecuencias.
Ejemplo 5.6: Se van a considerar como datos de entrada/salida los suministrados a modo de ejemplo en el fichero
dr yer 2. mat de la toolbox SITB de Matlab. En la Figura 5.8 se muestra la representación de la estima de la función de la frecuencia y de la estima del espectro del ruido, considerando un valor de M=30. La secuencia de comandos de Matlab utilizada para obtener estas figuras es la siguiente:
l oad dr yer 2 Ts=0. 08; %Per i odo de muest r eo dat os0 = i ddat a( y2, u2, Ts) ; %El i mi naci ón de val or es medi os dat os1=det r end( dat os0) ; %Sel ecci onar l os pr i mer os 500 punt os par a est i mar . d_est =dat os1( 1: 500) ; %Est i ma medi ant e anál i si s espect r al de l a f unci ón de f r ecuenci a %y del espect r o del r ui do [ Gspa, phi Vspa] =spa( d_est ) ; f i gur e ( 1) bode( Gspa) f i gur e ( 2) bode( phi Vspa) En la representación de la estima de la respuesta de la frecuencia se observa que el sistema presenta un comportamiento de filtro pasa-baja. También se deduce que el sistema presenta un comportamiento atenuador ya que la magnitud se encuentra por debajo de la línea de 0 dB. Además se observa que aumenta el desfase conforme aumenta la frecuencia. En la representación del espectro del ruido se observa que a bajas frecuencias presenta una magnitud constante y que a partir de 0.2 rad/s comienza a disminuir. Por lo que en dicho rango podría
5-26
Identificación de sistemas
asemejarse al espectro de un ruido blanco. La parte final del espectro es oscilante y generalmente está asociada a errores en la estima por lo que no se considera. 0
10
10
e d u −1 t i l 10 p m A
10
−1
10 ) 0 s e e r g−200 e d ( e−400 s a h P−600
−1
−2
−2
10
0
0
1
10
10
2
10
r 10 e w o P −3
10
10
−1
10
0
1
10 10 Frequency (rad/s)
2
10
10
−4
−5 −1
10
0
1
10 10 Frequency (rad/s)
2
10
(b)
(a)
Figura 5.8. Representación de la estima mediante análisis espectral con M=30 de: a) La función de la frecuencia. b) Espectro del ruido.
Nótese que si M=N entonces la estima que se obtiene del espectro de una señal y del espectro cruzado de dos señales es precisamente el periodograma
ˆ N u ( ) | U N ( ) |2 ˆ N u ( ) Y N ( )·U N ( ) Usando estas estimas de los espectros se obtiene la siguiente estima de la función de frecuencia: Gˆ N (i )
Y N ( ) U N ( )
que es precisamente la ETFE.
5-27
TEMA 5: Identificación de modelos no paramétricos
5.6.6 Resumen de las características básicas d el análisis espectral Las características básicas del análisis espectral que han ido apareciendo en las secciones anteriores se pueden resumir en los siguientes puntos:
El análisis espectral es un método muy común para obtener estimas del espectro de señales, del espectro cruzado entre señales y de la función de frecuencia
Tras realizar un ajuste adecuado del tamaño M de la ventana, es usualmente posible obtener una buena representación gráfica de las propiedades frecuenciales del sistema y de sus señales. Proporciona como resultado básico un modelo no paramétrico en forma de tabla o de gráfica de N puntos de magnitud y fase de la función de frecuencia G(j ) o del espectro de la perturbación. Como el resto de modelos no paramétricos no pueden usarse de forma directa para simulación.
Es un método general, cuya única hipótesis de partida es que el sistema es lineal, y no requiere de señales de entrada específicas.
El análisis espectral no se puede aplicar a sistema que operan en lazo cerrado. El motivo es que la suposición de que la entrada u y la perturbación v no estén correlacionadas no se cumple en dicho caso.
BIBLIOGRAFÍA [Jenkins and Watts, 1968]
G. M. Jenkins y D. G. Watts. Spectral Analysis and Its Applications. Holden-Day. 1968.
[Ljung y Glad, 1994]
L. Ljung y T. Glad. Modelling of dynamic systems . Prentice Hall. 1994.
[Ljung, 1999]
L. Ljung. System Identification: Theory for the user . 2nd Edition. Prentice Hall.1999.
[Ljung, 2010]
L. Ljung. System Identification Toolbox 7 . The Mathworks. 2010.
[Rivera, 2007]
D. E. Rivera. Introducción a la Identificación de Sistemas . Curso impartido en el Dpto. de Informática y Automática de la UNED del 17-28 de septiembre de 2007.
5-28
TEMA 6 IDENTIFICACIÓN DE MODELOS PARAMÉTRICOS DISCRETOS
6.1 INTRODUCCIÓN En el tema anterior se estudió la identificación de modelos no paramétricos. Aunque estos modelos proporcionan información relevante del sistema, al ser tablas o gráficas no pueden usarse para simular, controlar o predecir el comportamiento de un sistema. Para poder lograr estos objetivos se hace necesario disponer de un modelo matemático del sistema, el cual queda definido mediante un conjunto de parámetros. De hecho el objetivo final de la metodología de identificación de sistemas es estimar un modelo paramétrico que describa lo mejor posible al sistema de acuerdo con el uso final al que se vaya a destinar el modelo, ya sea simulación, control o predicción del sistema. Este tema está dedicado a explicar la estimación de modelos paramétricos en tiempo discreto. Se deja para el próximo tema la explicación del caso de tiempo continuo. En primer lugar se define la clase de modelos que se van a considerar, que típicamente son modelos basados en la minimización del error de predicción o más abreviadamente denominados modelos PEM (Prediction error model). En segundo lugar se explica cómo se estiman los parámetros de un modelo PEM. A continuación se explican las principales propiedades del modelo estimado: el error de sesgo y el error de varianza. Posteriormente se realizan algunas consideraciones sobre la elección del tipo y la estructura del modelo. Finalmente se explican las técnicas que se utilizan para validar el modelo estimado y se incluyen algunas directrices para obtener el modelo PEM más apropiado.
6-1
TEMA 6: Identificación de modelos paramétricos discretos
6.2 MODELOS PARAMÉTRICOS BASADOS EN EL ERROR DE PREDICCIÓN 6.2.1 Definición Considérese un sistema lineal invariante en el tiempo descrito por la siguiente ecuación en diferencias (ver Figura 6.1): y(t ) G0 ( q )·u(t ) v(t )
(6.1)
G0(q) es la función de transferencia de la planta, u(t) es la entrada, v(t) es la
perturbación e y(t) es la salida. Además q es el operador retardo q -1·u(t)=u(t-1) De forma general la entrada puede ser una señal aleatoria o determinista. Por su parte la perturbación será una señal aleatoria autocorrelacionada. En consecuencia la señal de salida también será una señal aleatoria autocorrelacionada. a(t)
H0(q) v(t) u(t) G0(q)
+
y(t)
Figura 6.1. Sistema lineal a identificar
De acuerdo con el teorema de factorización espectral (ver sección 2.7) la perturbación v(t) se puede considerar la salida de un filtro H 0(q) que es excitado por una señal de ruido blanco a(t): v(t ) H 0 ( q )·a (t )
(6.2)
Luego la ecuación del sistema se puede expresar de la siguiente forma: y(t ) G0 ( q )·u(t ) H 0 ( q )·a(t )
(6.3)
Se desea identificar un modelo lineal que se aproxime lo mejor posible al sistema real. La ecuación del modelo a identificar se puede escribir de la siguiente forma:
6-2
Identificación de sistemas
y(t ) G ( q )·u(t ) H ( q )·e(t )
(6.4)
La variable e(t) es el error de predicción a un paso: e(t ) y (t ) yˆ (t | t 1)
(6.5)
En la ecuación anterior y(t) es la salida real medida en el instante t e yˆ (t | t 1) es la salida estimada en el instante t usando el modelo y los datos disponibles de la salida en el intervalo [0, t-1]. A yˆ (t | t 1) se le denomina predictor a un paso de y o salida predicha a un paso. La variable e(t) representa la parte de la salida y(t) que no puede ser predicha a partir
de los datos pasados. Se trata de ruido blanco que es independiente de todos los datos anteriores. Despejando e(t) de (6.4) se obtiene la ecuación del error 1 e(t ) H ( q )·[ y (t ) G ( q )·u(t )]
(6.6)
Igualando con (6.5) y despejando yˆ (t | t 1) se obtiene la siguiente expresión para el predictor a un paso de la salida: yˆ (t | t 1) H 1 ( q )·G ( q )·u(t ) (1 H 1 ( q ))· y (t )
(6.7)
Si no se considera un modelo del ruido ( H ( q) 1 ), el error de predicción se reduce al error de la salida o residuo:
e(t ) eresid (t ) ~ v (t ) y (t ) G ( q )·u(t )
(6.8)
Al modelo dado por (6.4) se le denomina modelo basado en el error de predicción o modelo PEM (Prediction-Error Model). Las funciones G(q) y H(q) son funciones racionales que quedan especificadas por los coeficientes de su numerador y denominador. En consecuencia un modelo PEM es un modelo paramétrico ya que queda definido mediante un número finito de parámetros: los coeficientes del numerador y del denominador. Un modelo PEM se puede expresar de forma general mediante la siguiente ecuación: y(t )
B( q ) A( q )·F ( q )
·u(t nk )
C ( q ) A( q )· D( q )
·e(t )
(6.9)
6-3
TEMA 6: Identificación de modelos paramétricos discretos
El parámetro nk es el número de muestras que transcurren desde que se introduce una entrada en el sistema hasta que genera una salida, es decir, representa el retardo del sistema. Igualando con (6.4) se deduce que: G( q )
B( q ) A( q )·F ( q )
·q nk
H ( q )
C ( q ) A( q )· D( q )
(6.10)
También se puede expresar en la forma: A( q )· y (t )
B( q ) F ( q )
·u(t nk )
C ( q ) D( q )
·e(t )
(6.11)
En las expresiones anteriores A(q), B(q), C(q), D(q) y F(q) son polinomios: A( q) 1 a1·q
... ana ·q na nb 1 1 B( q) b1 b2·q ... bnb·q nc 1 C ( q) 1 c1·q ... cnc·q nd 1 D( q) 1 d1·q ... d nd ·q nf 1 F ( q) 1 f1·q ... f nf ·q 1
(6.12)
La estructura de un modelo PEM queda definida por los valores de los ordenes de sus polinomios, es decir (na,nb,nc,nd,nf) y del retardo nk.
6.2.2 Tipos de modelos PEM El tipo de modelo PEM queda establecido por el número de polinomios distintos a la unidad. Se distinguen en consecuencia 32 posibles tipos de modelos PEM. Entre los modelos PEM más utilizados se encuentran los siguientes (ver Tabla 6.1):
Modelo ARX. Se define mediante la siguiente ecuación en diferencias
A( q ) y (t ) B( q )u(t nk ) e(t )
(6.13)
con na A( q ) 1 a1 ·q 1 ... a na ·q
B( q ) b1 b2 ·q
6-4
1
... bnb ·q nb1
(6.14)
Identificación de sistemas
El nombre ARX (AutoRegressive with eXternal input) que se le da a este tipo de modelo es porque A(q)·y(t) es una autoregresión. Mientras que B(q)·u(t-nk) representa la contribución de la entrada externa. El problema de estimación de los coeficientes de los polinomios A(q) y B(q) requiere resolver un problema de regresión lineal. La estructura de un modelo ARX queda definida por la tripleta de números (na,nb,nk). Si se consideran valores muy altos para na y nb las estimas de los coeficientes son más consistentes (ver sección 6.4.3) pero puede producir problemas de varianza en presencia de una perturbación significativa. Por el contrario si se consideran valores muy pequeños para na y nb las estimas son problemáticas si existe una perturbación significativa o cuando la estructura del modelo es incorrecta. Señalar que un modelo ARX utiliza un modelo para el ruido de la forma: H ( q)
1 A( q)
En consecuencia el espectro del error de predicción filtrado (ver sección 6.4.3) tendrá en su término asociado a la potencia de la señal de entrada el factor i
2
A( e ) en el numerador, lo que le confiere típicamente un claro comportamiento
de tipo pasa-alta. Esto implica que el modelo ARX se ajusta con un énfasis en el comportamiento de alta frecuencia presente en los datos de entrada-salida, lo cual no es deseable en general. Para evitarlo se recomienda prefiltrar los datos con un filtro pasa-baja o pasa-banda (ver sección 4.5.1.3).
Modelo FIR (Finite Impulse Response). Se define mediante la siguiente ecuación
en diferencias y (t ) B( q )u(t nk ) e(t )
(6.15)
con B( q ) b1 b2 ·q
1
... bnb ·q nb1
(6.16)
6-5
TEMA 6: Identificación de modelos paramétricos discretos
Un modelo FIR se obtiene de un modelo ARX haciendo A(q)=1. El problema de estimación de los coeficientes del polinomio B(q) requiere resolver un problema de regresión lineal. La estructura de un modelo FIR queda definido por la dupla (nb,nk). En general nb suele ser grande: igual o superior a 20. El número de parámetros necesarios es función del tiempo de asentamiento y de la constante de tiempo dominante. Un modelo FIR es otra forma adicional de obtener la respuesta a un impulso de un sistema. Recuérdese que la otra forma de estimar la respuesta a un impulso es mediante análisis de correlación. De acuerdo con (6.10) cuando se obtiene un modelo FIR no se estima un modelo autocorrelacionado del ruido ya que H ( q ) 1 .
Modelo ARMAX. Se define mediante la siguiente ecuación en diferencias
A( q ) y (t ) B( q )u(t nk ) C ( q )·e(t )
(6.17)
con na A( q ) 1 a1 ·q 1 ... a na ·q
... bnb ·q nb1 nc C ( q ) 1 c1 ·q 1 ... cnc ·q
B( q ) b1 b2 ·q
1
(6.18)
El nombre ARMAX (AutoRegressive Moving Average with eXtra Input) que se le da a este tipo de modelo es por que A(q)·y(t) es una autoregresión (AR), C(q)·e(t) es un ruido blanco de media móvil (MA) y B(q)·u(t-nk) representa la contribución de la entrada externa. El problema de estimación de los coeficientes de los polinomios A(q), B(q) y C(q) requiere resolver un problema de regresión no lineal. La estructura de un modelo ARMAX queda definida por (na,nb,nc,nk). Normalmente se escogen valores bajos de na, nb y nc. La presencia de un polinomio autoregresivo (A(q)) puede conducir a problemas de sesgo (ver sección 6.4) en presencia de ruido significativo y/o a desajuste con la estructura del modelo. Sin embargo el polinomio de media móvil (C(q)) a veces contrarresta estos efectos.
6-6
Identificación de sistemas
Modelo OE (Output-Error). Se define mediante la siguiente ecuación en
diferencias y (t )
B( q ) F ( q )
u(t nk ) e(t )
(6.19)
con
... bnb ·q nb1 nf F ( q ) 1 f 1 ·q 1 ... f nf ·q
B( q ) b1 b2 ·q
1
(6.20)
El nombre OE (Output-Error) deriva del hecho de que la fuente del ruido del modelo e(t) coincide con la perturbación v(t), luego será la diferencia (error) entre la salida actual y la salida libre de ruido. El problema de estimación de los coeficientes de los polinomios B(q) y F(q) requiere resolver un problema de regresión no lineal. La estructura de un modelo OE queda definida por (nb,nf,nk). Normalmente se escogen valores bajos de nb y nf. De acuerdo con (6.10) cuando se obtiene un modelo OE no se estima un modelo autocorrelacionado del ruido ya que H ( z ) 1 .
Modelo BJ (Box-Jenkins). Se define mediante la siguiente ecuación en diferencias
y(t )
B( q )
u(t nk )
C ( q )
e(t )
(6.21)
... bnb ·q nb1 1 nc C ( q ) 1 c1 ·q ... c nc ·q 1 nd D( q ) 1 d 1 ·q ... d nd ·q 1 nf F ( q ) 1 f 1 ·q ... f nf ·q
(6.22)
F ( q )
D( q )
con B( q ) b1 b2 ·q
1
El problema de estimación de los coeficientes de los polinomios B(q), C(q), D(q) y F(q) requiere resolver un problema de regresión no lineal. La estructura de un modelo BJ queda definida por (nb,nc,nd,nf,nk). Normalmente se escogen valores bajos de nb, nc, nd y nf.
6-7
TEMA 6: Identificación de modelos paramétricos discretos
Un modelo BJ proporciona funciones de transferencia independientes para la parte determinista y la estocástica del modelo. Los modelos BJ son difíciles de estimar ya que requieren de muchas iteraciones (computacionalmente costoso) y de una mayor toma de decisiones por parte del diseñador.
Tipo modelo PEM
Polinomios unidad
ARX
C=1, D=1, F=1
G ( z ) B( z ) A( z )
ARMAX
D=1, F=1
B( z ) A( z )
FIR
A=1, C=1, D=1, F=1
Box-Jenkins
A=1
A=1, C=1, D=1
· z nk
B( z )· z B( z ) F ( z )
Output Error
· z nk
B( z ) F ( z )
nk
· z nk · z nk
H ( z )
1 A( z ) C ( z ) A( z ) 1
C ( z ) D( z ) 1
Tabla 6.1. Tipos de modelos PEM más utilizados
Supóngase que se dispone de un conjunto de N muestras de la entrada u(t) y la salida y(t) t=1,...,N de un sistema real el problema que se desea resolver es el de obtener el modelo PEM que mejor represente al sistema real. Es decir, que la salida que genere el modelo sea lo más parecida posible a la salida real del sistema medida experimentalmente. Obtener el mejor modelo PEM implica seleccionar un tipo de modelo, fijar una estructura y estimar los coeficientes de los polinomios que definen el modelo.
6.3 ESTIMACIÓN DE LOS PARÁMETROS DE UN MODELO PEM 6.3.1 Planteamiento general del problema Seleccionado el tipo y la estructura [na,nb,nc,nd,nf,nk] de un modelo PEM, la estimación de los coeficientes de los polinomios de dicho modelo se realiza resolviendo un problema de regresión lineal o no lineal. Para un modelo general PEM la ecuación del error de predicción a un paso se puede expresar de la siguiente forma: C ( q )·F ( q ) yˆ (t | ) D( q )· B( q )·u(t nk ) F ( q )[C ( q ) D( q )· A( q )]· y(t )
6-8
(6.23)
Identificación de sistemas
La expresión anterior puede ser escrita equivalentemente en la forma de una regresión “pseudolineal”: T yˆ (t | ) (t | )
(6.24)
donde (t | ) [ y(t 1),..., y(t na ), u(t nk ),..., u(t nk nb
1),
w(t 1 | ),..., w(t n f | ), e(t 1 | ),..., e(t nc | )
(6.25)
v(t 1 | ),..., v(t nd | )]T [ a1 ,..., a na , b1 ,...., bnb , f 1 ,...., f nf , c1 ,...., c nc , d 1 ,...., d nd ]T
(6.26)
Al vector columna se le denomina vector de parámetros ya que contiene los parámetros del modelo que hay que estimar. Nótese que la dimensión del vector de parámetros coincide con el número de parámetros que definen al modelo, también denominado como orden del modelo . Salvo que se indique lo contrario se va denotar con la letra d al número de parámetros de que consta un modelo: d
na nb nf nc nd
Nótese que cuanto mayor sea el valor de d, mayor será la complejidad del modelo. Por su parte al vector columna
(t | ) se le denomina vector de regresión ya que
contiene los valores pasados de las salidas y las entradas medidas del sistema. Además contiene los valores anteriores de las variables auxiliares w, v y e que dependen tanto de los parámetros del modelo como de los datos (de ahí proviene el término de “pseudolineal”): w(t | )
B( q ) F ( q )
·u(t )
(6.27)
v(t | ) A( q )· y(t ) w(t | )
e(t | ) y(t ) yˆ (t | )
D( q ) C ( q )
(6.28)
·v(t | )
(6.29)
Para determinar se puede usar la siguiente función de coste o función objetivo
6-9
TEMA 6: Identificación de modelos paramétricos discretos
V N ( )
N
1
1
N
e (t | ) N [ y (t | )] N 2
t 1
T
2
(6.30)
t 1
El objetivo o criterio de identificación es encontrar aquel vector de parámetros ˆ N que minimice la función de coste: ˆ N
arg min V N
(6.31)
Nótese que la función de coste es la suma de los cuadrados de los errores. Por ello a la estima ˆ N se le denomina estima de mínimos cuadrados. Este procedimiento de estimación fue propuesto por Gauss en el siglo XVIII. Se trata en consecuencia de un problema de optimización que puede ser resuelto usando algún método de búsqueda. Aunque no van a ser tratados en estos apuntes, conviene saber que aparte de los métodos de mínimos cuadrados existen otros métodos para estimar los parámetros del modelo basándose en el error de predicción como el método de la variable instrumental y el método de máxima verosimilitud . Asimismo existen otros métodos de estimación con una
filosofía diferente como los métodos basados en subespacios.
6.3.2 Cálculo de la estima cuando el modelo PEM se puede expresar como una regresión lineal En el caso de un modelo PEM tipo ARX o FIR se puede demostrar que la estima de sus parámetros se reduce a un problema de regresión lineal por lo que se puede obtener una expresión analítica a través de la cual obtener la estima de mínimos cuadrados ˆ . Desarrollando (6.30) la función de coste se puede escribir de la siguiente forma: V N ( )
1
N
y(t ) N t 1
2
1
N
1
N
2 (t ) y(t ) N (t ) (t ) N T
t 1
T
T
(6.32)
t 1
O equivalentemente como V N ( )
1
N
y(t ) N t 1
Donde
6-10
2
2 T f N T R N
(6.33)
Identificación de sistemas
f N
R N
N
1
(t ) y(t )
N t 1
1
(6.34)
N
(t ) (t ) N T
(6.35)
t 1
Nótese que f N es un vector columna de dimensión d x 1 y R N es una matriz cuadrada de dimensión d x d que se denomina matriz de covarianza de las estimas . Si la matriz RN es invertible entonces la función de coste se puede escribir de la siguiente forma: V N ( )
1
N
y(t ) N
2
f N T · R N 1 · f N ( R N 1 · f N )T R N ( R N 1 · f N )
(6.36)
t 1
El último término de la ecuación anterior es siempre cero ya que la matriz R N es semidefinida positiva. El valor mínimo de V N() se obtiene cuando este término es cero, es decir, cuando ˆ N
R N 1 · f N
(6.37)
Por lo tanto la estima de mínimos cuadrados ˆ N se calcula entonces mediante la siguiente expresión:
1 N 1 ˆ N R N · f N (t )· T (t ) N t 1
1
1 N
N
(t ) y(t )
(6.38)
t 1
En la práctica para evitar problemas numéricos que pueden encontrarse al invertir una matriz la estima ˆ N se calcula resolviendo el sistema de ecuaciones lineales dado por la ecuación: R N · ˆ N
f N
(6.39)
Ejemplo 6.1: Considérese un modelo ARX:
A( q ) y (t ) B( q )u(t nk ) e(t )
6-11
TEMA 6: Identificación de modelos paramétricos discretos
El predictor a un paso de la salida que proporciona este modelo es
y(t | t 1) a1 · y(t 1) ... a na · y (t na ) b1 ·u(t nk ) ... bnb ·u(t nk nb 1) Dicho predictor puede ser expresado en la forma de una regresión lineal T yˆ (t | t 1) (t )·
Donde el vector de regresión y el vector de parámetros tienen la siguiente expresión:
[ y (t 1),..., y (t na ), u(t nk ),..., u(t nk nb
1)]T
[ a1 ,..., a na , b1 ,...., bnb ]
T
Para determinar se usa la siguiente función de coste o función objetivo
V N ( )
1
N
1
N
e (t | ) N [ y (t | )] N 2
t 1
T
2
(6.40)
t 1
El objetivo es encontrar aquel vector de parámetros ˆ N que minimice la función de coste. Puesto que se trata de una regresión lineal la estima de mínimos cuadrados se puede obtener de forma directa resolviendo el siguiente sistema de ecuaciones
R N · ˆ N
f N
donde
f N
N
1
(t ) y(t ) N
R N
t 1
1
N
(t ) (t ) N T
t 1
Nótese que los elementos del vector f N y de la matriz RN para un modelo ARX son sumas de la forma:
1
N
y(t j )u(t k )
N t 1
1
N
y(t j ) y(t k )
N t 1
1
N
u(t j)u(t k )
N t 1
Luego la estima ˆ N es construida usando las estimas de las funciones de covarianza de la entrada y la salida. Por ejemplo supóngase el siguiente modelo ARX
y(t ) ay(t 1) bu(t 1) e(t )
6-12
(e5)
Identificación de sistemas
En este caso:
y(t 1) a , θ b u(t 1)
(t )
y
1 N ( )· ( 1 ) y t y t N N 1 t 1 f N (t ) y(t ) N 1 N t 1 y(t )·u(t 1) N t 1 1 N 2 1 N ( 1 ) ( 1 )· ( 1 ) y t y t u t N 1 N N t 1 T t 1 R N (t ) (t ) N 1 N 2 N t 1 1 y(t 1)·u(t 1) u (t 1) N t 1 N t 1 Luego el sistema de ecuaciones a resolver para encontrar la estima de mínimos cuadrados es
1 N 2 1 N 1 N y(t 1)·u(t 1) a y(t )· y(t 1) N y (t 1) N t 1 t 1 N N t 1 N N 1 1 1 b 2 y(t 1)·u(t 1) y(t )·u(t 1) u (t 1) N t 1 N t 1 N t 1 Resolviendo se obtiene
N 2 N N N u (t 1) · y(t )· y(t 1) y(t 1)·u(t 1) · y(t )·u(t 1) t 1 t 1 t 1 t 1 a 2 N 2 N 2 N y (t 1) · u (t 1) y(t 1)·u(t 1) t 1 t 1 t 1 N N N 2 N y(t 1)·u(t 1) · y(t )· y(t 1) y (t 1) · y(t )·u(t 1) t 1 t 1 t 1 t 1 b 2 n 2 N 2 N y (t 1) · u (t 1) y(t 1)·u(t 1) t 1 t 1 t 1
6-13
TEMA 6: Identificación de modelos paramétricos discretos
6.3.3 Cálculo de la estima cuando el modelo PEM no se puede expresar como una regresión lineal Para otros tipos de modelos PEM como los modelos ARMAX, OE y BJ la función de coste (6.30) es una función no lineal de por lo que la obtención de la estima del vector de parámetros ˆ N que minimiza la función de coste debe realizarse usando algún método numérico de búsqueda iterativa como el método de Newton-Raphson o el de Gauss-Newton La base de todos estos métodos es la necesidad de encontrar una regla para iterar sobre el vector de parámetros: ˆ ( i 1)
ˆ (i ) · f (i )
(6.41)
En la expresión anterior f (i) es la dirección de búsqueda determinada en base a los valores de la función de coste de las iteraciones anteriores, sus gradientes (primeras derivadas) y sus hessianos (segundas derivadas). Asimismo es una constante positiva cuyo valor se debe fijar para obtener una apropiada disminución del valor de la función de coste. Por ejemplo, el método de Newton-Raphson permite resolver numéricamente la ecuación g ( x ) 0
Para ello va buscando valores para x de forma iterativa: x ( i 1)
x (i ) ·[g ( x (i ) )]1 g ( x (i ) )
(6.42)
En la expresión anterior g’ es la derivada de g con respecto a x, y es un parámetro denominado longitud del paso que permite garantizar que x (i+1) será mejor x(i). El método Newton-Raphson puede ser utilizado para buscar el mínimo de la función de coste (6.30), para ello hay que encontrar las soluciones de la ecuación dV N ( ) d
0
(6.43)
Aplicando (6.41) se obtiene ˆ (i 1)
6-14
ˆ (i ) (i ) ·[V N ( ˆ (i ) )]1 ·V N ( ˆ (i ) )
(6.44)
Identificación de sistemas
Nótese que puesto que es un vector columna de dimensión d x1. El gradiente (primera derivada) V N () de la función de coste V N es también un vector columna de la misma
() el Hessiano (segunda derivada) de V N es una matriz dimensión. Por su parte V N cuadrada de dimensión d x d. La longitud del paso (i) es determinada para que ( i 1) ) V N ( ˆ ( i ) ) . V N ( ˆ
La toolbox SIT de Matlab contiene funciones ( ar x, ar max, oe , bj , pem, ...) que permiten estimar los parámetros de un modelo PEM. Por ejemplo la función ar x permite estimar los parámetros de un modelo ARX, mientras que la función ar max estima un modelo ARMAX. En ambos casos es necesario obviamente especificar la estructura del modelo a estimar, es decir, los valores [na,nb,nk] en el caso de un modelo ARX y los valores [na,nb,nc,nk] en el caso de un modelo ARMAX.
Ejemplo 6.2: Se van a considerar como datos de entrada/salida los suministrados a modo de ejemplo en el fichero
dr yer 2. mat de la toolbox SIT de Matlab, donde el periodo de muestreo era T=0.08 s. Una vez eliminados los valores medios se van a utilizar los primeros 500 datos para estimar un modelo ARX con na=1, nb=1 y nk=2. La secuencia de comandos necesarios para estimar dicho modelo ARX y mostrar información sobre el mismo es la siguiente:
l oad dr yer 2 Ts=0. 08; %Per i odo de muest r eo dat os0 = i ddat a( y2, u2, Ts) ; %El i mi naci ón de val or es medi os dat os1=det r end( dat os0) ; %Sel ecci onar l os pr i mer os 500 punt os par a est i mar d_est =dat os1( 1: 500) ; %Est i mar el model o ARX ( 1, 1, 2) ar x112=ar x( d_est , [ 1, 1, 2] ) ; %Pr esent ar l a i nf omr aci ón del model o pr esent ( arx112) En pantalla aparece lo siguiente:
Di scr et e- t i me I DPOLY model : A( q) y( t ) = B( q) u( t ) + e( t ) A( q) = 1 - 0. 9444 ( +- 0. 009375) q^- 1 B( q) = 0. 06944 ( +- 0. 005256) q^- 2
6-15
TEMA 6: Identificación de modelos paramétricos discretos
Est i mat ed usi ng ARX f r om dat a set d_est Loss f unct i on 0. 0290152 and FPE 0. 0292483 Sampl i ng i nt er val : 0. 08 Es decir, se muestra el polinomio A(q) y B(q) estimado. Así como información sobre el valor de la función de coste (loss function) y del criterio de información FPE utilizado (que se explicará en la sección 6.5.2).
6.4 PROPIEDADES DEL MODELO PEM ESTIMADO 6.4.1 Calidad del modelo Tres son los aspectos que se pueden considerar para evaluar la calidad del modelo estimado:
Uso final de modelo. Un modelo de un sistema puede ser excelente para poder
realizar un control del sistema pero resultar inadecuado para realizar simulación.
Habilidad del modelo para reproducir el comportamiento del sistema . Es decir, que la
salida que produce el modelo se parezca lo máximo posible a la salida real del sistema cuando ambos son excitados por la misma entrada.
Estabilidad del modelo . Hace referencia a como de bien el modelo puede ser
reproducido a partir de diferentes segmentos de datos de entrada-salida del sistema real. Obviamente habrá que cuestionarse el modelo resultante si varía mucho en función de los segmentos de datos a partir de los cuales fue estimado.
6.4.2 Errores existentes en un modelo De forma general el modelo estimado para un cierto sistema incluye dos tipos de errores que evitan que pueda reproducir fielmente al sistema real:
Error de varianza. Engloba a los errores del modelo que surgen a causa del ruido
que influye sobre las medidas y el sistema. Si un experimento se repite usando la misma entrada, la salida que se medirá no será exactamente la misma ya que el ruido al ser aleatorio no puede ser reproducido. A causa de este ruido el modelo que se estime será diferente. El error de varianza se puede disminuir si se aumenta el número N de datos recogidos, es decir la duración de los experimentos. También
6-16
Identificación de sistemas
disminuye si aumenta la razón señal-ruido. Por el contrario aumenta conforme mayor es el número d de parámetros del modelo (orden del modelo).
Error de sesgo (bias) . Engloba a los errores sistemáticos que contiene el modelo
estimado debido a la estructura de modelo elegida. Si la estructura elegida para el modelo no es adecuada, éste no será capaz de reproducir el comportamiento del sistema real. Los errores de sesgo se manifiestan como variaciones en los parámetros del modelo cuando son estimados con datos que han sido medidos en diferentes
condiciones
(incluso
aunque
los
intervalos
de
medida
sean
suficientemente grandes para hacer el error de varianza insignificante). El motivo es que según sean las
condiciones del experimento (punto de operación,
características de la entrada y modo de operación (lazo abierto o cerrado)) los datos contendrán ciertas propiedades del sistema y ocultarán otras. El modelo se ajusta entonces únicamente a los aspectos dominantes de las propiedades del sistema recogidas por los datos.
6.4.3 Error de sesgo Considérese la estima del vector de parámetros ˆ N que minimiza la función de coste
V N ( )
1
N
e (t | ) N 2
t 1
Supuesto que el número N de datos medidos tiende a infinito, el error de varianza será despreciable y el único error que tendrá la estima será el asociado al error de sesgo. Si el ruido que afecta al sistema puede ser descrito como un proceso estocástico estacionario, entonces el error de predicción e(t| ) para cada valor de es un proceso estacionario. La varianza del error de predicción es: E [e 2 (t | )] V ( )
(6.45)
Si e(t|) es una secuencia de variables estocásticas independientes, es decir, ruido blanco, entonces cuando N la función de coste V( ) tiende a la varianza del error de predicción V ( ) : 1
N
e (t | ) E [e (t | )] V ( ) N 2
t 1
2
N
(6.46)
6-17
TEMA 6: Identificación de modelos paramétricos discretos
La convergencia ocurre con una probabilidad 1. La convergencia es también uniforme en el parámetro , esto implica que ˆ N
arg minV N ( ) * arg minV ( ) N
(6.47)
Es decir, la estima del vector de parámetros ˆ N converge al valor que minimiza la varianza del error de predicción. Este resultado es completamente general y contiene toda la información del error de sesgo. Si no se puede conseguir un modelo exacto se puede conseguir al menos la mejor aproximación disponible dentro del modelo parametrizado, aquella que minimiza la varianza del error de predicción. Esta es una importante propiedad de robustez de la estima. En el caso de modelos lineales este resultado se interpreta mejor en el dominio de la frecuencia. Considérese el siguiente sistema lineal y (t ) G0 ( q )·u(t ) v(t ) G0 ( q )·u(t ) H 0 ( q )·a(t )
(6.48)
Supóngase que se ha estimado el siguiente modelo del sistema y(t ) G ( q )·u(t ) H ( q )·e(t )
(6.49)
El error de predicción es e(t ) y (t ) y (t | t 1) H 1 ( q )·[ y (t ) G ( q )·u(t )]
H 1 ( q )·[G0 ( q )·u(t ) v(t ) G( q )·u(t )] H 1 ( q )·G0 ( q )·u(t ) H 1 ( q )·v(t ) H 1 ( q )·G( q )·u(t ) H 1 ( q )·[G0 ( q ) G ( q )]·u(t ) H 1 ( q )·v(t )
(6.50)
De acuerdo con el teorema de factorización espectral (ver sección 2.7) y supuesto que la entrada es independiente de la perturbación, el espectro del error de predicción es
u (
e | G0 (e j ) G(e j ) |2 ·
)
| H ( e j ) |2
v ( ) | H ( e j ) |2
(6.51)
Considerando la fórmula de Parseval E [ e 2 (t | )]
6-18
1 2·
·
e ( | )·d
(6.52)
Identificación de sistemas
se llega al siguiente resultado [Ljung y Glad, 1994]: *
lim ˆ N arg min | G0 (e j ) G (e j ) |2 ·
u (
)
| H ( e j ) |2
N
·d
(6.53)
Nótese que en esta expresión no aparece el último término de (6.51) ya que es independiente de . Por lo tanto la estima converge al valor *, el cual hace a la función de transferencia j G ( e , * ) del modelo tan cercana como sea posible a la función de transferencia de la
planta real G0 (e j ) medida en una norma de frecuencia cuadrática con una función de peso
u (
)
| H ( e j ) |2
(6.54)
En el caso de que los datos de la entrada y la salida hayan tenido que ser prefiltrados, usando un prefiltro L(z), es decir, u F (t ) L( z )·u(t )
y F (t ) L( z )· y (t )
entonces la norma de frecuencia cuadrática pasa a ser:
u ( ) | L( e j ) |2 · | H ( e j ) |2 Nótese que seleccionando adecuadamente el prefiltro L, el espectro de potencia de la
u y el modelo de la perturbación
entrada
j H ( e ) es posible controlar los rangos de
frecuencia donde el ajuste entre el modelo y el sistema puede ser mejor. Este resultado ilustra el hecho de como el error de sesgo depende de las condiciones del experimento, en este caso el espectro de la entrada. Expresando el espectro del error de predicción filtrado de la siguiente forma 2
e
F
( )
| L |
2
| H |
[| G0 G |2· u
2·Re((G0 G )·H 0* ( ei )· ua ) | H 0 ( ei ) |2· a2 ]
(6.55)
es posible deducir las principales fuentes del error de sesgo:
6-19
TEMA 6: Identificación de modelos paramétricos discretos
Potencia de la señal de entrada u. La señal de entrada debe tener suficiente potencia en el rango de frecuencias de excitación del sistema. Es decir, debe tener excitación persistente suficiente.
Elección del prefiltro L(z). El prefiltro actúa en el problema de estimación como un peso dependiente de la frecuencia que se debe utilizar para mejorar la bondad del ajuste en ciertas porciones de la respuesta del modelo.
Estructura del modelo G. Aumentar el número d de parámetros del modelo disminuye el sesgo, aunque aumenta el error de varianza.
Estructura del modelo de la perturbación H. Actúa como un peso similar al prefiltro. Los términos de autoregresión (A(z) y D(z)) enfatizan el ajuste a altas frecuencias.
Espectro del ruido | H 0 ( ei ) |2· a2 . Si la dinámica del ruido difiere substancialmente de la dinámica de la planta, un acuerdo entre el ajuste de H 0 y H se producirá siempre que A(z)1.
Espectro cruzado ua. Si la entrada está correlacionada con la perturbación (debido a operación en lazo cerrado) puede producir sesgo. Ajustando adecuadamente las fuentes anteriores es posible disminuir el error de sesgo en los rangos de frecuencia de interés. Se dice que la estima de mínimos cuadrados es consistente (libre de errores de sesgo)( es decir converge a la planta real con probabilidad uno) si cuando N se cumple que
lim
N
1
N
e N
2 F
(t ) lim
t 1
G ( z ) G0 ( z )
N
1
2
eF
( )·d a2
(6.56)
H ( z ) H 0 ( z )
Es decir, la única fuente de error entre el modelo y el sistema real es la perturbación. Nótese que la estima consistente se obtiene cuando se cumplen las siguientes condiciones: 1) La estructura del modelo de la planta G y del ruido H describe al sistema real (G 0 y H0). Es decir, sus órdenes son adecuados.
6-20
Identificación de sistemas
2) La entrada u posee excitación persistente de grado adecuado. Es decir el espectro de la entrada debe ser distinto de cero en un rango de frecuencia adecuado. La teoría no exige que la entrada u y el ruido a tenga que ser secuencias independientes, no correlacionadas (es decir
ua (
)0
), es decir, que la operación
se realice en lazo abierto. Sin embargo, es un requisito deseable en la práctica ya que se simplifica el proceso de identificación. Si existiera un valor 0 tal que j j G ( e , 0 ) G ( e )
entonces de (6.53) *
0 independientemente de u () y H (e j ) si u () es diferente de
cero para un número suficiente de frecuencias. Otro resultado general que también se deduce directamente de (6.47) es el siguiente. Supuesto que en el caso general, que existe un valor 0 tal que el error de predicción e(t , 0 ) y (t ) yˆ (t | 0 ) a (t )
(6.57)
sea ruido blanco a de varianza , entonces de (6.53) se obtiene lo siguiente: V ( ) E [ e 2 (t , )] E [( y(t ) yˆ (t | )) 2 ] E [( a (t ) yˆ (t | 0 ) yˆ (t | )) 2 ]
E [( yˆ (t | 0 ) yˆ (t | )) 2 ]
(6.58)
ya que a(t) es independiente de todos los datos. En consecuencia se observa que *
0 minimiza la varianza
V ( ) . De lo que se
deduce el siguiente resultado ˆ N 0 N
(6.59)
El resultado anterior es valido bajo la siguiente condición: yˆ (t | 0 ) yˆ (t | ) 0
(6.60)
6-21
TEMA 6: Identificación de modelos paramétricos discretos
6.4.4 Error de varianza Sea ˆ N la estima que minimiza la función de coste (6.30) y sea 0 la estima tal que el error de predicción sea ruido blanco a de varianza . Se puede demostrar que el error de varianza de la estima se puede aproximar por la siguiente expresión [Ljung y Glag, 1994]:
P N
E [( ˆ N 0 )·( ˆ N 0 )T ]
·R 1 N
donde ·R es la matriz de covarianza de las estimas cuando N .
Ejemplo 6.3: Considérese un sistema descrito por la siguiente ecuación
y(t ) 0.9· y (t 1) u(t 1) e(t ) La entrada u es ruido blanco de varianza y el ruido {e(t)} es ruido blanco de varianza . Supóngase que se usa para identificar el sistema el siguiente modelo ARX
y(t ) ay(t 1) b·u(t 1) e(t ) El predictor a un paso de la salida que proporciona este modelo es
yˆ (t | ) ay (t 1) b·u(t 1) En este caso el vector de regresión y el vector de parámetros son:
y(t 1) a , θ b u(t 1)
(t )
Además la matriz de covarianza es
1 N 2 1 N y(t 1)·u(t 1) y (t 1) N 1 N t 1 N t 1 T R N (t ) (t ) N N 1 1 N t 1 2 y(t 1)·u(t 1) u (t 1) N t 1 N t 1 Supuesto que
6-22
(6.61)
Identificación de sistemas
1
N
1
N
· x (t 1) · x 2 (t ) N t 1 N t 1 2
y que N entonces la matriz de covarianza toma la siguiente forma:
R
E [ y 2 (t )] E [ y(t )·u(t )] R y (0) R (0) 2 E y t u t E u t [ ( )· ( )] [ ( )] yu
R yu (0) R y (0)
Hay que calcular los valores esperados de diferentes magnitudes. Como la entrada u y el ruido e son independientes se cumple:
E [e(t )·e(t 1)] 0 E [u (t )·u (t 1)] 0 E [e(t )·u (t )] 0 Por otra parte las varianzas de la entrada y el ruido son
E [ e(i ) 2 ] E [u (i ) 2 ] Además como el valor el valor pasado de la salida y es independiente del valor actual de e o de u, se cumple:
E [ y (t 1)·u (t )] 0 E [ y (t 1)·e(t )] 0 Elevando al cuadrado los dos miembros de la expresión del sistema y tomando el valor esperado E[ ], se obtiene la siguiente ecuación
(1 0.81)· R y (0) 1.8·R y (1) Multiplicando la ecuación del sistema por u(t) e tomando el valor esperado se obtiene
R yu (0) E [ y(t )·u(t )] 0 Ya que u(t) es independiente de y(t-1), u(t-1) y e(t). Multiplicando la ecuación del sistema por y(t-1) y tomando el valor esperado se obtiene
R y (1) 0.9·R y (0) 0
6-23
TEMA 6: Identificación de modelos paramétricos discretos
Por lo tanto
R y (0)
0.19
Luego la matriz de covarianza toma la siguiente forma:
R 0.19 0
0
De acuerdo con (6.61) la varianza en la estima aˆ N del parámetro a es:
Var ( aˆ N )
1 0.19· · N
Mientras que la varianza en la estima de bˆ N del parámetro b es
Var (bˆ N )
1 · N
Se observa como la varianza de la entrada influye en la precisión de la estima. Nótese además que si N el error de varianza se hace nulo.
A partir de (6.61) es posible estimar la varianza del modelo estimado para la planta j j G ( e ) y para la perturbación H ( e ) .Sea d el número de parámetros que contiene el
modelo y N el número de datos de entrada-salida disponibles. Si d y N son suficientemente grandes la covarianza asintótica para la estima del modelo es [Ljung y Glag, 1994]: 1
G (e j ) d u ( ) ua ( ) · ( )· Cov v ( ) j N ( ) H e au Donde
u (
) es el espectro de potencia de la entrada,
espectro de potencia de la perturbación y
v ( ) | H 0 (ei ) |2 · a2 es el
ua ( ) *au ( ) es el espectro de potencia
cruzada entre la entrada u(t) y el ruido blanco a(t).
6-24
(6.62)
Identificación de sistemas
En el caso de operar en lazo abierto ( ua ( ) 0 ) la covarianza para la estima del modelo toma la siguiente forma:
j Cov G ( e )
j Cov H ( e )
d ·
d · N
v
v
( )
N
u ( )
( )
d
·| H ( e i ) |2 N
(6.63)
(6.64)
Se observa que la covarianza de la estima del modelo, o lo que es lo mismo el error de varianza, depende del número d de parámetros del modelo, del número N de datos y de la relación ruido-señal. En consecuencia el error de varianza se puede disminuir si se reduce el número de parámetros d del modelo, se aumenta el número N de datos o se aumenta la potencia de la señal de entrada.
6.4.5 Compromiso entre el error de sesgo y el error de varianza En la Figura 6.2 se representa el valor del error de sesgo y del error de varianza de un cierto modelo en función del número de parámetros d del modelo que define la complejidad de un modelo. Se puede observar como el error de sesgo disminuye cuando d aumenta. Por su parte el error de varianza aumenta linealmente cuando d aumenta, lo cual era esperado de acuerdo con (6.63). En consecuencia a la hora de fijar la estructura de un modelo que define el número de parámetros d que contendrá el mismo, hay que llegar a un compromiso entre el error de sesgo y el error de varianza. Para ello se debe escoger el valor de d que minimice el error total, es decir la suma del error de sesgo y del error de varianza (ver Figura 6.3). Si se calculara el error del modelo con el conjunto de datos usados para estimar los parámetros del modelo, no se podría detectar el error de varianza (ver Figura 6.4). Por ello la validación de un modelo, como se explicará en la próxima sección, siempre es deseable realizarla, si es posible, con un conjunto de datos (datos para validar) diferente al conjunto de datos usados para estimar el modelo.
6-25
TEMA 6: Identificación de modelos paramétricos discretos
(a)
(b)
Figura 6.2. [Berenguel, 2004] Evolución típica del error de sesgo (a) y del error de varianza (b) en función del número de parámetros de un modelo que define la complejidad de un modelo
complejidad Complejidad óptima óptima modelo varianza sesgo
Figura 6.3. [Berenguel, 2004] Selección de la complejidad de un modelo como un compromiso entre el error de sesgo y el error de varianza
6-26
Identificación de sistemas
complejidad óptima error con datos para validación error con datos para estimación
Figura 6.4. [Berenguel, 2004] Error de un modelo en función del número de parámetros del modelo calculado con los datos usados para estimar y con los datos usados para validar
En general, los errores de sesgo y varianza no son conocidos, de modo que se suelen estimar varios modelos de diferente complejidad y se comparan los errores evaluados sobre el conjunto de datos usados para validar.
6.5 CONSIDERACIONES SOBRE LA ELECCIÓN DEL TIPO Y LA ESTRUCTURA DEL MODELO PEM 6.5.1 Elección del tipo de modelo De acuerdo con el principio de parsimonia puesto que los modelos ARX son los más fáciles de estimar, siempre se recomienda su utilización como modelo de partida de cualquier problema de identificación de sistemas. La principal desventaja de un modelo ARX es que el modelo de la perturbación H ( q ) 1 / A( q ) comparte los mismos polos que el modelo de la planta G ( q ) B( q ) / A( q ) . En consecuencia es posible tener una estima incorrecta de la dinámica del sistema porque el polinomio A(q) también describe las propiedades de la perturbación. Puede ser necesario que los grados na y nb de los polinomios A y B sean altos. Si la razón señal-ruido es adecuada, esta desventaja es menos importante.
6-27
TEMA 6: Identificación de modelos paramétricos discretos
Un modelo ARX con los órdenes adecuados es capaz de proporcionar una estima consistente. Esto órdenes pueden ser altos, por lo que quizás sea necesario reducir el modelo obtenido En el caso de no obtener buenos resultados con modelos ARX se debe pasar a utilizar modelos ARMAX que presentan una mayor flexibilidad para tratar las perturbaciones, gracias al polinomio C(q) que poseen que genera un modelo de ruido correlacionado. El uso de los modelos OE se recomienda cuando las propiedades de las señales de perturbación no necesitan ser modeladas, es decir, H=1. Permiten obtener una descripción correcta de la función de transferencia determinista G sin importar la forma de las perturbaciones. Sólo cuando no se obtiene buenos resultados con modelos ARX, ARMAX y OE se puede probar a usar modelos BJ, que permiten obtener funciones de transferencia independientes para la parte determinista y la estocástica del modelo. Los modelos BJ son difíciles de estimar ya requieren de muchas iteraciones (computacionalmente costoso) y de una mayor toma de decisiones por parte del diseñador. Los modelos ARX y ARMAX tienen dinámicas comunes (mismos polos) para el ruido a(t) y la entrada u(t). Esto resulta adecuado cuando la perturbación dominante entra “antes” en el proceso, por ejemplo en la entrada. Por otra parte, un modelo BJ es preferible cuando las perturbaciones modeladas entran “después” en el proceso, por ejemplo, como ruido medido en la salida.
6.5.2 Elección de la estructura del modelo Una vez seleccionada la familia o tipo de modelos con la que se va identificar, se deben estimar modelos con distintos órdenes de los polinomios (estructuras) y seleccionar aquel que presenta un menor valor de la función de coste (6.30) al ser evaluada sobre un conjunto de datos (datos de validación) distinto al conjunto de datos utilizados para estimar los modelos (datos de estimación). En ocasiones el número de datos disponibles es pequeño por lo que no es posible reservar un conjunto de datos para validar, es decir, los datos que se usan para estimar los modelos se deben usar también para validarlos. En este caso aparece el fenómeno conocido como sobreestimación o sobreparametrización que consiste en que el modelo que minimiza la función de coste (6.30) es siempre aquel que tiene un mayor número de parámetros. A medida que aumenta el número de parámetros de un modelo se suele 6-28
Identificación de sistemas
obtener un valor más pequeño para la función de coste. Ya que se calcula minimizando sobre un mayor número de parámetros. Si se dibujan los valores de la función de coste como función del número de parámetros se obtiene una curva estrictamente decreciente. El valor de la función de coste disminuye porque el modelo está incluyendo cada vez más propiedades relevantes del sistema real. Sin embargo, aún después de que un orden correcto del modelo ha sido alcanzado la función de coste continúa disminuyendo. Un modelo sobreparametrizado contiene más parámetros de los realmente necesarios, estos parámetros adicionales se utilizan para ajustar el modelo a las señales de perturbación específicas presentes en las series temporales de los datos. El poseer un modelo sobrestimado no sirve para ningún propósito práctico ya que el modelo será utilizado con otras perturbaciones, puesto que éstas suelen tener una naturaleza estocástica. La sobreestimación puede ser evitada utilizando funciones de coste que incluyan un factor f (d,N) que penalice la utilización de un número de parámetros d excesivo. N min f ( d,N ) ε 2 (i, θ) d, i 1 θ
(6.65)
A estas funciones de coste modificadas se las conoce como criterios de información . Los más utilizados son los siguientes:
Error final de predicción de Akaike (FPE)
1 d N 1 2 N ε (i, θ) FPE min d, 1 d N i1 N θ
Criterio teórico de información de Akaike (AIC)
2d N 2 min AIC 1 ε (i, θ) d, N i1 θ
(6.66)
(6.67)
Longitud mínima de la descripción de Rissanen (MDL) N 2d log( N ) ε 2 (i, θ) MDL min 1 d, i1 N θ
(6.68)
6-29
TEMA 6: Identificación de modelos paramétricos discretos
Ejemplo 6.4 Se van a considerar como datos de entrada/salida los suministrados a modo de ejemplo en el fichero
dr yer 2. mat de la toolbox SIT de Matlab. Se van a usar los 500 primeros datos para estimar y los 500 restantes para validar. Se desea obtener el modelo ARX que mejor se ajusta, es decir, minimiza la función de coste (6.30) dentro del rango de estructuras na=1,…,10, nb=1,…,10 y nk=1,…,10. La secuencia de comandos de Matlab necesaria para obtener el mejor modelo es la siguiente:
l oad dr yer 2 Ts=0. 08; dat os0 = i ddat a( y2, u2, Ts) ; dat os1=det r end( dat os0) ; d_est =dat os1( 1: 500) ; d_val =dat os1( 501: 1000) ; NN=st r uc( 1: 10, 1: 10, 1: 10) ; V=ar xst r uc( d_est , d_val , NN) ; NNmi n=sel st r uc( V, 0) ar xsel =ar x( d_est , NNmi n) ; pr esent ( ar xsel )
En la pantalla se mostraría lo siguiente:
NNmi n = 6
9
2
Di scr et e- t i me I DPOLY model : A( q) y( t ) = B( q) u( t ) + e( t ) A( q) = 1 - 0. 9563 ( +- 0. 04574) q^- 1 + 0. 02774 ( +- 0. 06338) q^- 2 - 0. 09131 ( +- 0. 06303) q^- 3 + 0. 09325 ( +- 0. 06298) q^- 4 + 0. 001598 ( +- 0. 06072) q^- 5 + 0. 02927 ( +- 0. 03302) q^- 6 B( q) = 0. 004215 ( +- 0. 001528) q^- 2 + 0. 0644 ( +- 0. 001842) q^- 3 + 0. 0627 ( +- 0. 003486) q^- 4 + 0. 02005 ( +- 0. 00447) q^- 5 - 0. 007039 ( +- 0. 004435) q^- 6 - 0. 01739 ( +- 0. 004395) q^- 7 - 0. 01571 ( +- 0. 004053) q^- 8 - 0. 009152 ( +- 0. 003461) q^- 9 - 0. 005082 ( +- 0. 00261) q^- 10 Est i mat ed usi ng ARX f r om dat a set d_est Loss f unct i on 0. 00140836 and FPE 0. 00149548 Sampl i ng i nt er val : 0. 08
Luego el modelo ARX que minimiza la función de coste es aquel con una estructura (na,nb,nk)=(6,9,2)
6-30
Identificación de sistemas
Ejemplo 6.5 Se van a considerar como datos de entrada/salida los suministrados a modo de ejemplo en el fichero
dr yer 2. mat de la toolbox SIT de Matlab. Se van a usar los 500 primeros datos para estimar y también para validar. Considerando el conjunto de modelos ARX con estructuras na=1,…,10, nb=1,…,10 y nk=1,…,10, se pide : a) Obtener el modelo ARX que minimiza la función de coste (6.30). b) Obtener el modelo ARX según el criterio de información AIC. a) La secuencia de comandos de Matlab necesaria para obtener el mejor modelo es la siguiente:
l oad dr yer 2 Ts=0. 08; dat os0 = i ddat a( y2, u2, Ts) ; dat os1=det r end( dat os0) ; d_est =dat os1( 1: 500) ; NN=st r uc( 1: 10, 1: 10, 1: 10) ; V=ar xst r uc( d_est , d_est , NN) ; NNmi n=sel st r uc( V, 0) ar xsel =ar x( d_est , NNmi n) ;
En la pantalla se mostraría lo siguiente:
NNmi n = 10
10
2
Luego el modelo ARX que minimiza la función de coste es aquel con una estructura (na,nb,nk)=(10,10,2). Se observa que al usar el mismo conjunto de datos para estimar y para validar la estructura seleccionada es aquella que presenta el mayor número de parámetros (na=10 y nb=10). Puede comprobarse que si se aumentase el espacio de estructuras a otras de mayor orden, siempre el modelo ARX que minimizaría la función de coste sería aquella con mayor número de parámetros. Es decir, existe el problema de la sobreestimación. b) Los comandos necesarios para obtener el mejor modelo ARX según el criterio de información AIC es (supuesto que se han escrito ya los del apartado anterior):
NNmi n=sel st r uc( V, ’ ai c’ ) ar xsel b=arx( d_est , NNmi n) ; En la pantalla se mostraría lo siguiente:
NNmi n = 6
10
2
6-31
TEMA 6: Identificación de modelos paramétricos discretos
Luego el modelo ARX que minimiza la función de coste es aquel con una estructura (na,nb,nk)=(6,10,2). Nótese lo próximo que está este modelo al obtenido como mejor modelo en el Ejemplo 6.4.
6.6 VALIDACIÓN DEL MODELO ESTIMADO Es muy importante tener en cuenta que en el proceso de selección y validación de los modelos se debe usar, siempre que sea posible, un conjunto de datos distinto (datos de validación) a los usados para estimar el modelo (datos de estimación), ya que de lo contrario no se ve reflejado el error de varianza. A la validación del modelo con datos distintos a los usados para estimarlo se le denomina en la literatura como validación cruzada . Para analizar la validez del modelo estimado es conveniente realizar los siguientes estudios: verificación del comportamiento de entrada-salida y análisis de los residuos .
6.6.1 Verificación del comportamiento de entrada-salida Para validar el comportamiento de entrada-salida del modelo estimado se deben hacer los siguientes test:
Comparar la respuesta temporal medida con la estimada por el modelo. Para ello se debe utilizar la misma entrada usada en la identificación, así como otras entradas no usadas en la identificación.
Comparar la respuesta a un impulso y a un escalón que proporciona el modelo
identificado con la respuesta a un impulso y a un escalón estimada mediante análisis de correlación. Comparar la respuesta en frecuencia obtenida por el modelo identificado con la
calculada mediante análisis espectral. Puede suceder que un modelo presente un buen comportamiento de entrada-salida pero que sin embargo el análisis de sus residuos indique que no se trata de un buen modelo. Pese al desacuerdo entre ambas validaciones, dependiendo del uso final que se le vaya a dar al modelo (simulación, control, predicción, filtrado,…), quizás el modelo no tenga por qué ser rechazado.
6-32
Identificación de sistemas
Ejemplo 6.6 En la Figura 6.5 se representan la respuesta temporal del modelo ARX (6,9,2) estimado en el Ejemplo 6.4 y la salida medida experimentalmente. Esta figura se puede obtener con el comando de Matlab
compar e( d_val , ar xsel ) ; Se observa que la salida del modelo coincide bastante bien con la salida medida experimentalmente. Además describe el 89.78% de la varianza de la salida. Measured Output and Simulated Model Output 1.5 Measured Output arxsel Fit: 89.78%
1 0.5 0 −0.5 −1 −1.5 −2 40
45
50
55
60
65
70
75
80
Figura 6.5. Representación de la respuesta temporal del modelo ARX (6,9,2) estimado en el Ejemplo 6.4 (línea punteada) y de la salida medida experimentalmente (línea continua)
0
10
e −1 d10 u t i l p m10−2 A −3
10
−1
10
0
1
10
0
) s e e r −200 g e d ( e s−400 a h P
−600 −1 10
2
10
10
arx692 Gspa
0
1
10
10
2
10
Frequency (rad/s)
Figura 6.6. Representación de la respuesta en frecuencia del modelo ARX (3,4,3) estimado en el Ejemplo 6.4 (línea punteada) y de la función de la frecuencia del sistema estimada usando análisis espectral (línea continua)
6-33
TEMA 6: Identificación de modelos paramétricos discretos
En la Figura 6.6 se representan la respuesta en frecuencia del modelo ARX (6,9,2) estimado en el Ejemplo 6.4 y la función de la frecuencia del sistema estimada mediante análisis espectral. Esta Figura se puede obtener con los siguientes comandos de Matlab.
[ Gspa, phi Vspa] =spa( d_est ) ; bode( arxsel , Gspa) l egend( ' ar x692' , ' Gspa' ) Se observa que la respuesta en frecuencia del modelo ARX (6,9,2) es bastante parecida a la función de frecuencia estimada para el sistema, aunque discrepa ligeramente en cuanto al valor de la ganancia a baja frecuencia y en su comportamiento de alta frecuencia.
6.6.2 Análisis de los residuos El error de predicción que produce el modelo estimado para t=1,...,N se calcula de la siguiente forma: e(t ) y(t ) yˆ (t | ˆ N )
(6.69)
El estudio del error de predicción (que se denominan residuos si el modelo del ruido es igual a la unidad) que produce el modelo estimado puede aportar la siguiente información sobre el modelo:
Existencia de dinámicas no modeladas . El modelo no recoge todas las dinámicas
del sistema.
Existencia de realimentaciones de la salida en la entrada . Lo que indica que los
datos utilizados han sido adquiridos en lazo cerrado.
Validez del modelo de la perturbación estimado . En el caso de que se requiera
obtener aparte un modelo de la planta también un modelo de las perturbaciones, entonces se debe exigir que los residuos sean mutuamente independientes. Básicamente el estudio del error de predicción se realiza a partir de la representación gráfica de la estima de la función de correlación cruzada entre la entrada y el error de predicción, y de la representación gráfica de la estima de la función de autocorrelación de los residuos. La función de correlación cruzada entre la entrada y el error de predicción se calcula mediante la siguiente expresión: 6-34
Identificación de sistemas
1 N ˆ Reu ( ) e(t )u(t ) N t 1
| | M
Se puede demostrar que si { e(t)} y {u(t)} son realmente independientes, entonces la estima de la función de correlación cruzada cuando N es grande está distribuida normalmente, con valor medio cero y varianza
Pr
1
Re ( k )· Ru ( k ) N k
donde Re(k) y Ru(k) son las funciones de covarianza de e y u, respectivamente. La estima de la función de covarianza cruzada se suele representar gráficamente junto con la representación de las líneas horizontales
3·
Pr
que definen el intervalo de confianza del 99.7%. Si algún valor de Rˆ eu ( ) sale fuera del intervalo de confianza entonces eso indica que e(t+) y u(t) probablemente son dependientes para dicho valor de . Si >0 entonces el modelo puede que esté incompleto, es decir, pueden existir dinámicas no modeladas. Por ejemplo si se ha utilizado un modelo ARX y Rˆ eu ( ) es significativamente distinto de cero en =0, esto indica que el término u(t- 0) debería ser incluido en el modelo. Lo cual sirve de guía para seleccionar una mejor estructura ARX, en concreto para elegir los órdenes nk y nb. Si no se consigue mejorar habrá que plantearse otros tipos de modelos como un ARMAX. Si hay correlación para valores negativos de , es decir e(t) influye en valores de la entrada u(s) con s>t, entonces ello indica la existencia de realimentación de la salida en la entrada, no que el modelo esté incompleto. La función de autocorrelación de los residuos se define de la siguiente forma: 1 N ˆ Re ( ) e(t )e(t ) N t 1
| | M
6-35
TEMA 6: Identificación de modelos paramétricos discretos
En el caso de que se requiera obtener un modelo de las perturbaciones, entonces se debe exigir que los residuos sean mutuamente independientes, es decir, tengan una distribución similar al ruido blanco. Si los residuos son ruido blanco la función de autocorrelación deberá ser aproximadamente cero (estar dentro del intervalo de confianza) en todos los puntos salvo en el origen. En caso contrario significará que las perturbaciones no están bien modeladas. En general en el análisis de los residuos se puede seguir la siguiente regla: si la representación de la función de autocorrelación de los residuos y la representación de la función de correlación cruzada entre los residuos y la entrada (hay que fijarse en los valores positivos de de la función de correlación cruzada) cruzan significativamente sus respectivos intervalos de confianza entonces el modelo no puede ser aceptado como una buena descripción del sistema. Pese a ello si la verificación del comportamiento de entradasalida ha sido satisfactoria, dependiendo del uso final del modelo éste podría ser considerado como válido. Si se está interesado principalmente en identificar la parte determinista G del modelo, como ocurre con los modelos OE, entonces habrá que concentrarse en conseguir la independencia de los residuos frente a la entrada más que en la blancura de los residuos.
Ejemplo 6.7 Se van a analizar los residuos del modelo ARX (6,9,2) estimado en el Ejemplo 6.4. En la Figura 6.7 se representan la autocorrelación de los residuos y la correlación cruzada entre los residuos y la entrada. Esta Figura se ha obtenido usando el comando de Matlab
r es i d( ar xs el , d_ val ) Se observa que la autocorrelación de los residuos se asemeja a la del ruido blanco por lo que el modelo en cuanto a la modelización de las perturbaciones del sistema es correcto. Por otra parte, la función de correlación cruzada entre los residuos y la entrada no cruza significativamente la región de confianza del 99.7% en desplazamientos (lags) positivos , lo que indica que no existen dinámicas no modeladas. Tampoco la cruza en desplazamientos negativos lo que indica que no existe realimentación de la perturbación en la entrada, es decir, que el sistema durante la adquisición de los datos ha estado operando en lazo abierto.
6-36
Identificación de sistemas
Correlation function of residuals. Output y1 1 0.5 0 −0.5 0
5
10
15 20 lag Cross corr. function between input u1 and residuals from output y1
25
0.2 0.1 0 −0.1 −0.2 −25
−20
−15
−10
−5
0 lag
5
10
15
20
25
Figura 6.7. Análisis de los residuos del modelo ARX (6,9,2) estimado en el Ejemplo 6.4
6.7 REDUCCIÓN DEL MODELO Si el modelo identificado presenta unos órdenes en sus polinomios elevados, se puede intentar simplificarlo buscando cancelaciones de polos y ceros. Si el modelo identificado es de orden (por ejemplo n) mayor que el real (por ejemplo n0) entonces aparecerán n-n0 pares de ceros-polos que se cancelan entre sí de forma aproximada. En dicho caso puede probarse a estimar un modelo con una estructura de orden reducida en el número de cancelaciones que se hayan producido. También otra forma de conseguir un modelo de órdenes más reducidos es usando los criterios de información que penalizan el uso de un número de parámetros excesivos. Obviamente si se valida el modelo reducido se obtendrán peores resultados que con el modelo original. Si el empeoramiento producido no es excesivo el modelo reducido podrá considerarse como válido.
Ejemplo 6.8 En la Figura 6.8 se representa el diagrama de polos y ceros del modelo ARX (6,9,2) estimado en el Ejemplo 6_4. Se muestran además los intervalos de confianza del 99.7% para la posición de los ceros y los polos. Esta Figura se puede obtener con el comando de Matlab.
z ppl ot ( ar xs el , 1)
6-37
TEMA 6: Identificación de modelos paramétricos discretos
Se observa que los intervalos de confianza de dos polos intersecta con los intervalos de confianza de dos ceros, esto indica que se pueden estar cancelando dos polos con dos ceros. Por tanto se puede probar a reducir el modelo ARX (6,9,2) a un modelo ARX (4,7,2). Para quedarse con el modelo reducido habría que validarlo y ver si no es mucho peor que el modelo original. 1 0.8 0.6 0.4 0.2 g m I
0
−0.2 −0.4 −0.6 −0.8 −1 −1
−0.5
0 Real
0.5
1
Figura 6.8. Diagrama de polos y ceros del modelo ARX (5,5,3)
6.8 ALGUNAS DIRECTRICES PARA OBTENER EL MODELO PEM MAS APROPIADO Las siguientes directrices pueden resultar útiles para lograr obtener el modelo PEM más adecuado: 1) Encontrar el modelo ARX que mejor se ajusta dentro del rango de estructuras na=1,…,10, nb=1,…,10 y nk=1,…,10. 2) Si el modelo no se ajusta bien probar otros modelos ARX de órdenes na y nb mayores. Puede que los na y nb necesarios para obtener un buen modelo ARX sean bastante elevados. 3) Intentar reducir el modelo anterior mediante el estudio de las cancelaciones de polos y ceros. 4) Si el modelo ARX reducido no se ajusta bien probar modelos ARMAX, OE o BJ con los órdenes para el modelo de la planta obtenidos en el paso 4 y con modelos de primer o segundo orden para la perturbación.
6-38
Identificación de sistemas
5) Si el modelo obtenido en el paso anterior no resulta adecuado, intentar descubrir si existen entradas adicionales en el sistema que están afectando a la salida. Si pueden ser medidas incluirlas en el modelo. 6) Si se sigue sin obtener un buen modelo utilizar el modelado semifísico, es decir basándose en las leyes físicas que sigue el sistema y en el sentido común probar alguna transformación no lineal sobre los datos de entrada-salida y aplicar sobre los datos transformados la metodología de identificación. Obviamente se presupone que se dispone de datos de entrada - salida de la calidad suficiente, es decir, que el sistema ha sido excitado con una entrada con un grado de excitación adecuado.
BIBLIOGRAFÍA [Ljung y Glad, 1994]
L. Ljung y T. Glad. Modelling of dynamic systems . Prentice Hall. 1994.
[Ljung, 1999]
L. Ljung. System Identification: Theory for the user . 2nd Edition. Prentice Hall.1999.
[Ljung, 2010]
L. Ljung. System Identification Toolbox 7 . The Mathworks. 2010.
[Rivera, 2007]
D. E. Rivera. Introducción a la Identificación de Sistemas . Curso impartido en el Dpto. de Informática y Automática de la UNED del 17-28 de septiembre de 2007.
[Schoukens y Pintelon, 1991]
J. Schoukens, R. Pintelon. Identification of linear systems . Pergamon Press. 1991.
[Söderström y Stoica, 1989]
T. Söderström y P. Stoica, System Identification. Prentice Hall. 1989.
6-39
TEMA 7 IDENTIFICACIÓN DE MODELOS PARAMÉTRICOS CONTINUOS
7.1 INTRODUCCIÓN Las propiedades de un modelo paramétrico en tiempo discreto dependen del periodo de muestreo T que se haya utilizado para muestrear los datos de la entrada y la salida del sistema utilizados para estimar el modelo. Si cambia el periodo de muestreo también cambiarán los polos y ceros del modelo estimado y en consecuencia las características de la respuesta del mismo. Un modelo en tiempo continuo es más general y no sufre de este problema. Por ello resulta más útil, siempre que sea posible, disponer de un modelo continuo del sistema que de uno discreto. En este tema se describen las principales técnicas utilizadas, dentro del marco de la identificación de sistemas, para obtener un modelo continuo de un sistema: obtención a partir de la transformación del modelo discreto identificado, estimación a partir de datos muestreados de las series temporales de la entrada y la salida, y estimación a partir de los datos en el dominio de la frecuencia.
7.2 OBTENCIÓN A PARTIR DE LA TRANSFORMACIÓN DEL MODELO DISCRETO IDENTIFICADO Supóngase que se ha identificado un modelo paramétrico en tiempo discreto ( Gˆ ( z ) ,
ˆ ( z ) ) de un cierto sistema usando datos de entrada-salida muestreados con un cierto H periodo T. A partir de este modelo discreto es posible obtener un modelo en tiempo continuo
ˆ ( s ) ). equivalente ( Gˆ ( s ) y H
7-1
TEMA 7: Identificación de modelos paramétricos continuos
Por simplificar en lo que resta de sección se utilizará la siguiente notación: G(z) es la función de transferencia en tiempo discreto dada y G(s) es la función de transferencia en tiempo continuo que se deriva de G(z). La planta de un proceso real es un proceso en tiempo continuo controlada generalmente por un controlador digital. La señal digital del controlador se pasa de digital a analógico (ver Figura 7.1) usando típicamente un retenedor de orden cero o ZOH (zero order hold) que convierte una señal muestreada u*(t) en una señal en tiempo continuo u(t). Además la salida de la planta y(t) es muestreada para obtener la señal digital y*(t) que es realimentada al controlador.
Figura 7.1. Relación entre G(z) y G(s) usando un ZOH
El circuito ZOH puede ser representado como un integrador que es automáticamente inicializado a cero después de cada periodo de muestreo. Tal sistema tiene la siguiente función de transferencia G zoh ( s )
1 e Ts s
(7.1)
Usando un ZOH las funciones G(z) y G(s) se relacionan de la siguiente forma:
1 e Ts G( s) ·G( s ) (1 z 1 )· Z G ( z ) Z [G zoh ( s )·G ( s )] Z s s
(7.2)
Aplicando la transformada Z inversa se obtiene: G( s) s
G ( z ) Z 1 1 z 1
(7.3)
expresión a partir de la cual sería posible obtener la función G(s) exacta siempre y cuando no existan polos sobre el eje real negativo, sino sólo se puede obtener una aproximación a la misma.
7-2
Identificación de sistemas
Ejemplo 7.1: Supóngase que utilizando los datos de entrada-salida de una cierto sistema muestreado con un periodo de muestreo T=0.1 s se ha identificado el siguiente modelo discreto para la planta:
G ( z )
0.6321 z 0.3679
Se desea obtener la función G(s) equivalente. Si se utiliza un ZOH de acuerdo con (7.2) se tiene la siguiente relación entre G(z) y G(s):
G( s) s
1
Z
0.6321 z 1 G ( z ) Z 1 1 1 z 1 (1 0.3679 z 1 ) 1 z 1
En este caso sencillo usando por ejemplo una tabla de equivalencias entre transformadas z y s se puede encontrar que la transformada de Laplace de
(1 e aT ) z 1 H ( z ) (1 z 1 )·(1 e aT z 1 ) es
H ( s )
a s·(s a )
En este caso se tiene que a=10. Luego
G( s) s
10 s( s 10)
Con lo que finalmente se obtiene que la función G(s) equivalente es:
G(s)
10 ( s 10)
Otra forma de pasar una función de transferencia discreta G(z) a continua G(s) es usar alguna transformación matemática. La variable z de un modelo discreto se relaciona con la variable s de un modelo continuo mediante la siguiente expresión:
7-3
TEMA 7: Identificación de modelos paramétricos continuos
sT z e
(7.4)
Dos aproximaciones utilizadas para esta expresión que derivan de su expansión en serie son: z e
sT
1 sT
z e
sT
1
(7.5)
1 sT
(7.6)
La expresión (7.5) procede de la aplicación del método de Euler que consiste en aproximar la derivada de una señal x(t) en el instante t por la diferencia entre el valor muestreado en el instante (t+T) y el instante t, a esta diferencia se le denomina diferencia hacia delante (forward difference):
px(t )
dx(t ) dt
x(t T ) x(t ) T
q 1 x(t ) T
(7.7)
En la expresión anterior q es el operador desplazamiento y p es el operador diferenciación. Desde el punto de vista de las transformadas s y z, el método de Euler proporciona la siguiente transformación s'
z 1 T
(7.8)
Nótese que se ha utilizado la notación s’ para enfatizar el hecho de que no se obtiene a partir de la variable z la variable s exacta sino una aproximación a la misma. Despejando z de la expresión anterior se obtiene (7.5). Por su parte la expresión (7.6) procede de aproximar la derivada de una señal x(t) en el instante t por la diferencia entre el valor muestreado en el instante (t) y el instante (t-T), a esta diferencia se le denomina diferencia hacia atrás (Backward difference): px(t )
Con lo que
7-4
dx(t ) dt
x(T ) x(t T ) T
q 1 q·T
· x(t )
(7.9)
Identificación de sistemas
s'
z 1 zT
(7.10)
Despejando z de la expresión anterior se obtiene (7.6). Otra aproximación posible que derivada del método trapezoidal de integración numérica es la denominada como aproximación bilineal o aproximación de Tustin: z e
sT
1 sT / 2 1 s' T / 2 1 sT / 2 1 s' T / 2
(7.11)
De las tres aproximaciones propuestas la que más se utiliza es la aproximación de Tustin ya que permite transformar el plano s dentro del círculo unidad del plano z. Con la aproximación (7.5) obtenida por el método de Euler el semiplano izquierdo del plano s es transformado en el semiplano Real[z] <1. En consecuencia una función de transferencia en tiempo continuo todavía seguirá siendo estable si se utiliza la aproximación de Tustin para obtener la función de transferencia discreta, mientras que puede que ésta sea inestable si se usa la aproximación basada en el método de Euler. El principal problema que presenta la aproximación de Tustin es que deforma la escala de frecuencias ya que transforma el plano z en el plano s’ no en el plano s verdadero. Sea v la frecuencia en el plano s’ y la frecuencia en el plano s. Pues bien el intervalo de frecuencias
0.5·
s
s
en el plano s corresponde al intervalo
s v s en el
plano s’. Se puede demostrar que se cumple la siguiente relación entre ambas: v
2
·T 2
·tan
T
(7.12)
Nótese que si T es pequeño entonces v es prácticamente igual a . Luego si se utiliza un periodo de muestreo muy pequeño v es prácticamente igual a en un mayor rango de frecuencias. Por otra parte, es posible modificar la transformación de Tustin para eliminar la distorsión en una frecuencia determinada 1
1 ·T ·s' 2 z 1 ·T 1 tan ·s' 2 1 tan
(7.13)
7-5
TEMA 7: Identificación de modelos paramétricos continuos
La toolbox Control de Matlab dispone de la función d2c para pasar a una función de transferencia discreta a continuo usando entre otros métodos, un ZOH y la aproximación de Tustin.
Ejemplo 7.2: Supóngase que utilizando los datos de entrada-salida de una cierto sistema muestreado con un periodo de muestreo T=0.1 s se ha identificado el siguiente modelo para la planta:
G ( z )
0.6321 z 0.3679
Se desea obtener el modelo continuo equivalente. Usando el método ZOH se obtiene
10 s 10
G( s)
Por otro lado si se utiliza la aproximación de Tustin se obtiene
G( s)
0.4621·s 9.242 s 9.242
En la Figura 7.2 se puede observar el error que posee la G(s) obtenida con la aproximación de Tustin con respecto a la G(s) obtenida con un ZOH. Bode Diagrams 0
From: U(1)
-5 ) B d ( e d u t i n g a M ; ) g e d (
-10 -15 -20 -25 0
e -50 s a h ) 1 P ( Y-100 : o T
-150 -200 0 10
1
10
2
10
Frequency (rad/sec)
Figura 7.2: G(s) usando un ZOH (línea continua) y usando la aproximación de Tustin (línea discontinua).
7-6
Identificación de sistemas
La secuencia de comandos de Matlab que permite obtener estos resultados es la siguiente:
num=0. 6321; den=[ 1 - 0. 3679] ; G=t f ( num, den, 0. 1) ; Gc_z oh=d2c( G, ' zoh' ) Gc_tust i n=d2c(G, ' t ust i n' ) bode( Gc_zoh, Gc_t ust i n)
7.3 ESTIMACIÓN A PARTIR DE DATOS DE ENTRADA-SALIDA TEMPORALES En el control de procesos industriales, los modelos más utilizados para la planta son modelos continuos simples del tipo G( s)
K
1 sT p1
e
sT d
(7.14)
Es decir un modelo de primer orden donde hay que estimar la ganancia en el estacionario K, la constante de tiempo T p1 y el retardo Td. Entre las variantes de este modelo se encuentran el modelo sin retardo (T d=0) G( s)
K
1 sT p1
(7.15)
y el modelo con integrador G( s)
K s·(1 sT p1 )
e
sT d
(7.16)
Además, se pueden considerar dos polos con o sin un cero: G( s)
K (1 sT z ) s·(1 sT p1 )·(1 sT p 2 )
e
sT d
(7.17)
Otra posibilidad adicional es permitir polos resonantes (modelos subamortiguados)
7-7
TEMA 7: Identificación de modelos paramétricos continuos
G( s)
K (1 sT z )
1 2· ·sT r ( sT r )
2
e
sT d
(7.18)
Pueden encontrarse en la literatura varios artículos y libros que discuten como estimar modelos continuos de los tipos comentados a partir de datos de entrada-salida muestreados, por ejemplo [Aström y Hägglund, 1995], [Rake, 1980] y [Ziegler et al., 1943]. La mayoría de los métodos clásicos son de tipo gráfico o semigráfico, como por ejemplo: encontrar la tangente más inclinada a la respuesta a un escalón y calcular la intersección con el eje de tiempo, calcular el área que encierra la curva de respuesta, etc. En el marco de la identificación de sistemas estándar, la estimación de modelos de procesos del tipo (7.14) a (7.18) no difiere de la estimación de cualquier modelo lineal parametrizado discreto. Cualquiera de los modelos (7.14) a (7.18) pueden ser escritos en la forma: G ( s, )
(7.19)
donde es el vector que contiene a los parámetros (K, T d, Tp1,...) del modelo. Para estimar los parámetros usualmente se dispone de un conjunto de N datos muestreados de la entrada u(t) y la salida y(t) t=1,...,N. Supóngase que el periodo de muestreo es constante e igual a T, el modelo (7.19) es muestreado también con este periodo de muestreo obteniéndose el siguiente modelo de tiempo discreto GT ( q, )
(7.20)
La salida que proporciona este modelo es la siguiente: yˆ (t | ) GT ( q, )·u(t ),
t 1,..., N
(7.21)
Los parámetros pueden entonces ser estimados obteniendo el vector de parámetros ˆ N que minimice la función de coste del cuadrado de los errores de predicción: ˆ N arg min
N
[ y(t ) yˆ (t | )]
2
t 1
También es sencillo incluir ruido aditivo en el modelo continuo del sistema:
7-8
(7.22)
Identificación de sistemas
y(t ) G ( p, )·u(t ) H ( p, )·e(t )
(7.23)
donde p denota el operador diferenciación (sustituyendo a s): p
d dt
(7.24)
Simplemente hay que determinando el predictor muestreado adecuado del modelo (7.23) y minimizar el error de la salida predicha por el mismo. Nótese que si se los datos de entrada y salida son filtrados con un filtro de blanqueo L entonces H ( p, ) =1. Las propiedades asintóticas del modelo estimado son bien conocidas. Supóngase que la función de transferencia discreta de la planta del sistema es GT ( e i ) . Entonces para H=1, se puede demostrar que ˆ N
donde
2
arg min | GT (e i , ) G0T (ei ) |2 u ( )· L(ei ) ·d
(7.25)
u ( ) es el espectro de potencia de la entrada. La expresión anterior describe
exactamente en que forma un modelo continuo describe al sistema real. A partir de la versión 6 de la toolbox SIT de Matlab 7.0 es posible estimar modelos continuos simples del tipo (7.14)-(7.18). La forma de referirse a ellos es a través de un acrónimo construido a partir de los siguientes símbolos básicos:
‘P’ significa modelo del proceso (Process Model) . Un número entero denota el número de polos, sin incluir el integrador. ‘D’ significa que el modelo incluye un tiempo de retardo (time Delay). ‘I’ significa que el modelo incluye un integrador (Integrator). ‘Z’ significa que el modelo incluye un cero (zero). ‘U’ significa que el modelo incluye un polo subamortiguado (under-damped). De acuerdo con lo anterior (7.14) se denotaría como P1D, (7.15) como P1, (7.16) como
P1I D, (7.17) como P2ZD y (7.18) como P2ZU. Para crear un modelo de cualquiera de los tipos anteriores se utiliza el comando
i dpr oc y para estimar sus parámetros a partir de un conjunto de datos de entrada-salida
7-9
TEMA 7: Identificación de modelos paramétricos continuos
hay que usar el comando pem. Con estos comandos también es posible incluir condiciones iniciales, modelos de ruido aditivo, fijar el valor de algún parámetro, y establecer cotas superiores inferiores y superiores para los valores de los parámetros. La estimación de modelos continuos simples también se puede realizar desde el GUI de la SIT, en concreto seleccionado la entrada Pr ocess Model dentro del menú Est i mat e.
Ejemplo 7.3: Se van a considerar como datos de entrada/salida los suministrados a modo de ejemplo en el fichero
dr yer 2. mat de la toolbox SITB 6.0 de Matlab 7.0, donde el periodo de muestreo era T=0.08 s. Una vez eliminados los valores medios se van a utilizar los primeros 300 datos para estimar un modelo continuo del tipo
P( s )
K
1 sT p1
e
sT d
La secuencia de comandos necesarios para realizar estas acciones es la siguiente:
l oad dr yer 2. mat z2=[ y2( 1: 300) , u2( 1: 300) ] ; z2=dt r end( z2) ; y=z2( 1: 300, 1) ; u=z2( 1: 300, 2) ; dat a=i ddat a( y2, u2, 0. 08) ; m0=i dpr oc( ' P1D' ) ; m=pem( dat a, ' P1D' ) m0=m; En pantalla aparece lo siguiente
Pr ocess model wi t h t r ansf er f unct i on K G( s ) = - - - - - - - - - - * exp( - Td* s) 1+Tp1*s wi t h
K = 0. 9789 Tp1 = 0. 3789 Td = 0. 22071
Est i mat ed usi ng PEM f r om dat a set dat a Loss f unct i on 0. 0149167 and FPE 0. 0150064 Nótese que como sucedía en el caso discreto después de estimar el modelo continuo hay que validarlo para comprobar si es aceptable o debe ser rechazo. Los test de validación a utilizar son los mismos que en el caso discreto (ver sección 6.6).
7-10
Identificación de sistemas
7.4 ESTIMACIÓN A PARTIR DE DATOS EN EL DOMINIO DE LA FRECUENCIA 7.4.1 Estimación a partir de las transformadas de Fourier de la entrada y de la salida. Supóngase que se disponen de N datos muestreados de la entrada u(t) y de la salida y(t) del sistema a identificar. Si se aplica la transformada de Fourier discreta sobre la entrada y la salida U ( )
N
u(h)·exp( j·2· ·(k 1) * (h 1) / N )
1 k N
(7.26)
1 k N
(7.27)
h 1
Y ( )
N
y(h)·exp( j·2· ·(k 1) * (h 1) / N ) h 1
es posible estimar directamente usando la aproximación del error de predicción un modelo OE continuo G(s): G( s)
s
nf
nb 1
... bnb1 s bnb f 1 ·s ... f nb1 s f nb
b1 ·s
nf 1
(7.28)
La estructura de este modelo queda definida por los órdenes del numerador y del denominador [nb,nf].
Ejemplo 7.4: Se van a considerar como datos de entrada/salida los suministrados a modo de ejemplo en el fichero
dr yer 2. mat de la toolbox SITB 6.0 de Matlab 7.0, donde el periodo de muestreo era T=0.08 s. Una vez eliminados los valores medios se van a utilizar los primeros 300 datos para estimar un modelo OE continuo con estructura [2, 4], es decir
G(s)
b1 ·s b2 s4
f 1 ·s 3 f 2 ·s 2 f 1 ·s f 4
La secuencia de comandos necesarios para realizar estas acciones es la siguiente:
l oad dr yer 2. mat z2=[ y2( 1: 300) , u2( 1: 300) ] ; z2=dt r end( z2) ; y=z2( 1: 300, 1) ; u=z2( 1: 300, 2) ; dat a=i ddat a( y2, u2, 0. 08) ;
7-11
TEMA 7: Identificación de modelos paramétricos continuos
df =f f t ( dat a) ; %Tr ansf or mada de Four i er di scr et a df . t s=0; % Se f i j a el t i empo de muest r eo a 0 par a t r at ar l os dat os en %t i empo cont i nuo nb=2; nf =4; m=oe( df , [ nb nf ] ) En pantalla aparece lo siguiente
Cont i nuous- t i me I DPOLY model : y( t ) = [ B( s) / F( s) ] u( t ) + e( t ) B( s) = - 8. 051e006 s + 9. 937e007 F( s) = s^4 + 7. 272e005 s^3 + 8. 232e006 s^2 + 5. 574e007 s + 1. 015e008 Est i mat ed usi ng OE f r om dat a set df Loss f unct i on 0. 0100484 and FPE 0. 0103338 Nótese que como sucedía en el caso discreto después de estimar el modelo continuo hay que validarlo para comprobar si es aceptable o debe ser rechazo. Los test de validación a utilizar son los mismos que en el caso discreto (ver sección 6.6). Si los datos son muestreados con un periodo de muestreo muy pequeño, suele ser una buena idea aplicar algún filtro pasa baja antes de hacer el ajuste. Por ejemplo si sólo interesa que el modelo este bien ajustado en el rango de frecuencias entre 0 y 10 rad/s entonces el comando OE se debe escribir de la siguiente forma
m=oe( df , [ nb nf ] , ' f ocus' , [ 0, 10] ) En pantalla se muestre el siguiente resultado:
Cont i nuous- t i me I DPOLY model : y( t ) = [ B( s) / F( s) ] u( t ) + e( t ) B( s) = - 349. 6 s + 5637 F( s) = s^4 + 46. 96 s^3 + 517. 9 s^2 + 3194 s + 5695 Est i mat ed usi ng OE f r om dat a set df Loss f unct i on 0. 00610681 and FPE 0. 00628023
7.4.2 Estimación a partir de datos obtenidos del análisis en frecuencia. Si un sistema lineal con función de transferencia G(s) se excita con una entrada de tipo sinusoidal (o cosenoidal) u(t ) u0 ·cos( ·t )
(7.29)
entonces la salida en el estacionario es también de tipo sinusoidal y(t ) y0 ·cos( ·t )
donde 7-12
(7.30)
Identificación de sistemas
G(i ) ·u0
(7.31)
arg G(i )
(7.32)
y0
Excitando al sistema con una entrada sinusoidal de amplitud u 0 a diferentes frecuencias
i i=1,...,N y midiendo las amplitudes y i y las fases i de la salida es posible obtener la magnitud |G(ji)| y la fase argG(j i) del sistema a las diferentes frecuencias i usando las expresiones anteriores. Se puede construir así una tabla [ i, |G(ji), argG(ji)] o representaciones gráficas del modulo y de la fase de G frente a la frecuencia. Se tiene por lo tanto una estima en forma de tabla o gráfica de la función G(j ). Al método descrito de obtención de una estima de la función G(j ) se le conoce como análisis en frecuencia . A partir de los datos del análisis en frecuencia discreta, también es posible estimar directamente usando la aproximación del error de predicción un modelo OE continuo G(s) de la forma (7.28) que se ajuste lo mejor posible a dichos datos.
Frecuencia (rad/s)
Magnitud (u. aritméti cas)
0. 1 0. 14384 0. 20691 0. 29764 0. 42813 0. 61585 0. 88587 1. 2743 1. 833 2. 6367 3. 7927 5. 4556 7. 8476 11. 288 16. 238 23. 357 33. 598 48. 329 69. 519 100
9. 901 9. 7973 9. 5894 9. 1862 8. 451 7. 2502 5. 603 3. 8113 2. 2937 1. 2576 0. 65 0. 32506 0. 15978 0. 077865 0. 037784 0. 018296 0. 0088508 0. 0042795 0. 0020687 0. 0009999
Fase (grados) - 11. 421 - 16. 371 - 23. 381 - 33. 15 - 46. 355 - 63. 254 - 83. 073 - 103. 75 - 122. 77 - 138. 46 - 150. 46 - 159. 23 - 165. 48 - 169. 88 - 172. 95 - 175. 1 - 176. 59 - 177. 63 - 178. 35 - 178. 85
Tabla 7.1: Datos de magnitud y fase obtenidos usando análisis de frecuencia sobre un cierto sistema
Ejemplo 7.5: Supóngase que usando análisis de frecuencia sobre un cierto sistema se han obtenido los puntos de magnitud y fase que se muestran en la Tabla 7.1. Se desea estimar un modelo OE continuo con estructura [1, 2], es decir
G(s)
b1 s
2
f 1 ·s f 2 7-13
TEMA 7: Identificación de modelos paramétricos continuos
La secuencia de comandos necesarios para realizar estas acciones usando la toolbox SIT 6.0 de Matlab 7.0 es la siguiente:
[ w, M_ua, F_g] ; % Vari abl es que cont i enen l os dat os de f r ecuenci a, magni t ud % y f ase, r espect i vament e. F_r ad=F_g*pi / 180; %Paso de l a f ase a r adi anes. X=M_ua. *( cos( F_r ad) +j *s i n( F_r ad) ) ; % Paso de magni t ud a f ase a númer o %compl ej o sys=f r d( X, w) ; % Cr eaci ón de una est r uct ur a que cont enga l os dat os. mp=oe( sys, [ 1 2] ) % Est i ma del model o OE cont i nuo con est r uct ur a [ 1 2] En pantalla aparece lo siguiente
Cont i nuous- t i me I DPOLY model : y( t ) = [ B( s) / F( s) ] u( t ) + e( t ) B( s) = 10 F( s) = s^2 + 2 s + 1 Est i mat ed usi ng OE f r om dat a set sys Loss f unct i on 7. 49973e- 031 and FPE 7. 96364e- 031
10 ) B 0 d ( d u −10 t i n g a −20 M
−30 −1
10
0
1
10
10
2
10
0 ) −50 s o d a r g −100 ( e s a F −150
−200 −1 10
0
1
10
10
2
10
Frecuencia(rad/s)
Figura 7.3: G(s) estimada (línea continua) y puntos experimentales (‘o’) obtenidos mediante análisis de frecuencia
En la Figura 7.3 se representan en un diagrama de Bode los datos experimentales y la función G(s) estimada. Se observa que el ajuste es muy bueno.
7-14
Identificación de sistemas
BIBLIOGRAFÍA [Ljung y Glad, 1994]
L. Ljung y T. Glad. Modelling of dynamic systems . Prentice Hall. 1994.
[Ljung, 2010]
L. Ljung. System Identification Toolbox 7 . The Mathworks. 2010.
[Ogata, 1996]
K. Ogata. Sistemas de Control en Tiempo Discreto . Prentice Hall.1996.
7-15
TEMA 8 IDENTIFICACIÓN EN LAZO CERRADO
8.1 INTRODUCCIÓN Muchos sistemas y procesos trabajan habitualmente en lazo cerrado (ver Figura 8.5), es decir, usando un controlador realimentado con los valores de las salidas, en función de las cuales y según una determinada ley de control genera los valores de las entradas. Algunos sistemas son inestables en lazo abierto por lo que no es posible realizar ningún experimento de identificación sobre ellos. Razones de seguridad o de tipo económico son el principal argumento para operar con el sistema en lazo cerrado. La realización de la identificación en lazo cerrado presenta varias ventajas:
Elimina la necesidad de poner el lazo de control en modo manual durante los experimentos de identificación.
Permite mantener a la planta dentro de los límites habituales de operación.
Posibilita la realización de una identificación “amigable con la planta” de sistemas que en lazo abierto son inestables.
Es importante saber si es posible identificar el sistema en lazo abierto a partir de datos obtenidos operando en lazo cerrado. En general la existencia de realimentación introduce diversos problemas que dificultan la identificación del sistema en lazo abierto, pero éstos pueden ser tratados oportunamente. El principal objetivo de la identificación en lazo cerrado es obtener buenos modelos del sistema en lazo abierto a pesar de la realimentación. Existen diferentes métodos de identificación en lazo cerrado, los cuales se pueden clasificar en dos grandes grupos:
8-1
TEMA 8: Identificación en lazo cerrado
Métodos basados en la aproximación directa. Ignoran la existencia de realimentación e identifican el sistema en lazo abierto usando medidas de la entrada u(t) y la salida y(t). Para obtener estas medidas el sistema es excitado introduciendo una entrada externa ya diseñada (PRBS, multiseno,..) en el punto de consigna r o en la entrada de la planta ud.
Métodos basados en la aproximación Indirecta . Identifican el sistema en lazo cerrado usando medidas de la señal de referencia r y la salida y. Después utilizan esta estima para obtener los parámetros del sistema en lazo abierto supuesto que se conoce exactamente el modelo matemático del controlador.
Los métodos de identificación en lazo cerrado basados en la aproximación directa producen mejores resultados que los basados en la aproximación indirecta. Esto es así porque en la aproximación indirecta se requiere de un conocimiento exacto del controlador, el problema es que en la realidad los controladores más simples, como por ejemplo un PID, pueden no comportarse de acuerdo a su modelo matemático. En este tema en primer lugar se comentan los problemas que presenta la identificación en lazo cerrado. A continuación se describen las características y propiedades de los métodos de identificación en lazo cerrado basados en la aproximación directa. El tema finaliza con una recopilación de las principales conclusiones sobre la identificación en lazo cerrado.
8.2 PROBLEMAS QUE PRESENTA LA IDENTIFICACIÓN EN LAZO CERRADO A menudo resulta peligroso o caro realizar experimentos sobre el sistema del cual se desea obtener un modelo, por este motivo los datos tienen que ser obtenidos durante las condiciones normales de operación del sistema. Usualmente esto significa que el proceso está controlado, es decir opera en lazo cerrado, con lo que la entrada es determinada parcialmente mediante la realimentación de la salida. El principal problema que presenta la identificación en lazo cerrado según palabras de L. Ljung es el siguiente: “el objetivo de la realimentación es hacer que la función de sensibilidad del sistema sea pequeña, especialmente en aquellas frecuencias con presencia de perturbaciones y con un pobre conocimiento del sistema. La realimentación, por lo tanto, empeora la información que los datos medidos contienen sobre el sistema a dichas frecuencias”.
8-2
Identificación de sistemas
En resumen la información sobre el sistema que contienen los datos que se obtienen en lazo cerrado es menor que si se obtienen en lazo abierto. Sería posible aumentar la cantidad de información de los datos medidos en lazo cerrado pero a costa de empeorar el comportamiento del control (su sintonía) del sistema en lazo cerrado. En definitiva cuando se realiza identificación en lazo cerrado se debe llegar a un compromiso entre el comportamiento del control y el grado de información que contienen los datos. Además otros problemas que presenta la identificación en lazo cerrado son los siguientes:
La realimentación introduce correlación entre la entrada u y la perturbación v. Este el motivo por el que algunos métodos de identificación como los no-paramétricos o la aproximación de subespacios, que funcionan bien en lazo abierto, fallan cuando se aplican sobre datos obtenidos en lazo cerrado, excepto si se toman unas medidas especiales.
La acción de control distorsiona la señal de entrada, lo que introduce un error de sesgo adicional al “comerse” parte de la excitación de la señal de entrada.
Ejemplo 8.1: Considérese el siguiente sistema real
y(t ) a 0 · y (t 1) b0 u(t 1) e(t )
(1)
Supóngase que el sistema opera en lazo cerrado usando el siguiente regulador proporcional
u(t ) f · y (t )
(2)
Supóngase que a partir de datos obtenidos de este sistema se desea estimar los parámetros del siguiente modelo ARX:
y(t ) a· y (t 1) b·u(t 1) e(t ) El predictor de la salida es por lo tanto:
yˆ (t | ) a· y (t 1) b·u(t 1) ( b· f a )· y (t 1) Todos las estimas ( aˆ , bˆ ) de los parámetros del modelo tal que bˆ· f aˆ sea un cierto número dado producirán por lo tanto idénticas predicciones con la realimentación existente. En consecuencia
8-3
TEMA 8: Identificación en lazo cerrado
debido a la existencia de realimentación no es posible determinar a0 y b0 de manera única, pese a que el modelo tiene la misma estructura que el sistema real. Si se cambia la ley de control para incluir una señal de referencia r(t) para la entrada, es decir,
u(t ) f ·( y(t ) r (t ))
(3)
El predictor de la salida sería ahora
yˆ (t | ) ( b· f a )· y (t 1) b· f ·r (t 1) Si r no es igual a cero, entonces el predictor distinguirá entre los diferentes valores de a y b.
Figura 8.1. [Ljung y Glad, 1994] Series temporales de la entrada y la salida del sistema realimentado El sistema real (1) controlado por (3) fue simulado con los valores a=-0.9, b=0.5 y f=1. {e(t)} fue simulado con una distribución de ruido blanco con varianza 0.1. La señal de referencia utilizada r(t) fue alternando valores entre 0 y 1 de acuerdo a la Figura 8.2. En la Figura 8.1 se muestran las series temporales de la entrada y la salida del sistema realimentado. Se estimaron para el modelo ARX los parámetros a y b usando 300 datos obteniéndose los siguientes resultados:
aˆ 300 0.8902 0.0521
bˆ300 0.6100 0.0521
Se observa que los valores estimados son bastante aceptables.
8-4
Identificación de sistemas
Por otra parte usando análisis espectral de acuerdo al algoritmo SPA se obtuvo una estima de la función de transferencia del sistema. Se observa en la Figura 8.3 que dicha estima es bastante mala. Estos es debido a que la entrada u(t) está correlacionada con el ruido e(t) debido a la existencia de la realimentación. Recuérdese que el análisis espectral requería que la entrada u(t) y el ruido no estuviesen correlacionados para poder aplicarse.
Figura 8.2. [Ljung y Glad, 1994] Señal de referencia r(t) para el sistema realimentado.
Figura 8.3. [Ljung y Glad, 1994] Diagrama de Bode de la función de transferencia obtenida mediante análisis espectral (línea discontinua), la función de transferencia del sistema real (línea continua)
8-5
TEMA 8: Identificación en lazo cerrado
Ejemplo 8.2: Supóngase un cierto sistema en lazo cerrado con la estructura que se muestra en la Figura 8.5. Supóngase que con la idea de identificar la planta en el punto de consigna se inyecta la señalr 2 de tipo PRBS que se muestra en línea discontinua en la Figura 8.4. Como consecuencia de operar en lazo cerrado el controlador considera dicha entrada como una perturbación y trata de rechazarla; por ello la señal u que realmente recibe la planta a su entrada es la que se muestra en línea continua en la Figura 8.4. Se observa como el controlador ha distorsionado la entrada.
Figura 8.4. [Rivera, 2007] Señal de entrada PRBS original que se inyecta al sistema (línea discontinua) y señal que realmente recibe la planta a su entrada (línea continua) como consecuencia de operar en lazo cerrado
Por otra parte, debe tenerse en cuenta que dados unos datos de entrada-salida podemos encontrar un modelo que se ajuste bastante bien a los mismos sin embargo eso no garantiza que dicho modelo sea un buen modelo de la planta, dependerá de la información sobre la planta que contenga dichos datos. En lazo abierto si se diseña adecuadamente la señal de entrada los datos de entrada y salida contendrán suficiente información de tal forma que identificar un modelo que se ajuste adecuadamente a los datos garantiza (si el error de varianza es pequeño y la estructura del modelo es suficientemente grande para recoger todas las dinámicas de la planta) que se está obteniendo un buen modelo de la planta. En lazo cerrado si se inyecta la misma señal de entrada que la que habíamos diseñado para el lazo abierto, la acción del controlador se “come” parte del grado de excitación de la señal y en consecuencia los datos de entrada y salida pierden información sobre la planta. Por lo tanto, en lazo cerrado identificar un modelo que se ajuste bien a los datos de entrada-salida disponibles no garantiza (si el error de varianza es pequeño y la estructura
8-6
Identificación de sistemas
del modelo es suficientemente grande para recoger todas las dinámicas de la planta) que se esté obteniendo un buen modelo de la planta, dependerá del grado de información sobre la planta que contenga los datos. Dicho grado de información depende de la distorsión que haya introducido el controlador a la señal de entrada inyectada. Cuanto más rápida sea la velocidad de respuesta del controlador mayor será la distorsión de la señal de entrada y menos información contendrán los datos de entrada-salida.
8.3 IDENTIFICACIÓN
EN
LAZO
CERRADO
MEDIANTE
APROXIMACIÓN DIRECTA 8.3.1 Consideraciones generales Considérese el sistema en lazo cerrado de la Figura 8.5 donde C es el controlador, G
0
es la planta, r es una señal de referencia o punto de consigna, ud es una señal de excitación externa, u es la entrada de la planta, y es la salida del sistema y v una perturbación aleatoria.
Figura 8.5. Sistema en lazo cerrado
El sistema real en lazo abierto es:
y (t ) G0 ( q)· u( t) v( t) G0 ( q)· u( t) H 0 ( q)· a( t )
(8.1)
2
donde {a(t)} es ruido blanco con varianza a . En lazo cerrado la entrada de la planta es:
u(t ) ud ( t) C ( q)·( r( t) y( t))
(8.2)
El sistema en lazo cerrado se puede escribir de la siguiente forma (supuesto u d=0):
y ( t ) T0 ( q) r( t) S0 ( q) v( t )
(8.3)
donde S0(q) es la función de sensibilidad de la salida y a la perturbación v:
8-7
TEMA 8: Identificación en lazo cerrado
S0 ( q )
1 1 G0 ( q)C ( q)
(8.4)
Y T0(q) es la función de sensibilidad complementaria:
T0 ( q) 1 S0 ( q)
G0 ( q )C( q)
1 G0 ( q)C ( q)
(8.5)
La identificación en lazo cerrado mediante aproximación directa consiste en: 1. Excitar al sistema en lazo cerrado con una señal de entrada (típicamente PRBS o multiseno bien diseñada) que se inyecta en el punto de consigna (señal de referencia r(t)) o en la entrada de la planta (señal u d(t)). 2. Recoger los datos de la entrada u(t) y la salida y(t). 3. A partir de los datos de entrada-salida medidos obtener un modelo del sistema real en lazo abierto mediante algún método de identificación. Generalmente se suelen obtener modelos basados en la minimización del error de predicción (modelos PEM) cuyas propiedades y obtención fue descrita en el Tema 6 de estos apuntes. Se trabaja con modelos de la forma
y(t ) G ( q, )·u(t ) H ( q, )·e(t )
(8.6)
El predictor a un paso de la salida es 1 1 yˆ (t | ) H ( q, )·G ( q, )·u(t ) (1 H ( q, ))· y(t )
(8.7)
El error de predicción para este modelo viene dado por (t , )
y (t ) yˆ (t | ) H 1 ( q, )·( y(t ) G( q, )·u(t ))
(8.8)
En general, la estima óptima se obtiene de la siguiente forma:
ˆ N donde
8-8
arg minV N ( )
(8.9)
Identificación de sistemas
V N ( )
1
N
1
2 · N
2
(t , )
(8.10)
L( q, )· (t , )
(8.11)
F
t 1
F (t , )
Siendo L algún prefiltro estable que se puede utilizar para realzar ciertos rangos de frecuencia. Con lo que el error de predicción prefiltrado es: F (t , )
L( q, )· H 1 ( q, )·( y(t ) G( q, )·u(t ))
(8.12)
El efecto del prefiltro L puede ser incluido dentro del modelo del ruido y es posible suponer que L(q, )=1 sin pérdida de generalidad.
8.3.2 Consideraciones sobre al error de sesgo Si el número de datos N tiende a infinito, el error de varianza será despreciable, y se puede demostrar (ver sección 6.4.3) que el espectro del error de predicción prefiltrado es:
| L |2 [| G0 G |2· u 2·Re(( G0 G)· H0* ( ei )· ua ) | H0 ( ei ) |2· a2 ] e ( ) 2 | H | F
(8.13)
En la expresión anterior se encuentran presentes todas las fuentes que contribuyen al error de sesgo. Nótese que en lazo cerrado existe correlación cruzada entre la entrada u y la perturbación a debido a la realimentación de la salida sobre la entrada y por ello el término
ua del espectro cruzado entre la entrada y la perturbación a es distinto de cero y contribuye al error de sesgo. Si el número de datos N tiende a infinito se puede obtener una estima consistente, es decir, que las estimas de las funciones de transferencia de la planta y del ruido coincidan con las del sistema real
G ( q) G0 ( q) H ( q) H 0 ( q) Para ello se tienen que cumplir las siguientes condiciones:
8-9
TEMA 8: Identificación en lazo cerrado
1) La estructura de los modelos G y H de la planta y del ruido describe adecuadamente a la planta G 0 y al ruido H 0 del sistema real. Es decir, se ha tenido que elegir estructuras adecuadas para dichos modelos. 2) La entrada u(t) posee excitación persistente de orden adecuado. Es decir, el espectro de potencia de la entrada debe ser distinto de cero en un rango de frecuencias adecuado. Nótese que estas dos condiciones para conseguir una estima consistente son independientes del modo de operación del sistema (lazo abierto o lazo cerrado), es decir, no requieren que la entrada u(t) y el ruido a(t) no estén correlacionados ( ua =0). Sin embargo, en lazo abierto ( ua =0) se puede obtener una estima consistente G de la planta G 0 aunque el modelo del ruido no sea muy bueno. Por el contrario, en lazo cerrado, para obtener una estima consistente G de la planta G 0 se requiere disponer tanto de un buen modelo G de la planta como de un buen modelo H del ruido. Por ello en lazo cerrado modelos PEM que no consideran el ruido como los modelos OE no dan buenos resultados.
8.3.3 Selección del punto de aplicación de la señal de excitación Puede demostrarse que en lazo cerrado la expresión del espectro del error de predicción prefiltrado cuando el número de datos N tiende a infinito toma la siguiente forma:
| L |2 | G0 G |2 | G01T0 |2 r | S0 |2 u |1 GC |2 | S0 |2 v ] (8.14) e ( ) 2 | H | F
d
Analizando la expresión anterior se obtienen las siguientes conclusiones:
Para aquellas frecuencias donde el espectro del ruido v predomine, el espectro del error de predicción se puede minimizar eF 0 cuando el modelo de la planta es igual a la inversa del controlador:
G
Para aquellas frecuencias donde ud / v
1 C
1 o r / v
1 es posible obtener
una estimación sin error de sesgo de la planta, es decir, G=G 0.
8-10
Identificación de sistemas
El espectro en potencia de la entrada ud se ve afectado por la función de sensibilidad S 0 cuyo comportamiento en frecuencia dependerá de la velocidad de respuesta del controlador que se esté utilizando. En general cuanto más rápido sea el controlador más atenuará el contenido a baja y media frecuencia de la señal de entrada externa u d, con la consiguiente pérdida de excitación persistente de dicha señal.
El espectro en potencia de la señal de referencia r se ve afectado por la 1
función G0 T 0 cuyo comportamiento también depende de la velocidad del controlador que se esté utilizando. En este caso si el controlador es muy rápido amplifica el contenido en alta frecuencia de la señal de referencia r . Por el contrario si el controlador es muy lento atenúa el contenido en alta frecuencia. Independientemente de cómo sea el controlador el contenido en baja frecuencia no se ve afectado. Ejemplo 8.3: En la Figura 8.6 se muestra la representación en el dominio del tiempo y el espectro de potencia de una señal PRBS que ha sido diseñada para identificar una cierta planta que opera en lazo cerrado con un esquema como el que se muestra en la Figura 8.5.
Figura 8.6. [Rivera, 2007] Representación temporal y espectro de frecuencia de una cierta señal PRBS
8-11
TEMA 8: Identificación en lazo cerrado
Supongamos que inyectamos está señal en la entrada de la planta, es decir, en el punto ud. En la parte superior de la Figura 8.7 se muestra la amplitud de la función de sensibilidad S0 del sistema con un controlador que ha sido sintonizado para presentar tres velocidades de respuesta distintas. Se observa que cuanto más rápido es el controlador más atenuará el contenido en baja frecuencia de la señal ud(t) y en consecuencia la señal u(t) que realmente recibe la planta en su entrada se diferencia más de la señal inyectada ud(t) como se puede apreciar en la Figura 8.8.
Figura 8.7. [Rivera, 2007] Amplitud de la función de sensibilidad S 0 (figura superior) y de la función 1 G0 T 0 (figura inferior) para un controlador que ha sido sintonizado para presentar tres velocidades de
respuesta distintas: alta (color rojo), media (color verde) y baja (color azul)
Figura 8.8. [Rivera, 2007] Señal de entrada u(t) medida al inyectar la señal PRBS de la Figura 8.6 en ud para un controlador que ha sido sintonizado para presentar tres velocidades de respuesta distintas: alta (color rojo), media (color verde) y baja (color azul)
8-12
Identificación de sistemas
Supongamos ahora que inyectamos la señal PRBS en el punto de consigna, es decir, como señal de 1
referencia r(t). En la parte inferior de la Figura 8.7 se muestra la amplitud de la función G0 T 0 del sistema para un controlador que ha sido sintonizado para presentar tres velocidades de respuesta distintas. Se observa que si el controlador es muy rápido entonces amplifica el contenido de alta frecuencia de la señal. Por el contrario si es muy lento lo amortigua. En ambos casos se observa (ver Figura 8.9) que la señal u(t) que realmente recibe la planta en su entrada se diferencia más de la señal PRBS inyectada en el punto de consigna. Solo cuando la velocidad del controlador es intermedia se consigue que la señal u(t) se asemeje más a la señal PRBS inyectada.
Figura 8.9. [Rivera, 2007] Señal de entrada u(t) medida al inyectar la señal PRBS de la Figura 8.6 como señal de referencia r(t) en el punto de consigna para un controlador que ha sido sintonizado para presentar tres velocidades de respuesta distintas: alta (color rojo), media (color verde) y baja (color azul)
De acuerdo con lo anterior en lazo cerrado para que los datos de entrada-salida contengan la mayor información se recomienda, siempre que sea posible, introducir la señal de excitación en el punto de consigna (señal de referencia r) con el controlador sintonizado de tal forma que su velocidad de respuesta sea intermedia, ni muy alta ni muy baja. Si no queda más remedio que introducir la señal de excitación en la entrada de la planta u d, entonces el controlador debe estar sintonizado para que su velocidad de respuesta sea lenta.
8-13
TEMA 8: Identificación en lazo cerrado
8.3.4 Consideraciones sobre el error de varianza En la sección 6.4.4 se obtuvo la siguiente expresión para LA covarianza asintótica del modelo estimado para la planta G ( e
j
) y para la perturbación H (e j ) , supuesto que el
número de parámetros d que contiene el modelo y N el número de datos de entrada-salida disponibles es suficientemente grande: 1
G ( e j ) d u ( ) ua ( ) · ( )· Cov v 2 ( ) j N ( ) H e au a
(8.15)
Donde u ( ) es el espectro de potencia de la entrada, v ( ) | H 0 (e ) | · a es el i
2
2
espectro de potencia de la perturbación y ua ( ) au ( ) es el espectro de potencia *
cruzada entre la entrada u(t) y el ruido blanco a(t). Si se opera con el elemento (1,1) de (8.15) se obtiene la siguiente expresión:
Cov[ G( e )] j
d
· v ( )·
N
2
a a u ( ) 2
ua ( )
2
(8.16)
Para el caso de considerar en lazo cerrado las entradas externas (ext) r y u d, las cuales se suponen que no están correlacionadas con la perturbación v, se obtiene la siguiente expresión:
Cov[ G( e )] j
d v ( )
·
N u ( ) ext
d
( ) · 1 2 v 2 N | G0 T0 | r | S 0 | u
d
(8.17)
En lazo cerrado el error de varianza en la estima de la planta depende, al igual que sucedía en lazo abierto, de la relación señal ruido
v ( ) . Sin embargo en lazo cerrado la ( ) ext u
potencia de la señal de entrada se ve influenciada por la acción de control. Si se compara el espectro de la salida en lazo cerrado 2
2 y G0 ext u ( ) | S 0 | v
con el espectro de la salida en lazo abierto
8-14
(8.18)
Identificación de sistemas
2
y G0 u ( ) v
(8.19)
Se observa que cabe la posibilidad de generar datos en lazo cerrado que reduzcan la varianza de la señal de salida sin incrementar la varianza de G. Para conseguirlo se necesitará usar en lazo cerrado una señal de entrada externa con una magnitud mayor que la que se necesitaría si se operara en lazo abierto.
8.4 CONCLUSIONES Las principales conclusiones que se pueden extraer sobre la identificación en lazo cerrado son: El principal problema que produce la existencia de realimentación es que la
información que contienen los datos de entrada-salida es menor que en el caso de operar en lazo abierto. La existencia de realimentación también introduce correlación entre las medidas y
afecta al contenido en frecuencia de la señal de entrada, lo que influye en el error de sesgo y en el error de varianza de la estima.
Para identificar en lazo cerrado se requiere usar una señal de excitación externa que se recomienda inyectar en el punto de consigna (r(t)) sintonizando el controlador de tal forma que su velocidad de respuesta sea intermedia.
Los métodos de identificación en lazo cerrado basados en la aproximación directa
proporcionan en la práctica mejores resultados que los métodos basados en la aproximación indirecta.
Si se usa la aproximación directa los métodos basados en el error de predicción con un modelo del ruido que pueda describir las propiedades del ruido que afecta al sistema real pueden proporcionar estimas consistentes de una precisión arbitraria.
Varios métodos que dan estimas consistentes cuando se aplican a datos obtenidos en lazo abierto pueden fallar en lazo cerrado si se utiliza la aproximación directa. Entre estos métodos se encuentran los métodos no paramétricos, el método de la variable instrumental, los métodos basados en subespacios y el uso de modelos OE con un modelo incorrecto del ruido.
8-15
TEMA 8: Identificación en lazo cerrado
BIBLIOGRAFÍA [Forssell and Ljung, 1997]
U. Forsell, L. Ljung L. Issues in closed-loop identification. Informe Técnico LiTH-ISY-R-1940. Department of Electrical Engineering, Linköping University (Sweeden). 1997.
[Forssell and Ljung, 1999]
U. Forsell, L. Ljung, Closed-loop identification Revisited. Automatica, Vol 35, pp 1215-1241, 1999.
[Ljung y Glad, 1994]
L. Ljung y T. Glad. Modelling of dynamic systems. Prentice Hall. 1994.
[Ljung, 1999]
nd
L. Ljung. System Identification: Theory for the user . 2 Edition. Prentice Hall.1999.
[Ljung, 2010]
L. Ljung. System Identification Toolbox 7. The Mathworks. 2010.
[Rivera, 2007]
D. E. Rivera. Introducción a la Identificación de Sistemas. Curso impartido en el Dpto. de Informática y Automática de la UNED del 17-28 de septiembre de 2007.
[Schoukens y Pintelon, 1991]
J. Schoukens, R. Pintelon. Identification of linear systems. Pergamon Press. 1991.
[Söderström y Stoica, 1989]
T. Söderström y P. Stoica, System Identification. Prentice Hall. 1989.
[Van Den Hof y Schrama, 1995]
P. Van Den Hof y R. Schrama, R. Identification and control : closed-loop issues. Automatica. Vol. 31. No. 12. Pp. 17511770, 1995.
8-16
TEMA 9 IDENTIFICACIÓN RELEVANTE PARA EL CONTROL
9.1 INTRODUCCIÓN Los controladores o reguladores son diseñados generalmente basándose en un modelo paramétrico y cuantitativo del sistema dinámico o planta que va a ser controlada. Cuando se identifican modelos de la planta con este fin se debe poner especial cuidado en que el modelo identificado sea particularmente preciso en aquellos aspectos que son más relevantes para el control. Por un lado, para diseñar controladores de complejidad manejable suele ser recomendable que el modelo de la planta sea de un determinado orden limitado. Este requisito obliga a identificar modelos de órdenes reducidos que sean relevantes para el control. Para la identificación de tales modelos, los experimentos en lazo cerrado tienen ventajas particulares. Adicionalmente, la interrelación entre la identificación y el control a ha conducido a una amplia variedad de métodos iterativos en los cuales, la identificación relevante para el control se entrelaza con el diseño y análisis del control, con el objetivo de conseguir una mejora gradual en el comportamiento del controlador. Este tema está dedicado a describir los aspectos básicos de la identificación relevante para control. En primer lugar se analiza la relación existente entre el modelo identificado y el diseño del controlador. En segundo lugar se describe la identificación de modelos aproximados relevantes para control. A continuación se propone un esquema iterativo de identificación y control. Finalmente se describe la realización del proceso de prefiltrado de datos con el objetivo de que el modelo se ajuste a los datos experimentales en aquellas frecuencias que resultan más relevantes para el control.
9-1
TEMA 9: Identificación relevante para el control
9.2 RELACIÓN RELA CIÓN ENTRE EL EL MODELO MODEL O IDENTIFICADO IDENTIFICADO Y EL DISEÑO DEL CONTROLADOR CONTROLADOR Cuando se diseña un sistema de control realimentado para un proceso dinámico, la información que contiene el modelo sobre el proceso juega un papel fundamental. El sistema de control es básicamente diseñado y analizado sobre la base del modelo del proceso utilizado. Dependiendo de cada estrategia de control en particular, la información que debe aportar el modelo es distinta. Por ejemplo los métodos de sintonía de controladores PID y los métodos de ajuste de la función de lazo en el dominio de la frecuencia se basan generalmente en representaciones no paramétricas (gráficas) como la respuesta a un escalón, la respuesta en frecuencia, el espectro de la perturbación, etc. No obstante otras estrategias de control más avanzadas, las cuales típicamente se utilizan en sistemas con múltiples entradas y múltiples salidas, requieren un modelo dinámico paramétrico del proceso, además de un modelo de las perturbaciones que están actuando sobre las señales medidas. En el problema de identificación el proceso es sometido a diversos experimentos, los datos de la entrada y la salida del proceso son utilizados para identificar un modelo del mismo. En la etapa de diseño del control, el modelo identificado es utilizado para diseñar un sistema de control realimentado según una determinada estrategia o metodología de control que cumpla con unos determinados requisitos de comportamiento como estabilidad, rechazo de perturbaciones, seguimiento seguimiento de una señal de referencia, etc. Cuando se considera la cuestión de que modelo identificado sería el más conveniente para servir como base para el posterior diseño del control, existe una respuesta obvia. Si el modelo
representa
exactamente
al
proceso
bajo
consideración,
incluyendo
las
perturbaciones que actúan sobre el proceso, entonces este modelo será el óptimo para todos los posibles usos que se hagan del modelo, incluido el diseño de controladores basados en modelos. Este principio de equivalencia segura que requiere que se construya un modelo exacto y después usarlo para diseño de control, es difícil de justificar cuando el modelo tiene que ser identificado a partir de datos medidos, ya que en este caso el modelo contendrá incertidumbres debidas a las perturbaciones actuando sobre los sensores, tiempo de observación finito, excitación limitada de las señales de entrada, el tipo de modelo considerado, etc. Recuérdese que el modelo contiene un error de sesgo y un error de varianza.
9-2
Identificación de sistemas
En la práctica suele ser imposible caracterizar todos los fenómenos que describen el comportamiento dinámico del proceso. Por lo tanto, los modelos serán necesariamente aproximados. Además, muchos métodos de diseño de control proporcionan controladores cuyos órdenes están esencialmente determinados por el orden del modelo del proceso considerado. considerado. De esta forma, un modelo del proceso de alto orden conducirá a un controlador de orden alto, lo cual puede no resultar factible desde el punto de vista de su implementación. Por lo tanto, para el diseño del control se necesitan modelos aproximados del proceso de orden bajo. Por
otra
parte,
muchos
procesos
industriales
complejos
son
controlados
satisfactoriamente por controladores de orden bajo como por ejemplo los PID. Esto sugiere que los modelos del proceso de orden bajo son suficientes cuando sirven como base para el diseño del control. Para identificar modelos de órdenes bajos que sean relevantes para el diseño del control, es necesario seleccionar adecuadamente tanto los experimentos a realizar como el método de identificación a utilizar. Los modelos que describen con precisión la respuesta en lazo abierto del proceso no son necesariamente buenos para el control. Asimismo los modelos que parecen ser malos desde el punto de vista de la respuesta en frecuencia en lazo abierto pueden ser buenos como base para el diseño del control. Esto es así ya que errores que pueden parecer pequeños en lazo abierto pueden conducir a grandes errores en el comportamiento en lazo cerrado. Por otra parte errores que pueden parecer grandes en lazo abierto pueden no siempre conducir a un mal comportamiento en lazo cerrado. En consecuencia son los requerimientos del control los que dictan la precisión que se requiere para el modelo que se identifique, no al revés. Ejemplo 9.1: En la Figura 9.1 se muestra (en negro) la respuesta en frecuencia de un proceso dinámico, junto con dos posibles modelos del proceso modelo 1(rojo) y modelo 2 (azul). El modelo 2 (azul) es muy exacto en el rango de frecuencias bajas (<0.2 rad/s) pero se desvía en el rango de altas frecuencias. Por su parte el modelo 1 (rojo) es bastante malo en el rango de frecuencias 0.2 rad/s 1 rad/s. La pobre calidad del modelo 1 se pone también de manifiesto en la Figura 9.2a donde se muestra la respuesta a un escalón del proceso real y de los dos modelos propuestos. Cuando se evalúan las propiedades del proceso y los modelos en una configuración en lazo cerrado con un determinado control que consigue un ancho de banda en lazo cerrado de 0.7 rad/s se observa (ver Figura 9.2b) que la respuesta a un escalón en lazo cerrado del modelo 1 es muy parecida a la del proceso real, mientras que la del modelo 2 se desvía bastante.
9-3
TEMA 9: Identificación relevante para el control
En general se puede afirmar que en el diseño de un control basado en un modelo, el modelo del proceso que se utilice debería ser particularmente exacto cerca del ancho de banda del sistema en lazo cerrado. No obstante, la exactitud requerida a otras frecuencias no puede ser especificada de antemano.
Figura 9.1. [Van Den Hof and Callafon, 2003] Respuesta en frecuencia del proceso real (color negro), del modelo 1 (rojo) y del modelo 2 (azul)
(a)
(b)
Figura 9.2. [Van Den Hof and Callafon, 2003] Respuesta a un escalón en lazo abierto (a) y en lazo cerrado (b) del proceso real (color negro), del modelo 1 (rojo) y del modelo 2 (azul)
9-4
Identificación de sistemas
9.3 IDENTIFICACIÓN DE MODELOS A PROXIMADOS 9.3. 9.3.1 1 Identif Identificación icación b asada asada en en el erro errorr de predicci ón Considérese el siguiente sistema o proceso real (ver Figura 9.3) descrito por las siguientes ecuaciones: y(t ) G0 ( q )·u(t ) v(t ) v(t ) H 0 ( q )·e(t )
(9.1)
donde G0 y H0 representa dos sistemas lineales invariantes en el tiempo, u(t) e y(t) son la entrada y la salida del proceso, {e(t)} es una secuencia de ruido blanco y q denota el operador desplazamiento q -1u(t)=u(t-1). La representación H 0 es utilizada para caracterizar la distribución de potencia espectral del ruido aditivo v.
Figura 9.3. [Van Den Hof and Callafon, 2003] Sistema real a identificar
Para un modelo parametrizado {G(q, ), H(q,)} con un vector de parámetros , el error de predicción a un paso filtrado tiene la siguiente expresión: F (t , ) L( q )· H ( q, ) 1 · [ y(t ) G ( q, )·u(t )]
(9.2)
que es utilizado como base para estimar el vector de parámetros, empleando un criterio de identificación (mínimos (mínimos cuadrados) el cual es construido con los datos de la entrada u(t) y de la salida y(t) t=1,...,N del proceso obtenidos experimentalmente. El prefiltro L(q) es una variable de diseño adicional que debe ser elegida por el usuario (ver sección 9.5). Bajo condiciones suaves la estima converge (para N tendiendo a infinito) a una estima límite, la cual para estructuras del modelo con un modelo de ruido f ijo, es decir, H(q, )=H(q), y para u y v no correlacionadas, se puede demostrar que viene dada por la siguiente expresión: 9-5
TEMA 9: Identificación relevante para el control
)· | L( e i ) |2 1 i i 2 u ( )·| d | G0 ( e ) G ( e , ) | · arg min i 2 2 H e | ( ) |
*
(9.3)
* Que pone de manifiesto que en esta configuración el modelo del proceso Gˆ ( q ) G ( q, ) es
obtenido como resultado de la minimización del error cuadrático integrado entre G 0 y G, pesado con una función de peso particular determinada mediante el espectro de la entrada, el prefiltro y el modelo del ruido.
9.3. 9.3.2 2 Desajus Desajuste te modelo mod elo - proc pr oceso eso en en lazo lazo cerrado En el caso en que el modelo Gˆ del proceso vaya a ser utilizado para el diseño de un control basado en un modelo, la aproximación a G 0 dada por Gˆ no debería estar basada en consideraciones en lazo abierto. De hecho la aproximación debería ser dirigida hacia un ajuste en lazo cerrado en el modelo y el proceso, teniendo en cuenta el controlador C(q) que va a ser diseñado. Cuando un controlador C Gˆ es diseñado sobre la base de un modelo Gˆ , el ajuste deseado entre el sistema y el modelo queda verificado mediante la similitud entre los lazos cerrados del proceso controlado (lazo conseguido) y el del modelo controlado (lazo de diseño) tal y como se muestra en la Figura 9.4.
Figura 9.4. [Van Den Hof and Callafon, 2003] Lazo cerrado obtenido (superior) y lazo cerrado de diseño (inferior).
9-6
Identificación de sistemas
Las funciones de sensibilidad de cada uno de estos lazos son: S 0 [1 G0 ·C Gˆ ] 1
(9.4)
ˆ [1 Gˆ ·C ] S Gˆ
(9.5)
1
Mientras que el error entre la salida real y la salida del modelo (ambos en lazo cerrado) es:
y yˆ
G0 ·C Gˆ
1 G0 ·C Gˆ
Gˆ ·C Gˆ
1 Gˆ ·C ˆ
(G0 Gˆ )·C Gˆ ·S 0 ·S ˆ (G0 Gˆ )·W
(9.6)
ˆ W C Gˆ ·S 0 ·S
(9.7)
G
donde
La expresión anterior pone de manifiesto que desde una perspectiva en lazo cerrado, el desajuste relevante entre el modelo y el proceso no debería ser considerado en una forma aditiva simple, sino que el error aditivo debería ser pesado con una función de peso W. Como consecuencia directa de lo anterior, el modelo del proceso Gˆ debería ser preciso en la región de frecuencia donde la función de peso W es grande. Un ejemplo típico es cuando el controlador diseñado C G ˆ contiene una acción integral, lo que implica que a bajas frecuencias | C Gˆ ( e i ) | 1 . En este caso la función de peso verifica la siguiente relación
| W |
1 C Gˆ ·G0 ·Gˆ
1
1
(9.8)
Esto implica que el error del modelo G0 ( q ) Gˆ ( q ) en la región de baja frecuencia no tiene casi influencia en las propiedades en lazo cerrado del modelo. Lo cual ya se puso de manifiesto en el Ejemplo 9.1.
9-7
TEMA 9: Identificación relevante para el control
9.3.3 Criterio de identificación relevante para control El criterio de comportamiento del control realimentado dado por la ecuación (9.6) sugiere el siguiente criterio de identificación para la identificación del modelo Gˆ : 2
2
i 1 1 C (e ) i i 2 * arg min | ( ) ( , ) | · · G e G e d (9.9) 0 2 1 C (e i )·G0 (e i ) 1 C (e i )·G (e i , )
Si se compara este criterio de identificación con el criterio dado por la ecuación (9.3) usado en los métodos de identificación basados en la minimización del error de predicción, es posible hacerlos equivalentes si se considera la siguiente configuración de identificación: C (e ) i
u ( )
L( q)
1 C (e i )·G0 (e i )
2
1 1 C ( q )·G (q, )
H ( q ) 1
(9.10)
(9.11)
(9.12)
En esta configuración, el espectro de la señal de entrada deseada es generado mediante u=C·S0·r. Este espectro se consigue haciendo experimentos con una señal de referencia que tenga una función de densidad espectral plana ( r ( ) 1 ) mientras el proceso es controlado con el controlador C. El prefiltro L que se requiere depende de los parámetros del modelo y puede ser implementado mediante adaptación iterativa de la estimación del modelo. La elección H(q)=1 indica que se debe usar un modelo OE. La configuración de identificación descrita generará datos experimentales y un modelo identificado resultante que por construcción tiene propiedades que refleja aspectos relevantes para el control del proceso. Nótese que el experimento óptimo bajo el cual el proceso debería ser identificado, es igual a la situación bajo la cual el modelo es utilizado. En consecuencia, en el caso de un modelo que vaya a ser utilizado para control, el experimento de identificación óptimo es un experimento en lazo cerrado usando el controlador C G ˆ . Este controlador todavía tiene que ser diseñado, luego es desconocido. Ello sugiere un esquema de identificación y de diseño de control de tipo iterativo. Dicho esquema será explicado en la sección 9.4.
9-8
Identificación de sistemas
9.3.4 Identificación a partir de datos obt enidos en lazo cerrado El problema típico de la identificación en lazo cerrado es el hecho de que la entrada u de la planta está correlacionada con la perturbación v, a diferencia de lo que sucedía en los experimentos en lazo abierto. En los métodos de identificación basados en la aproximación directa (tal y como se comentó en la sección 8.3.7), simplemente se aplica el procedimiento de identificación estándar (error de predicción) sin tomar especiales medidas debido a la presencia de un controlador realimentado. Una estima de los parámetros es obtenida de forma similar al caso en lazo abierto. El criterio de identificación asintótico en el dominio de la frecuencia en este caso viene dado por el espectro del error: 2
S 0 · G0 G ( ) H ( )
2
2
2
· r
H 0 · S 0 2
2
H ( ) · S ( )
2
· 0
(9.13)
donde S(q,)=(1+C·G(q,))-1 es la función de sensibilidad del modelo parametrizado. Esta expresión se obtiene simplemente combinando la ecuación (9.1) y (9.2) con la ecuación del controlador u=C·(r-y). Si G 0 puede ser modelado exactamente dentro del conjunto de modelos elegido, es decir G 0 G , el primer termino del espectro del error se puede hacer cero; pero esto no es necesariamente una solución mínima debido a la presencia de G( ) en el segundo término, cualquier desajuste en este término debido a H(q, ) será compensado a través de G(q,) en S(q,). La aproximación directa puede proporcionar buenas estimas cuando se es capaz de identificar modelos del orden que sea necesario tanto para la dinámica de la planta como para la dinámica del ruido. En el caso de identificar modelos aproximados o cuando no se considera el modelado de la dinámica del ruido completa, G 0 no es identificado consistentemente, y el criterio que gobierna la identificación aproximada de G 0 no es ajustable explícitamente por el usuario. Es decir, no tomará una forma simple como la dada por (9.3) con el error aditivo en G 0 ponderado con una función de peso conocida. Para conseguir en una identificación en lazo cerrado un desacoplo entre G 0 y H0 se pueden usar otros aproximaciones a la identificación en lazo cerrado como la aproximación indirecta o la aproximación de entrada-salida conjunta. En los métodos basados en la aproximación indirecta se identifica el siguiente sistema en lazo cerrado
9-9
TEMA 9: Identificación relevante para el control
y (t ) T (q )·r (t ) W ( q )·e(t )
(9.14)
ˆ (q) . a partir de las medidas de r(t) e y(t). Se obtienen por tanto los modelos T ˆ (q ) y W Supuesto además que el controlador C es conocido es posible obtener los modelos Gˆ y H
en lazo abierto a través de la siguiente expresión:
ˆ (q ) T
C ( q )·Gˆ ( q )
1 C (q )·Gˆ ( q )
(9.15)
ˆ (q) W
H ( q )
1 C ( q )·Gˆ (q )
(9.16)
En los métodos basados en la aproximación de entrada-salida conjunta, como por ejemplo el método de las dos etapas, en primer lugar se identifica el siguiente sistema: u (t ) M (q )·r (t ) N (q )·e(t )
(9.17)
ˆ. A ˆ y N a partir de las medidas de u(t) y r(t). Se obtienen por tanto los modelos M continuación se construye la siguiente entrada para la planta libre de ruido:
ˆ (q)·r (t ) uˆ (t ) M r
(9.18)
La cual es utilizada en una segunda etapa para identificar el sistema r y (t ) G0 ( q )·u (t ) H 0 ( q)·S 0 ( q )·e(t )
(9.19)
donde la señal de entrada libre de ruido u r =C(q)·S0(q)·r(t) que es no medible es sustituida por su estima uˆ r (t ) . Nótese que en este método no es necesario ningún conocimiento explícito sobre el controlador. Los métodos anteriores basados en la aproximación indirecta o en la aproximación de entrada-salida conjunta permiten la identificación separada de modelos para la planta y el ruido. Cuando dichos modelos son parametrizados de forma independiente (o usando un modelo de ruido fijo W * ) el criterio de identificación asintótica para la estimación de G 0 toma la siguiente forma en el caso de la aproximación indirecta:
9-10
Identificación de sistemas
* arg min
1 | G0 (e i ) G (e i , ) | 2 · 2
2
C (e )·S 0 (e )·S (e , ) · r ( ) i
i
i
| W * | 2
d
(9.20)
el cual se ajusta perfectamente al criterio requerido formulado en (9.9) (en el caso del método de las dos etapas la expresión de este criterio varia ligeramente). Esto implica que en el caso con una elección aproximada de r y W * el criterio, que es requerido desde el punto de vista de relevancia para el control, puede ser realizado exactamente mediante la aplicación de un método de identificación en lazo cerrado basado en la aproximación indirecta. En el caso particular de señales de excitación periódicas, la identificación separada de G 0 y H 0 puede ser conseguida mediante la estimación de modelos del ruido no paramétricos. Las consideraciones realizadas hasta ahora han sido sobre las propiedades asintóticas de las estimas. Esto se refiere a las propiedades de sesgo asintóticas de los modelos identificados. Para analizar la varianza asintótica de las funciones de transferencia estimadas, es conocido que cuando el orden n (número de parámetros) del modelo y el número de datos N tienden a infinito se obtiene: 1
Gˆ (e i ) n ( ) eu ( ) · v ( )· u cov ˆ (e i ) N ( ) H 0 ue
(9.21)
Que conduce a e u cov Gˆ · r · r ·1 r N u N u u
(9.22)
eu n v u n v ˆ cov H · · r · ·1 r N 0 u N 0 u
(9.23)
n v
n v
Siendo ur la densidad espectral de u r , y ue la densidad espectral de u e=- C·S0·v, es decir, la parte de la señal de entrada que se origina a partir de e. Estas expresiones de la varianza se mantienen para todos los métodos de identificación en lazo cerrado independiente de la aproximación usada. Estas expresiones muestran que sólo la parte libre de ruido u r de la señal de entrada contribuye a la reducción de la varianza de las funciones de transferencia. Nótese que si se
9-11
TEMA 9: Identificación relevante para el control
hace ur =u (ue=0) se obtienen los resultados correspondientes al caso en que el sistema hubiese sido identificado en lazo abierto. En el caso en que el espectro de la señal de entrada es limitado, se observa que sólo parte de dicha potencia de entrada puede ser utilizada para reducir la varianza. Este hecho conduce a los siguientes resultados:
Si la potencia de entrada es ilimitada y el controlador es diseñado sólo en base a
ˆ , el experimento de identificación óptima para minimizar el coste de Gˆ y no de H la varianza del comportamiento del control es un experimento en lazo abierto con un espectro de entrada que es proporcional a la función de sensibilidad del sistema en lazo cerrado que vaya a ser diseñado.
Si durante los experimentos de identificación la potencia de la salida está limitada, entonces los experimentos en lazo cerrado son entonces los óptimos.
ˆ , entonces los experimentos Si el controlador es diseñado en base tanto Gˆ y de H en lazo cerrado son entonces los óptimos.
9.4 IDENTIFICACIÓN Y CONTROL ITERATIVOS La situación descrita en las secciones anteriores muestra que los modelos relevantes para el control son obtenidos cuando la identificación tiene lugar bajo condiciones experimentales en lazo cerrado con el controlador (que aún tiene que ser diseñado) C ˆG siendo implementado sobre el proceso. Como este controlador es desconocido antes
que el modelo sea identificado se requiere un esquema iterativo para llegar a la situación deseada:
Paso 1. Realizar un experimento de identificación con el proceso siendo
controlado por un controlador de estabilización inicial C.
Paso 2. Identificar un modelo Gˆ con un criterio relevante para control.
Paso 3. Diseñar un controlador C ˆG usando el modelo obtenido en el paso 2.
Paso 4. Usar el controlador diseñado en el paso 3 sobre el proceso y volver al
paso 1 usando este nuevo controlador.
9-12
Identificación de sistemas
Figura 9.5. [Van Den Hof and Callafon, 2003] Esquema iterativo de identificación en lazo cerrado y diseño del control.
Este esquema iterativo es ilustrado en la Figura 9.5. Otro motivo para aplicar un esquema iterativo es el hecho de que cuando se diseña un sistema de control, las limitaciones de comportamiento no son conocidas de antemano. Por lo tanto, el esquema iterativo
propuesto
puede
también
ser
considerado
para
permitir
mejorar
las
especificaciones de comportamiento del sistema de control, según se va teniendo un mejor conocimiento del sistema mediante los experimentos de identificación. De esta forma, el conocimiento mejorado de la dinámica del proceso permite el diseño de un controlador con un comportamiento mejor. Otra visión alternativa del esquema iterativo propuesto se obtiene considerando una función de coste para el comportamiento del control J (G0 , C Gˆ ) , relacionada al sistema en lazo cerrado con el proceso G 0 y el controlador C ˆG , J puede ser por ejemplo una función de sensibilidad ponderada: J (G0 , C Gˆ )
V
1 C Gˆ ·G0
(9.24)
9-13
TEMA 9: Identificación relevante para el control
que tiene como objetivo a un sistema de control que satisfaga la especificación: |S 0(ei)| < |V(ei)|-1, elecciones alternativas para J incluyen un criterio LQ/LQG, control con referencia a una modelo, optimización robusta y esquemas de control H . En esta notación se presupone que el controlador C puede ser también una función del
ˆ . La meta del sistema de control es conseguir un valor mínimo de modelo del ruido H J (G0 , C Gˆ ) mediante la elección apropiada de Gˆ y C ˆG . La siguiente desigualdad triangular
es de gran ayuda para estudiar este problema: J (Gˆ , C Gˆ ) J (G0 , C Gˆ ) J (Gˆ , C Gˆ ) J (Gˆ , C Gˆ ) J (G0 , C Gˆ ) J (Gˆ , C Gˆ )
(9.25)
En ella se observan tres términos diferentes:
J (G0 , C Gˆ ) , el comportamiento conseguido.
J (Gˆ , C Gˆ ) , el comportamiento diseñado.
J (G0 , C Gˆ ) J (Gˆ , C Gˆ ) , la degradación del comportamiento.
Tomando como punto de partida que hay que obtener un comportamiento de diseño que hay que satisfacer, dos requerimientos pueden ser formulados para conseguir un alto comportamiento de la planta controlada: 1) Comportamiento nominal alto . Se consigue si J (Gˆ , C Gˆ ) es pequeño.
2) Comportamiento robusto . Se consigue si
J (G0 , C Gˆ ) J (Gˆ , C Gˆ ) J (Gˆ , C Gˆ ) .
Nótese que si se cumple este requerimiento, entonces la diferencia entre la función de comportamiento diseñada J (Gˆ , C Gˆ ) y la función de comportamiento conseguida J (G0 , C Gˆ ) es relativamente pequeña.
En la aproximación iterativa ambos requerimientos son incorporados como pasos separados: minimizando el coste de comportamiento diseñado J (Gˆ , C ) sobre C para un modelo fijo Gˆ (diseño del control), y minimizando el término de degradación del
9-14
Identificación de sistemas
comportamiento J (G0 , C Gˆ ) J (Gˆ , C Gˆ ) sobre G para un controlador fijo C (identificación relevante para el control). En este caso, el término de degradación puede ser interpretado como un criterio de modelado inducido por el comportamiento del control: Gˆ arg min J (G0 , C ) J (G, C )
(9.26)
G
Si se considera la elección de J dada por (9.24) el criterio anterior toma la siguiente forma: Gˆ arg min G
V ·(G0 G )·C
(1 C ·G0 )·(1 C ·G )
(9.27)
Nótese que para una norma-2 este criterio tiene la misma expresión que la expresión del sesgo para los métodos de identificación en lazo cerrado dada por (9.9). Mediante la minimización del término de degradación del comportamiento, y haciéndolo mucho más pequeño que el coste diseñado J (Gˆ , C Gˆ ) , se sigue a partir de la desigualdad triangular (9.25) que el comportamiento obtenido es forzado a estar cerca del comportamiento diseñado, es decir, J (Gˆ , C Gˆ ) J (G0 , C Gˆ )
Esto es exactamente lo que el ingeniero que diseña el control intenta conseguir: diseñar un controlador basado en un modelo que (después de ser implementado sobre el sistema real) presente un coste del comportamiento que sea similar al comportamiento del modelo controlado. En general los esquemas iterativos tal y como han sido descritos no garantizan la convergencia hacia un mejor modelo y un mejor controlador, aunque se pueden construir esquemas robustos que sí la garantizan. El esquema iterativo propuesto podría asemejarse con el control adaptativo donde recursivamente en cada paso de tiempo un modelo actualizado es identificado y un nuevo controlador es diseñado. Sin embargo en este esquema, no hay ninguna necesidad de actualizar el modelo diseñado y el controlador en cada paso de tiempo, sino únicamente después de la realización de experimentos separados. En consecuencia sería un control adaptativo “extremadamente lento”. 9-15
TEMA 9: Identificación relevante para el control
9.5 PREFILTRADO RELEVANTE PARA CONTROL Cuando se desea identificar modelos relevantes para el control, todas las etapas de la metodología de identificación (diseño de la señal de entrada, selección de la estructura del modelo, estimación de parámetros y validación del modelo) se deben considerar desde el punto de vista relevante para control. En esta sección nos vamos a concentrar en la etapa de estimación de parámetros usando métodos basados en el error de predicción, en particular en el desarrollo de un prefiltro relevante para control. El prefiltrado actúa como un peso dentro de la función de coste utilizada para estimación, y es por tanto una de las variables de diseño mas importantes para selectivamente enfatizar la bondad del ajuste en la identificación. El propósito del prefiltrado relevante para el control es enfatizar aquella información contenida en los datos de entrada-salida que resulta más importante para propósitos de control.
9.5.1 Estimación de parámetros relevantes para control Las especificaciones de control pueden estrechar las regiones de tiempo y frecuencia sobre las cuales un ajuste adecuado del modelo es necesario. Por lo tanto, si las especificaciones de control son incorporadas dentro del problema de estimación de parámetros, es posible obtener modelos mejorados sobre la banda de frecuencia que es importante para el problema de control. Este es el objetivo del problema de estimación de parámetros relevantes para el control (PEPRC). En el sentido matemático más general el
PEPRC es un problema de optimización que requiere minimizar un funcional del error ponderado entre el modelo de la planta verdadero y el modelo estimado: PEPRC min f ( peso, error ) mod elo
(9.28)
El PEPRC lleva al tema de sistemáticamente seleccionar la descripción del funcional, el peso y el error para ajustar el problema de control a mano. En las siguientes secciones se mostrará como el prefiltrado actúa como un peso dependiente de la frecuencia en el problema de estimación de parámetros. A continuación se derivará un prefiltro relevante para el control a partir de la norma-2 de una función objetivo en lazo cerrado.
9-16
Identificación de sistemas
9.5.2 Efecto del prefiltrado en la estimación de parámetros El objetivo es conseguir una estimación tal que las propiedades importantes de la planta con respecto al control deseado estén retenidas en el modelo. Se va a suponer que la planta es descrita por el siguiente modelo lineal: y(t ) G0 ( q )·u(t ) v(t ) v(t ) H 0 ( q )·e(t )
(9.29)
donde v(t) es una secuencia de ruido estacionaria con potencia espectral v . Se desea estimar un modelo para la planta de la siguiente forma: y(t ) G ( q )·u(t ) H ( q )·e(t )
(9.30)
Aplicando el prefiltro L(q) tanto a la entrada como a la salida se obtiene: y F (t ) L( q )· y(t ) u F (t ) L( q )·u(t )
(9.31)
Con lo que el error de predicción filtrado toma la siguiente forma:
eF (t ) L( q )· H 1 ( q )·[(G0 ( q ) G ( q ))·u(t ) v(t )]
(9.32)
La función objetivo o función de coste para la estimación de los parámetros es: V
1
N
[e N
F
(t )]2
(9.33)
t 1
Esta función se puede escribir de la siguiente forma cuando N :
1 | L( e i ) |2 i i 2 | G0 (e ) G(e ) | · u ( ) v ( )· i 2 ·d lim V N 2· | H ( e ) |
(9.34)
Esta expresión pone de manifiesto algunas fuentes de error de sesgo en el problema de estimación: la densidad espectral de la señal de entrada u , la elección del prefiltro L(q), la estructura de G y H, y la densidad espectral de la señal de perturbación v . Esta expresión también pone de manifiesto que L(z) actúa como un peso dependiente de la frecuencia sobre el espectro de potencia del error de predicción, por lo tanto permite al
9-17
TEMA 9: Identificación relevante para el control
diseñador enfatizar selectivamente en que rango de frecuencias desea que la estimación de los parámetros sea más precisa. Este conocimiento, sin embargo, resulta de poca utilidad para el diseñador del control si no dispone de unas directrices claras sobre como diseñar L (q).
9.5.3 Obtención de un prefiltr o relevante para control La identificación relevante para control requiere que se conozca el problema de control (ver Figura 9.6) para el cual se desea obtener un modelo de la planta. Aparte de la estructura del modelo, se debe especificar de antemano el tipo de modelo a ser identificado (planta o perturbación), la estructura del controlador (realimentado, feedforward, PID, ...) y el carácter de la respuesta (constantes de tiempo en lazo cerrado, porcentaje de sobreelongación, etc). Esta información es normalmente conocida para el ingeniero en el momento en que se va a realizar la estimación de parámetros.
d r +
u
e -
C
+
G0
y
Figura 9.6. Sistema de control realimentado clásico
Supóngase que se desea realizar la estimación relevante para el control de la planta G0(z) que va a ser utilizada en un sistema de control realimentado con un único grado de libertad. El objetivo de control es minimizar la norma-2 del error de control e C=r-y:
eC
2
2 eC ( k ) k 0
1/ 2
(9.35)
Considérese el modelo estimado Gˆ ( z ) el cual ha sido obtenido a partir del ajuste sobre los datos de entrada-salida del sistema verdadero G 0(z). Se va suponer un controlador realimentado C(z) diseñado con Gˆ ( z ) : u(t ) C ( q )·e(t )
(9.36)
Se tienen, por tanto, las siguientes funciones de sensibilidad y de sensibilidad complementaria para la respuesta nominal en lazo cerrado: 9-18
Identificación de sistemas
S ( z ) [1 Gˆ ( z )·C ( z )] 1
(9.37)
)·[[1 Gˆ ( z )·C ( z )] 1 T ( z ) 1 S ( z ) Gˆ ( z )·C ( z )·
(9.38)
Cuando C(z) es implementado sobre la planta verdadera G 0(z) el deterioro resultante en el comportamiento del control causado por el desajuste entre el modelo y la planta se puede representar de la siguiente forma: eC ( z )
S ( z )
( r d )
(9.39)
em ( z ) (G0 ( z ) Gˆ ( z ))Gˆ 1 ( z )
(9.40)
1 T ( z )·em ( z )
donde
es el error multiplicativo entre la planta verdadera y el modelo estimado. La estabilidad de C sobre Gˆ ( z ) , el modelo estimado, no asegura la estabilidad con respecto a G0(z), la planta verdadera. La estabilidad del sistema de control es mucho más rigurosamente determinada usando el criterio de estabilidad de Nyquist sobre T(z)·e m(z). Un requerimiento de estabilidad computacionalmente más simple es usar el teorema de ganancia pequeña:
| T (e j )·em ( e j ) | 1
(9.41)
Si dicho teorema se cumple entonces es posible desarrollar e C en serie de Taylor: eC ( z ) S · (1 T ·em (T ·em ) 2 ....)( r d )
(9.42)
Truncando en el segundo termino se obtiene la siguiente aproximación: eC ( z ) S · (1 T ·em )( r d )
(9.43)
Esta aproximación es especialmente válida cuando | T (e j )·em (e j ) | 1 sobre el ancho de banda definido mediante S·(r-d). Sustituyendo la aproximación en (9.35) se obtiene una expresión aproximada para la función objetivo la cual puede ser escrita en el dominio de la frecuencia usando el teorema de Parseval:
9-19
TEMA 9: Identificación relevante para el control
eC
2
1 2 2 2 | | · | 1 · | | | · S T e r d d m 2· 1/ 2
eC
2
1 2 2 | | · | | · S r d d 2·
1/ 2
(9.44)
1/ 2
1 2 2 2 | | · | · | · | | · S T e r d d m 2·
(9.45)
La expresión anterior tiene dos términos, uno está basado en las propiedades nominales de la respuesta en lazo cerrado supuesto que Gˆ ( z ) G0 ( z ) , y el otro basado en la reducción del error multiplicativo e m. El planteamiento del PEPRC se obtiene minimizando la contribución que surge del error de identificación
1 2 j 2 j 2 j 2 min | ( ) | · | ( ) | · | | · | ( ) | S e T e r d e e d m Gˆ 2·
1/ 2
(9.46)
De la expresión anterior que define el PEPRC se pueden deducir las siguientes conclusiones conclusiones importantes:
Es un problema de error multiplicativo ponderado, al contrario del error aditivo no ponderado e a=G-G0 que se utiliza habitualmente en la literatura de control.
La función de peso |S·T·(r-d)| incorpora explícitamente la respuesta en lazo cerrado deseada y la descripción referencia/perturbación referencia/perturbación del problema.
La definición del prefiltro es obtenida comparando las expresiones (9.34) y (9.46). Supuesto que la entrada u es ruido blanco (con lo que u 1 ) y despreciando el término asociado con la perturbación v(t) se obtiene la siguiente expresión para el prefiltro:
ˆ ( z )·Gˆ 1 ( z )·S ( z )·T ( z )· )·((r ( z ) d ( z )) L( z ) H
(9.47)
Se observa que el prefiltro L(z) consta de cuatro componentes:
Las funciones de sensibilidad S(z) y de sensibilidad complementaria T(z) , que
definen la respuesta en lazo cerrado de la planta. Cuanto más rápida sea la velocidad de respuesta deseada, mayor será el rango de frecuencia en que debe coincidir el modelo estimado con el sistema real, y por lo tanto mayor será la
9-20
Identificación de sistemas
necesidad para obtener un buen modelo. Por otro lado, si se desea una respuesta lenta, un modelo simple podría resultar adecuado.
La descripción referencia/perturbación r - d. Si el sistema de control es diseñado diseñado
para rechazar escalones, rampas, o perturbaciones estacionarías influirá en los requerimientos requerimientos del ajuste.
El modelo estimado de la planta Gˆ ( z ) . La estimación de parámetros relevantes para el control requiere la minimización de error multiplicativo ponderado e m. Los métodos basados en el error de predicción, sin embargo, minimizan el error aditivo ponderado e a. Por lo tanto, la inversa del modelo modelo identificado identificado debe ser incluida incluida en el prefiltro. Puesto que Gˆ ( z ) es desconocido inicialmente, la implementación del prefiltro es inherentemente inherentemente iterativa.
ˆ ( z ) . El modelo del ruido actúa como un peso en el El modelo estimado del ruido H problema de estimación lo cual podría producir un error de sesgo nocivo. Para eliminarlo, el modelo del ruido es incluido en la definición del prefiltro.
Ejemplo 9.2: Considérese un modelo estimado de primer orden de tipo OE definido mediante la siguiente expresión:
Gˆ ( z )
0.096 ˆ ( z) 1 ; H z z 0.904 k
(1)
Esta planta tiene una constante de tiempo de 10 minutos y es muestreada con un periodo T=1 minuto. Supuesto que la constante de tiempo deseada en lazo cerrado es de 5 minutos, representada por la siguiente expresión de primer orden:
T ( z )
(1 ) 0.1813 z z 0.818
(2)
Donde =exp(-T/cl) y cl es la constante de tiempo en lazo cerrado. Un controlador PI adecuadamente sintonizado podría conseguir esta respuesta en lazo cerrado. Supóngase adicionalmente, que el sistema está sujeto a perturbaciones de tipo escalón a su salida:
9-21
TEMA 9: Identificación relevante para el control
T ( z )
z z 1
(3)
Usando (9.47), el prefiltro que se obtiene para este sistema es:
z· ( z 0.904 ) 1 z( z ) 1 . 89 · · 2 ( z 0.818) 2 k ( z )
L( z )
(4)
Por otra parte, si la constante de tiempo deseada en lazo cerrado fuera de 10 minutos entonces la expresión del prefiltro sería:
L( z ) 1.89·
z
( z 0.904) 2
(5)
Obsérvese que tanto (4) como (5) son esencialmente filtros pasa-baja con un ancho de banda definido por la velocidad de respuesta del sistema en lazo cerrado. Esto significa que el énfasis de la estimación está situado en preservar un buen ajuste en el rango de bajas frecuencias, las cuales son las que tienen más impacto en el problema de control, mientras que ignora el comportamiento de altafrecuencia el cual no tiene un efecto significativo en la respuesta en lazo cerrado. Puesto que el prefiltro (4) demanda una velocidad de respuesta más rápida que el prefiltro (5), su ancho de banda es mayor. Si el objetivo de control es cambiado de perturbaciones escalón a rechazar perturbaciones estacionarias tales como una perturbación de primer orden de constante de tiempo de 7 minutos:
d ( z )
· z 0.133· z z z 0.867
(6)
Entonces, el prefiltro relevante para control es de la forma:
)· ( z 1) z· ( z 0.904 )·( (1 )· z ( z )( z 1) 0 . 251 · · 2 2 ( ) ( ) ( 0 . 818 ) · ( 0 . 867 ) k z z z z
L( z )
(7)
Este prefiltro es un filtro pasabanda o filtro notch. La atenuación de las bajas frecuencias por el prefiltro es por tanto esperada, como físicamente por las perturbaciones estacionarias, la acción integral en el sistema de control no es necesaria, por lo tanto se elimina la necesidad de un buen ajuste del modelo a bajas frecuencias.
9-22
Identificación de sistemas
9.5. 9.5.4 4 Algorit Algo ritmo mo para la impleme impl ementación ntación de un prefiltro relevante para control Puesto que el prefiltro relevante para el control requiere tanto del modelo estimado para la planta como del modelo estimado para el ruido, lo cuales son inicialmente desconocidos, su implementación más rigurosa es iterativa. En [Rivera et al. 1992] se puede encontrar un algoritmo iterativo para la implementación de un prefiltro relevante para control. En esta sección se incluye el algoritmo no iterativo propuesto por [Rivera et al. 1992] que funciona bastante bien en numerosos casos y que requiere que el usuario disponga de estimas razonables de la constante de tiempo dominante de la planta y de la velocidad de respuesta en lazo cerrado deseada. El algoritmo no iterativo de [Rivera et al. 1992] se basa en el uso de la expresión (9.47) para el prefiltro usando conjuntamente algunas hipótesis y simplificaciones. En primer lugar se sugiere utilizar la siguiente estructura para T(z): T ( z ) z
nk
· f ( z )
(9.48)
donde el orden de f(z) es dictado por el procedimiento del diseño del control y su ancho de banda se elige para incluir las limitaciones al comportamiento en lazo cerrado que se puede obtener creado mediante las restricciones de la velocidad de respuesta de las variables controladas y manipuladas. Además, se supone el conocimiento de la constante de tiempo de la planta con el objetivo de usar la siguiente aproximación aproximación para Gˆ : z Gˆ ( z )
nk 1
z
(9.49)
donde =exp(-T/dom) y dom es la constante de tiempo dominante del sistema. Una estima de la ganancia en estado estacionario no es necesaria ya que la ganancia simplemente
ˆ 1, aparece como una constante en (9.47). Para modelos del tipo OE o FIR, se tiene que H lo cual conduce a la siguiente definición del prefiltro: L( z ) ( z )(1 z
nk
· f ( z )) z 1 · f ( z )·( )· (r ( z ) d ( z ))
(9.50)
Siendo f(z) un filtro pasa-baja usado para suministrar robustez y atenuar los movimientos de la variable manipulada. Una elección bastante común es considerar un filtro de primer orden:
9-23
TEMA 9: Identificación relevante para el control
f ( z )
(1 )· z z
(9.51)
donde =exp(-T/cl) y cl es la constante de tiempo o velocidad de respuesta en lazo cerrado.
ˆ con la misma Para modelos de tipo ARX se puede aproximar el modelo del ruido H constante de tiempo dominante utilizada en Gˆ :
ˆ ( z ) H
z z
(9.52)
con lo que se obtiene la siguiente expresión para el prefiltro: L( z ) (1 z
nk
· f ( z ))· f ( z )·( )· (r ( z ) d ( z ))
(9.53)
Nótese que en esta expresión se evita la necesidad de especificar dom lo cual sugiere que la estimación ARX prefiltrada debería ser más fácil y más fiable que los otros métodos. Se debe tener en cuanta que la estimación de los parámetros autoregresivos del modelo
ˆ , y por lo tanto un modelo ARX requieren un compromiso entre ajustar Gˆ y ajustar H adecuado quizás no sea obtenido si la magnitud del ruido, especificada por v , es significante. Ejemplo 9.3: Considérese el siguiente modelo estimado para una planta
Gˆ ( z )
K z
que será controlada usando control predictivo vía QDMC (Quadratic Dynamic Matrix Control). La estructura resultante para T(z) es de segundo orden, con lo que se va a definir f(z) de la siguiente forma:
(1 ) 2 · z 2 f ( z ) ( z ) 2
e
1.555T / cl
Se va suponer un cambio en la señal de referencia de tipo escalón. El prefiltro resultante para la estimación FIR y OE es:
9-24
Identificación de sistemas
(1 ) 2 · z 2 ·( z )( z 2 ) L( z ) ( z ) 4 Para modelos ARX se obtiene:
(1 ) 2 · z 3 ·( z 2 ) L( z ) ( z ) 4
En conclusión habiendo definido una estructura del modelo y la naturaleza del problema de diseño del control, la elección del prefiltro queda reducida a simplemente especificar la velocidad de respuesta en lazo cerrado ( CL) y la constante de tiempo dominante en lazo abierto (dom). Esta información puede ser fácilmente obtenida en la mayoría de las situaciones a las que se enfrentan los ingenieros de control de procesos.
9.6 CONCLUSIONES Es posible diseñar una configuración de identificación de tal forma que los modelos resultantes automáticamente reflejen aquellos aspectos del proceso real que son más relevantes para el subsiguiente diseño del control basado en el modelo. Desde el punto de vista del error de sesgo, los experimentos en lazo cerrado son óptimos; desde el punto de vista del error de varianza depende de si la potencia de la entrada y de la salida están limitadas durante la realización de los experimentos y de si el controlador es diseñado en base tanto a la dinámica de la planta como a la dinámica del ruido. La optimización del diseño del control y de la identificación puede ser conseguida mediante iteración entre la estimación del modelo y el diseño e implementación del controlador. Este procedimiento iterativo se basa en el principio de aprendizaje, donde los experimentos subsiguientes posibilitan un mejor entendimiento de las dinámicas del proceso más relevantes y el diseño de controladores con un comportamiento que gradualmente se va mejorando. Por otra parte es posible diseñar un prefiltro que al ser aplicado sobre los datos garantice el ajuste del modelo en aquellos rangos de frecuencia que son más relevantes para el control.
9-25
TEMA 9: Identificación relevante para el control
BIBLIOGRAFÍA [Rivera et al., 1992]
D. E. Rivera, J. F. Pollard, C. García. Control-relevant prefiltering : A systematic design approach and case study .
IEEE Transactions on Automatic Control. Vol. 37. Nº 7, July 1992. [Rivera, 2007]
D. E. Rivera. Introducción a la Identificación de Sistemas . Curso impartido en el Dpto. de Informática y Automática de la UNED del 17-28 de septiembre de 2007.
[Van Den Hof and Callafon, 2003]
P. Van Den Hof, R. Callafon. Identification for control . Control Systems, Robotics and Automation, edited by H. Unbehauen, in Encyclopedia of Life Support Systems (EOLSS), Developed under the auspices of the UNESCO, Eolss Publishers, Oxford, UK. 2003.
9-26
TEMA 10 IDENTIFICACIÓN MULTIVARIABLES
DE
SISTEMAS
10.1 INTRODUCCIÓN En los temas anteriores se han considerado principalmente sistemas con una entrada y una salida, es decir, sistemas SISO (Single-Input Single-Output). Sin embargo, los procesos reales suelen ser sistemas multivariables con múltiples entradas y múltiples salidas (ver Figura 10.1), es decir, son sistemas MIMO (Multiple Input - Multiple Output). La principal dificultad que presenta un sistema MIMO no viene dada por la existencia de un número excesivo de variables (entradas y salidas) sino por el grado de interacción existente entre ellas, es decir, a como una determinada salida y j del sistema se verá afectada por una o varias entradas u k. Una fuerte interacción puede dificultar la identificación y control del sistema. El grado de interacción existente entre las variables de un sistema MIMO puede ser medido. Existen de hecho diferentes medidas de la interacción, entre las más utilizadas se encuentran [Skogestad y Postlethwaite, 96]: la matriz de ganancias relativas o RGA, los vectores singulares y el número de condición. Nótese que el estudio de la interacción de las variables de un sistema MIMO resulta de gran utilidad para poder saber si es posible simplificar el modelo MIMO usando en su lugar varios modelos SISO o varios modelos MISO (Multiple Input - Single Output).
u1 u2
y1 y2 Proceso
um
yp Figura 10.1. Proceso multivariable
10-1
TEMA 10: Identificación de sistemas multivariables
La identificación de un sistema MIMO se realiza con la misma metodología comentada en los temas anteriores para el caso de sistemas SISO. Simplemente el carácter multivariable complica la realización de las diferentes etapas. Además si el grado de interacción de las variables es elevado se deben tomar medidas y estrategias adicionales, las cuales han dado lugar a multitud de publicaciones. El objetivo de este tema es dar una sencilla y breve introducción de aquellos aspectos de la identificación de sistemas multivariables que resultan menos complejos de entender en una primera aproximación. Así en primer lugar se realiza una descripción de los sistemas multivariables. A continuación se realizan varias consideraciones sobre el diseño de las señales de entrada que se van a utilizar en los experimentos de identificación para excitar el sistema. Finalmente se describe la estimación de los parámetros de un modelo multivariable.
10.2 DESCRIPCIÓN DE UN SISTEMA MULTIVARIABLE Supóngase un sistema multivariable con m entradas y p salidas que puede ser descrito por el siguiente modelo discreto
y(t ) G ( q )·u(t ) v(t ) v(t ) H ( q )·e(t )
(10.1)
En la expresión y(t) es el vector de salidas de dimensión p x 1, u(t) es el vector de entradas de dimensión m x 1, v(t) es el vector de perturbaciones de dimensión p x 1 (cada salida tiene una perturbación asociada), y e(t) es un vector de secuencias de ruido blanco de dimensión p x 1, de media nula y matriz de covarianza E [ e(t )·e (t )] . T
Además G(q) es una matriz de funciones de transferencia de dimensión p x m. Siendo q el operador desplazamiento. En consecuencia el elemento G ij(q) de la matriz G(q) será la función de transferencia que relaciona la salida y i con la entrada u j. Por su parte H(q) es una matriz de funciones de transferencia cuadrada de dimensión p x p. Otra forma de describir un sistema dinámico, que resulta especialmente cómoda cuando éste es multivariable, es la representación en variables de estado:
x( kT T ) A· x( kT ) B·u( kT ) K ·e( kT ) y( kT ) C · x( kT ) D·u( kT ) e( kT ) x(0) x0
10-2
(10.2)
Identificación de sistemas
donde T es el periodo de muestreo, u(kT) es la entrada en el instante kT, e y(kT) es la salida en el instante KT. Nótese que el modelo queda descrito por las matrices A, B, K, C y D que habría que estimar, pero los elementos de estas matrices son números reales en vez de funciones racionales en q como sucede en G(q) y H(q). A partir de las matrices A, B, K, C y D es posible obtener las matrices de funciones de transferencia G(q) y H(q):
G ( q ) C ·(q· I nx A) 1 · B D H ( q ) C ·(q· I nx A) 1 ·K I ny
(10.3)
En la expresión anterior I nx es la matriz identidad nx x nx, siendo nx la dimensión del vector x. Asimismo I ny es la matriz identidad ny x ny, siendo ny=p la dimensión del vector y (y del vector e). Además cuando se trabaja con un sistema multivariable hay que tener en cuenta lo siguiente:
Las respuestas a un impulso g(k) y h(k) son matrices de dimensión p x m y p x p, respectivamente, con la siguiente norma:
g ( k ) | g ij i , j
|2
1/ 2
Las covarianzas son matrices y se definen de la siguiente forma: T E [ s(t )·s (t )] Rs ( )
T E [ s(t )·w (t )] Rsw ( )
(10.4)
(10.5)
(10.6)
El espectro de las salidas se obtiene de la siguiente forma
y ( ) G (e i )· u ( )·G T (e i ) H (e i )·· H T (e i )
(10.7)
Nótese que la definición de espectro sobre un vector de señales define implícitamente el espectro cruzado entre las componentes de la señal.
10-3
TEMA 10: Identificación de sistemas multivariables
El teorema de factorización espectral ahora se enuncia de la siguiente forma: supóngase que v ( ) es una matriz p x p definida positiva para toda y cuyas entradas son funciones racionales de cos o (ei). Entonces existe una matriz H(z) mónica de dimensión p x p cuyas entradas son funciones racionales de z ( o z -1) tales que la función racional dada por el determinante de H no tiene ningún polo y ningún cero sobre o fuera del circulo unidad.
10.3 DISEÑO DE ENTRADAS PARA SISTEMAS MULTIVARIABLES A cada una de las entradas disponibles en un sistema multivariable se le denomina canal de entrada o simplemente canal. Para obtener datos de las entradas-salidas del modelo con los que poder identificar un modelo del sistema multivariable se debe inyectar en cada canal de entrada una señal que sea independiente (no esté correlacionada) de las señales inyectadas en los restantes canales. Obviamente, como sucedía en el caso SISO, las señales de entrada que se elijan deben ser dentro de los posible amigables con la planta. Supóngase un sistema MIMO con m entradas habría que diseñar por tanto m señales de entrada, usualmente las señales usadas son todas del mismo tipo, por ello al conjunto de las m señales se las suele denominar de forma conjunta como señal [tipo] multientrada. En las siguiente secciones se comenta como diseñar una señal RBS multientrada, una señal PRBS multientrada y una señal multiseno multientrada.
10.3.1 Diseño de señales RBS multientrada Para conseguir señales RBS independientes no correlacionados en cada canal de un sistema multivariable se puede usar una semilla distinta en el generador de números para cada señal RBS que se desee generar.
10.3.2 Diseño de señales PRBS multientrada En la sección 4.3.6 se comentó que las principales variables de diseño de una señal PRBS son el tiempo de conmutación T sw, el tamaño n del registro de desplazamiento y la amplitud de la señal. En el caso de un sistema con múltiples entradas, el valor inicial del registro de desplazamiento debe ser seleccionado para que la señal PRBS que se inyecte en un canal no esté correlacionada con la de los restantes canales. Esta inicialización se consigue
10-4
Identificación de sistemas
retrasando la realización de la señal PRBS que se inyecta en un canal k un número de muestras D respecto a la que se inyecta en el siguiente canal k+1. Este retardo D es por lo tanto una variable de diseño adicional.
Figura 10.2. Ejemplo de señal PRBS multientrada diseñada para un sistema con 3 canales
El diseño de una señal PRBS multientrada se reduce a diseñar una única señal PRBS que se va desplazando para generar las m-1 restantes (Ver Figura 10.2). Las siguientes expresiones propuestas en [Rivera, 2007] se pueden usar como guías para ayudar a diseñar una señal PRBS multientrada:
T sw
N s (1)
D
(2)
N s
2.8· Ldom s
*
2· · s · H dom
5· H dom T sw
T sw
(10.8)
*
(10.9)
*
m D
(1) (2) n N s 2 1 max( N s , N s )
(10.10)
(10.11)
(10.12)
10-5
TEMA 10: Identificación de sistemas multivariables
L
H
En las expresiones anteriores dom y dom son las estimas inferior y superior, respectivamente, de la constante de tiempo dominante del sistema o planta. s es el factor de representación del tiempo de asentamiento de la planta y
s es el factor de
representación de la velocidad en lazo cerrado expresado como un múltiplo del tiempo de respuesta en lazo abierto. Además n y N deben ser valores enteros. Así como T sw y D, que deben ser múltiplos enteros del periodo de muestreo T y del periodo de conmutación T sw.
10.3.3 Diseño de señales multiseno multientrada Una señal multiseno es una señal determinista periódica que se genera como la suma de múltiples sinusoides. Cada sinusoide especifica un armónico a una determinada frecuencia. Si se desea diseñar una señal multiseno multientrada un método consiste en diseñar una señal multiseno base que se inyecta en cada canal desplazada (retardada) con respecto a los restantes. El principal problema que presenta este método es que supuesto que se ha empezado a excitar en el canal 1, la duración del ciclo de la señal inyectada en el canal k+1 es menor que la señal inyectada en el canal k, es decir, la duración del ciclo de la señal va disminuyendo conforme se va inyectando en los diferentes canales. Para evitar este problema y disponer de una duración de ciclo más larga en la señal sinusoidal inyectada en cada canal k, se puede diseñar una señal multiseno en cremallera (zippered). Se trata de una señal multiseno cuyo contenido en frecuencia se desglosa en m señales multiseno. El desglose de dicho contenido en frecuencia se realiza de forma alterna o en cremallera (zippered) entre los diversos canales. En la Figura 10.3 se muestra el espectro en frecuencia de una señal multiseno en cremallera para un sistema con dos canales. Se observa que los armónicos impares de la señal multiseno en cremallera (representados con un cuadrado) se usan para formar la señal multiseno que se inyectará en el canal 1. Mientras que los armónicos pares de la señal multiseno en cremallera (representados con un círculo) se usan para formar la señal multiseno que se inyectará en el canal 2.
10-6
Identificación de sistemas
Figura 10.3. Espectro estándar de una señal multiseno en cremallera
De acuerdo con la sección 4.3.7 entre los parámetros de diseño de una señal multiseno se encuentran el número de componentes n s, la longitud de secuencia N s y el periodo de muestreo T. En el caso de un sistema multivariable de m entradas para diseñar la señal multiseno en cremallera las variables de diseño de la señal deben cumplir las siguientes especificaciones [Rivera, 2007]:
*
n s (1 )·
*
1 , · * * 1 n s *
T min
N S max 2·m·n S ,
2 m·(1 ) * ·T
(10.13)
(10.14)
(10.15)
En las expresiones anteriores * y * denotan la frecuencia inferior y la frecuencia superior, respectivamente, del rango de frecuencias donde el espectro de la señal se mantiene aproximadamente constante. Recuérdese que se verifica la siguiente relación
L
1 s H L s · dom dom
(10.16)
H
Los parámetros dom , dom , s y s tienen el mismo significado que en el caso de las señales PRBS multientrada.
10-7
TEMA 10: Identificación de sistemas multivariables
Por otra parte es un parámetro definido por el usuario. Los valores de los parámetros finalmente determinados (que se van a denotar con el superíndice “d”) deberían satisfacer la siguiente desigualdad: d ( * * ) d d N s d · N s · N (1 ) ns 2· ·m 2·m
(10.17)
10.4 ESTIMACIÓN DE MODELOS MULTIVARIABLES Supóngase que se dispone de N datos de cada una de las m entradas y de las p salidas de un sistema MIMO. Se desea obtener una estima del vector de parámetros del siguiente modelo del sistema multivariable
y(t ) G ( q, )·u(t ) H ( q, )·e(t ) Donde recuérdese
(10.18)
que G(q, ) y H(q,) son matrices de dimensión p x m y p x p,
respectivamente, cuyos elementos son funciones de transferencia. Además y, e y u son vectores de dimensión p x1, p x 1 y m x 1, respectivamente. Además t=1,2,,..,N Ejemplo 10.1: Considérese la ecuación de un modelo ARX
A( z )· y (t ) B( z )·u(t ) e(t )
(1)
En el caso de un sistema MIMO con p salidas y n entradas, y(t) sería un vector de dimensión p x 1, u(t) sería un vector de dimensión m x 1 y e(t) sería un vector de dimensión p x 1. En consecuencia A(z) debe ser una matriz de dimensión p x p donde cada uno de sus elementos aij(z) será un polinomio de orden naij
a11 ( z ) ... a1 p ( z ) : A( z ) : aij ( z ) a p1 ( z ) ... a pp ( z ) 1 1 naij naij aij ( z ) 1 aij z ... aij z Por su parte B(z) es una matriz de dimensión p x m donde cada uno de sus elementos bij(z) será un polinomio de orden nbij.
10-8
Identificación de sistemas
b11 ( z ) ... b1m ( z ) : B( z ) : bij ( z ) b p1 ( z ) ... a pm ( z ) nbij nbij 0 1 1 bij ( z ) bij bij z ... bij z En consecuencia para especificar la estructura de un modelo ARX MIMO m x p se deben especificar los órdenes de los elementos de la matriz A y de la matriz B:
na11 NA : na p1 nb11 NB : nb p1
...
na1 p
...
: na pp
...
nb1m
naij
nbij
...
(1)
: nb pm
(1)
Además habría que especificar los retardos e n las salidas con respecto a las entradas:
nk 11 NK : nk p1
... nk ij
...
nk 1m
: nk pm
(1)
-1
Multiplicando con A por la izquierda de los dos miembros de (1) se obtiene:
y(t ) A1 ( z ) B( z )·u(t ) A 1 ( z )·e(t )
(1)
Con lo que 1 G ( q, ) A ( z ) B( z )
H ( q, ) A 1 ( z )
(1)
Nótese que si se tuviese un sistema MISO de m entradas y una salida entonces la matriz A(z) constaría de un único elemento a(s), por lo que NA=na. Mientras que la matriz B sería un vector fila de m elementos, al igual que las matrices de ordenes NB y NK.
10-9
TEMA 10: Identificación de sistemas multivariables
El predictor de la salida a un paso es un vector de dimensión p x 1:
yˆ (t | ) H ( q, )·G ( q, )·u(t ) ( I H ( q, ))· y (t ) 1
1
(10.19)
En la expresión anterior I es la matriz identidad de dimensión p x p. El error de predicción es también un vector de dimensión p x 1:
e(t , ) y (t ) yˆ (t | ) H ( q, )·[ y(t ) G ( q, )·u(t )] 1
(10.20)
Si se usa un prefiltro L(q) sobre el error para enfatizar determinadas zonas de frecuencia se tendrá el error de predicción filtrado:
eF (t , ) L( q )·e(t , )
(10.21)
Se desea encontrar la estima ˆ N que miminiza la siguiente función de coste:
V N ( )
1
N
· eF T (t , )·eF (t , )
N y 1
(10.22)
Es decir, el problema a resolver es el siguiente:
ˆ N arg minV N ( )
(10.23)
También en el caso multivariable se suele usar dentro de la función de coste una matriz de peso W de dimensión p x p para dar más o menos importancia a minimización de los errores de ciertas salidas en particular
V N ( )
1
N
· eF T (t , )·W 1 ·eF (t , )
N y 1
(10.24)
La toolbox SIT de Matlab a partir de su versión 6.0 (Matlab 7.0) soporta la estimación de modelos MIMO en variables de estado de la forma (10.2) a través del comando pem. Nótese que una vez estimadas las matrices A, B, K, C y D del modelo en variables de estado, es posible a través de la ecuación (10.3) obtener las matrices de funciones de transferencia G(q,) y H(q,). Con el comando pemno se pueden obtener directamente modelos ARX, ARMAX, OE y BJ para sistemas MIMO, pero si para sistemas MISO.
10-10
Identificación de sistemas
También es posible obtener modelos ARX MIMO a través del comando ar x. Nótese que hay que especificar las matrices de órdenes NA, NB y NK. Ejemplo 10.2: Se van a considerar como datos de entrada/salida los suministrados a modo de ejemplo en el fichero
St eamEng. mat de la toolbox SITB de Matlab 7.0. Se trata de los datos de un motor de vapor que es un sistema MIMO con dos entradas (m=2) y con dos salidas (p=2). Las entradas son la presión del vapor (normalmente aire comprimido) después del control de la válvula y el voltaje de magnetización sobre el generador conectado al eje de salida. Las salidas son el voltaje generado y la velocidad rotacional del generador (frecuencia del voltaje AC generado). El periodo de muestreo es T=50 ms. En primer lugar se van a recoger las entradas y las salidas dentro de un objeto i ddat a de nombre
st eam. Además se va a poner nombre a las entradas y a las salidas: l oad St eamEng st eam = i ddat a( [ GenVol t , Speed] , [ Pr essur e, MagVol t ] , 0. 05) ; st eam. I nput Name = {' Pr essur e' ; ' MagVol t ' }; st eam. Out put Name = {' GenVol t ' ; ' Speed' }; A continuación se van a representar las series temporales de las entradas y las salidas los datos disponibles (ver Figura 10.4):
pl pl pl pl
ot ( s t e am( : , 1, 1) ) ot ( s t e am( : , 1, 2) ) ot ( s t e am( : , 2, 1) ) ot ( s t e am( : , 2, 2) )
Para tener una idea de la dinámica del sistema se va a estimar las respuestas a escalones (Ver Figura 10.5) y a impulsos (ver Figura 10.6) del sistema a partir de los datos de entrada-salida disponibles:
ms=st ep( st eam) ; st ep( st eam) i mpul se( ms, ' sd' , 3) Se observa que la entrada voltaje de magnetización no parece afectar mucho a la velocidad. Además la dinámica de la salida voltaje del generador debido a la entrada voltaje de magnetización no tiene mucha dinámica, sólo un retardo. Se va a estimar un modelo en variables de estado de la forma (10.2) usando el comando pem con sus valores por defecto y usando los primeros 250 datos para estimar
>> mp = pem( st eam( 1: 250) )
10-11
TEMA 10: Identificación de sistemas multivariables
(a)
(b)
(c)
(d)
Figura 10.4. Representación temporal de los datos de entrada-salida del motor de vapor: a) Entrada: presión, salida: voltaje generado. b) Entrada: voltaje de magnetización, salida: voltaje generado. c) Entrada: presión, salida: velocidad. d) Entrada: voltaje de magnetización, salida: velocidad.
10-12
Identificación de sistemas
Figura 10.5. Estima de las respuestas a escalones del motor de vapor
Figura 10.6. Estima de las respuestas a impulsos del motor de vapor
10-13
TEMA 10: Identificación de sistemas multivariables
St at e- space model :
x( t +Ts) = A x( t ) + B u( t ) + K e( t ) y( t ) = C x( t ) + D u( t ) + e( t )
A = x1 x2
x1 0. 15043 0. 15893
x2 0. 084359 0. 93787
x1 x2
Pr essur e - 0. 00043924 - 0. 00082436
MagVol t 0. 034544 - 0. 007428
GenVol t Speed
x1 10. 367 - 0. 6629
x2 - 3. 9245 - 3. 0046
GenVol t Speed
Pr essur e 0 0
MagVol t 0 0
x1 x2
GenVol t - 0. 008793 - 0. 098116
Speed - 0. 038367 - 0. 31591
x1 x2
0 0
B =
C =
D =
K =
x( 0) =
Est i mat ed usi ng PEM f r om dat a set z Loss f unct i on 1. 34188e- 005 and FPE 1. 47719e- 005 Sampl i ng i nt er val : 0. 05 Se va a comparar (ver Figura 10.7) las respuestas a escalones del modelo y las estimadas, para ello se usará el siguiente comando
s t ep( ms , ' b: ' , mp, ' r ' , 3)
10-14
Identificación de sistemas
From Pressure
t l o V n e G o T
0.6
0.4
0.4
0.2
0.2
0
0
−0.2 −1
d e e p S o T
From MagVolt
0.6
0
1
2
3
−0.2 −1
0.6
0.1
0.4
0.05
0.2
0
0
−0.05
−0.2 −1
0
1
2
3
−0.1 −1
0
1
2
3
0
1
2
3
Figura 10.7. Comparación de las respuestas a escalones del modelo (línea continua) y las estimadas (línea discontinua) Se observa en la Figura 10.7 que el modelo estimado no es bueno. Se va a mejorar el modelo aumentando su orden, se va a considerar un modelo en variables de estado con nx=3.
mp3 = pem( st eam( 1: 250) , ' nx' , 3) Se obtiene el siguiente resultado en pantalla
St at e- space model :
x( t +Ts) = A x( t ) + B u( t ) + K e( t ) y( t ) = C x( t ) + D u( t ) + e( t )
A = x1 x2 x3
x1 0. 1327 0. 0041715 - 0. 068659
x2 0. 07799 0. 97661 0. 16754
x1 x2 x3
Pr essur e 5. 9884e- 005 0. 0028277 - 0. 023543
MagVol t 0. 03186 0. 00068242 0. 0040119
GenVol t Speed
x1 12. 079 - 0. 12299
x2 2. 1582 3. 5167
x3 - 0. 012023 - 0. 22004 0. 7054
B =
C = x3 0. 092239 0. 26285
10-15
TEMA 10: Identificación de sistemas multivariables
D = GenVol t Speed
Pr essur e 0 0
MagVol t 0 0
x1 x2 x3
GenVol t 0. 0055432 0. 034068 0. 1318
Speed 0. 010936 0. 17572 0. 039441
x1 x2 x3
0 0 0
K =
x( 0) =
Est i mat ed usi ng PEM f r om dat a set z Loss f unct i on 6. 70722e- 006 and FPE 7. 748e- 006 Sampl i ng i nt er val : 0. 05: Se va a comparar las respuestas a escalones del modelo y las estimadas, para ello se usará el siguiente comando
s t ep( ms , ' b: ' , mp3, ' r ' , 3) La representación gráfica que se obtiene se muestra en la Figura 10.8. Se observa que nuevo modelo ahora ofrece mejores resultados que el modelo anterior excepto en el caso de la velocidad frente al voltaje magnético, que también era muy malo entonces. Aunque tampoco importa ya que la influencia de esta entrada sobre esta salida tampoco es significativa. Se va a comparar las respuestas temporales del modelo frente a las respuestas medidas usando los datos 251:400 para validar
compar e( st eam( 251: 450) , mp3) En la Figura 10.9 se muestran la representación gráfica que se obtiene. El modelo es muy bueno en reproducir el voltaje generado y no va mal para reproducir la velocidad.
10-16
Identificación de sistemas
From Pressure
t l o V n e G o T
From MagVolt
0.6
0.6
0.4
0.4
0.2
0.2
0
0
−0.2 −1
0
1
2
3
0.6 d e e p S o T
−0.2 −1
0
1
2
3
0
1
2
3
0.02 0
0.4
−0.02 0.2 −0.04 0
−0.06
−0.2 −1
0
1
2
3
−0.08 −1
Figura 10.8. Comparación de las respuestas a escalones del modelo en variables de estado de orden nx=3 (línea continua) y las estimadas (línea discontinua)
Measured Output and Simulated Model Output 2
t l o V n e G
Measured Output mp3 Fit: 89.54%
1 0
−1 −2 12
14
16
18
20
22
24
0.4 Measured Output mp3 Fit: 47.62%
0.2 d 0 e e p S−0.2
−0.4 −0.6 12
14
16
18
20
22
24
Figura 10.9. Comparación de las respuestas del modelo (línea continua) y las medidas experimentalmente (línea discontinua)
10-17
TEMA 10: Identificación de sistemas multivariables
Finalmente se va a validar el modelo en el dominio de la frecuencia, para ello se va comparar su respuesta en frecuencia con la obtenida mediante análisis espectral. Para ello se usarán los siguientes comandos:
msp = spa( st eam) ; bode( msp, mp3) % Se debe pul sar ENTER cuat r o veces par a i r vi endo % l as cuat r o par es de f i gur as From Pressure to GenVolt
0
10
e d u t −2 i l 10 p m A
e d u t i l p m A
−4
10
−1
−1
10
) s e e r g e d (
From MagVolt to GenVolt
0
10
0
1
10
10
2
10
10
−1
10
0
0
−200
) s e −50 e r g e d ( −100
−400 −600
e s −800 a h P−1000
0
1
10
10
2
10
e s a h −150 P
−1200 −1 10
0
1
10
10
2
10
−200 −1 10
0
10
2
10
Frequency (rad/s)
(a)
(b)
From Pressure to Speed
0
1
10
Frequency (rad/s)
From MagVolt to Speed
−1
10
10
−2 e d 10 u t i l p m −3 A10
e d u t i l p m A
−4
−1
10
0
1
10
10
2
10
10
−1
10
0
1
10
10
2
10
0 ) 600 s e e r g e 400 d (
) s e e r −200 g e d ( e s −400 a h P
−600 −1 10
e s a h 200 P 0
1
10
10
2
10
0 −1 10
Frequency (rad/s)
0
1
10
10
2
10
Frequency (rad/s)
(c)
(d)
Figura 10.10. Respuesta en frecuencia del modelo (línea continua) y respuesta estimada mediante análisis espectral (línea discontinua): a) Entrada: presión, salida: voltaje generado. b) Entrada: voltaje de magnetización, salida: voltaje generado. c) Entrada: presión, salida: velocidad. d) Entrada: voltaje de magnetización, salida: velocidad.
10-18
Identificación de sistemas
Se observa en la Figura 10.10 que el modelo es bastante aceptable excepto en el caso de la velocidad frente al voltaje magnético. Aunque tampoco importa ya que la influencia de esta entrada sobre esta salida tampoco es significativa. Afortunadamente se ha obtenido rápidamente un modelo MIMO aceptable. En otros casos esto no se será posible y habrá que plantearse despreciar interacciones y modelar independientemente los canales con modelos SISO o MISO.
Ejemplo 10.3: Considérese los datos del motor de vapor del ejemplo anterior, se desea estimar un modelo ARX MIMO. Se van a considerar los siguientes órdenes para el modelo:
NA=[ 4 4; 4 4] , NB=[ 4 4; 4 4] , NK=[ 1 1; 1 1] El modelo se estima usando el siguiente comando:
ar x441=ar x( st eam( 1: 250) , ' na' , NA, ' nb' , NB, ' nk' , NK) En la pantalla se muestra el siguiente resultado:
Mul t i var i abl e ARX model A0*y( t ) +A1*y( t - T) + . . . + An*y( t - nT) = B0*u( t ) +B1*u( t - T) + . . . +Bm*u( t - mT) + e( t ) A0: 1 0
0 1
A1: - 0. 19295 - 0. 26254
- 0. 6796 - 0. 65077
0. 054257 0. 066238
- 0. 15973 - 0. 22465
- 0. 037682 0. 072165
0. 17015 0. 046203
- 0. 0026903 - 0. 011025
0. 0048563 0. 055283
A2:
A3:
A4:
10-19
TEMA 10: Identificación de sistemas multivariables
B0: 0 0
0 0
B1: 0. 0047785 0. 0054493
0. 38658 - 0. 0012769
0. 014671 0. 01617
- 0. 022031 - 0. 10054
0. 021951 0. 02188
0. 015004 0. 010344
0. 0086785 0. 011904
- 0. 010176 0. 030536
B2:
B3:
B4:
Est i mat ed usi ng ARX f r om dat a set dat a Loss f unct i on 4. 00318e- 006 and FPE 5. 17842e- 006 Sampl i ng i nt er val : 0. 05 Se puede comprobar usando los test comentados en el ejemplo anterior que el modelo ARX MIMO estimado produce unos resultados parecidos a los del modelo en variables de estado obtenido en el ejemplo anterior.
BIBLIOGRAFÍA [Ljung, 2010]
L. Ljung. System Identification Toolbox 7. The Mathworks. 2010.
[Rivera, 2007]
D. E. Rivera. Introducción a la Identificación de Sistemas. Curso impartido en el Dpto. de Informática y Automática de la UNED del 17-28 de septiembre de 2007.
[Skogestad y Postlethwaite, 1996]
S.
Skogestad,
I.
Postlethwaite. Multivariable feedback
control. analysis and design. John Wiley & Sons. 1996
10-20
TEMA 11 IDENTIFICACIÓN LINEALES
DE
SISTEMAS
NO
11.1 INTRODUCCIÓN La mayoría de los sistemas y procesos industriales son sistemas no lineales, en consecuencia modelar tales sistemas usando modelos lineales introduce un cierto grado de aproximación. Mientras que dicha aproximación puede ser considerada aceptable en muchas aplicaciones, en ciertos casos no producirá los resultados deseados y habrá que plantearse la identificación de un modelo no lineal, la cual resulta en general mucho más laboriosa que la identificación de sistemas lineales sobre todo en las etapas de la selección de la estructura adecuada y estimación de los parámetros del modelo. En este tema se realiza una pequeña introducción a la identificación de sistemas no lineales. En primer lugar se analiza cuando es necesario identificar un modelo no lineal. En segundo lugar se describen varios test para detectar si el sistema bajo consideración es no lineal. En tercer lugar se describen los modelos no lineales más comunes. Finalmente se realizan varias consideraciones sobre el prefiltrado y el análisis de los residuos cuando se realiza identificación de sistemas no lineales.
11.2 ALGUNAS CONSIDERACIONES SOBRE LA NECESIDAD DE IDENTIFICAR MODELOS NO LINEALES Un modelo lineal resulta a menudo suficiente para describir adecuadamente la dinámica de un sistema. En consecuencia en la mayoría de los casos antes de plantearse identificar un modelo no lineal conviene usar modelos lineales. Si la salida del modelo lineal elegido no reproduce adecuadamente los datos reales del sistema medidos experimentalmente, entonces quizás habrá que identificar un modelo no lineal.
11-1
TEMA 11: Identificación de sistemas no lineales
Antes de construir un modelo no lineal conviene verificar si realmente el sistema es no lineal realizando sobre el mismo algunos test (ver sección 11.3). Si el sistema es no lineal conviene probar a transformar las variables de entrada y de salida de tal forma que la relación entre las variables transformadas sea lineal. Por ejemplo, considérese un calentador que tiene como entradas una intensidad de corriente y un voltaje y como salida la temperatura del líquido calentado. La salida depende de las entradas a través de la potencia del calentador, la cual es igual al producto de la corriente y el voltaje. En vez de construir un modelo no lineal para este sistema de dos entradas y una salida, se puede crear una nueva variable de entrada tomando el producto de la intensidad y el voltaje, y después construir un modelo que describa la relación entre la potencia y la temperatura. En el caso de que no se encuentre ninguna transformación sobre las variables de entrada y salida que permita relacionarlas linealmente, entonces habrá que usar un modelo no lineal.
11.3 COMPROBACIÓN DE LA NO LINEALIDAD DE UN SISTEMA Antes de plantearse la identificación de un modelo no lineal conviene asegurarse de que el sistema real es realmente no lineal, para ello se pueden realizar diferentes test sobre el sistema. Entre los más usuales se encuentra el estudio de la respuesta a un escalón y el estudio de las funciones de correlación de órdenes más altos.
11.3.1 Test en el domin io del tiempo basado en la respuesta a escalones. Se puede verificar la no linealidad de un sistema estudiando la respuesta del sistema a una determinada entrada. Si se observa que la salida difiere dependiendo del nivel o del signo de la entrada, entonces eso es un signo de no linealidad. Supóngase que el sistema está operando en un cierto nivel estacionario [u 0(t),yo(t)], entonces se aplica un cambio escalón en la señal de entrada (u 0(t)+u1) al proceso y se mide la señal de salida y 1(t). A continuación, cuando la planta vuelva a su nivel de operación normal, se aplica un segundo escalón al proceso (u 0(t)+u2) con
u2 ·u1
(11.1)
Siendo una constante mayor que uno, es decir, u2 es veces mayor que u1. Se debe medir la señal de salida y 2(t) y construir la siguiente razón:
11-2
Identificación de sistemas
(t )
y 2 (t ) y0 y1 (t ) y 0
(11.2)
Si (t) es constante e igual a entonces el sistema es lineal. Obviamente, para explotar completamente este test se deberían aplicar escalones positivos y negativos. Puesto que las medidas experimentales se ven afectadas por el ruido de los sensores, este test se debe repetir varias veces y a las señales de salida se les deben eliminar sus valores medios. Este test está especialmente recomendado para aquellos procesos en los que es posible perturbar su actividad normal.
11.3.2 Test basado en las funciones de correlación de orden más alto. Para aquellos sistemas sobre los que no es posible perturbar su actividad normal o si ya se dispone de un determinado conjunto de datos de entrada-salida de la planta, entonces se recomienda usar un test basado en las funciones de correlación de órdenes más altos. Para poder aplicar este test se debe verificar que la entrada u(t) y el ruido e(t) son independientes y de media nula. Además todos los momentos impares de u(t) y e(t) son nulos. Además los momentos pares existen. Básicamente el test se realiza de la siguiente forma: aplicar la entrada u(t)+b, donde b es un nivel de continua, al proceso y medir la señal de salida y(t). Eliminar cualquier nivel medio de la respuesta del proceso:
y (t ) y (t ) E [ y (t )]
(11.3)
Calcular la función de correlación de orden más alto:
y y 2 ( ) E [ y (t )·( y (t )) 2 ]
(11.4)
Se puede demostrar que y y 2 ( ) 0 si y solo si el proceso es lineal. Nótese que el nivel b de continua es añadido a la entrada para asegurarse que todos los términos que reflejan la no linealidad del sistema contribuyen a y y 2 ( ) .
11-3
TEMA 11: Identificación de sistemas no lineales
11.4 DISEÑO DE LA SEÑAL DE ENTRADA Cuando se realiza la identificación de un sistema no lineal conviene tener presentes las siguientes consideraciones a la hora de diseñar la señal de entrada con que se va a excitar al sistema:
Las señales de entrada de tipo binario pueden no resultar adecuadas para identificar ciertos tipos de sistemas no lineales.
El uso de señales de entrada con una determinada frecuencia no garantiza que la señal de salida vaya a tener la misma frecuencia.
Ejemplo 11.1: Supóngase que un cierto sistema no lineal se puede describir por la siguiente ecuación 2 y(t ) k ·u (t )
Si la señal de entrada fuese una señal de tipo binario PRBS o RBS con amplitud comprendida entre -1 y 1, la salida del sistema sería
y(t ) k Es decir, debida a la presencia de una no linealidad cuadrática, la salida es siempre una señal constante, de la que no se puede extraer mucha información sobre el sistema. Por otra parte si la entrada fuese la señal sinusoidal
u(t ) sen( 0 ·t ) la salida sería
1 cos(2· 2 u(t ) k ·sen ( 0 ·t ) k · 2
0
·t )
Es decir, la señal de salida es de tipo sinusoidal con una frecuencia distinta (2·0) a la frecuencia (0) de la señal de entrada.
11-4
Identificación de sistemas
En general en la identificación de sistemas no lineales se recomienda utilizar señales de entradas con múltiples niveles, por ejemplo las señales multiseno o las señales PRBS multinivel (ver Figura 11.1).
Figura 11.1. [Rivera, 2007] Ejemplos de señales PRBS multinivel
En el caso de las señales multiseno se recomienda suprimir algunos armónicos, es decir, aplicar señales sin potencia en al menos los armónicos pares. Para contrarrestar la perdida de excitación hay que aumentar el número de armónicos a considerar, o bien aumentar el tiempo de duración del experimento.
11.5 MODELOS NO LINEALES MÁS USUALES En las siguientes secciones se describen los modelos no lineales más usuales como: el modelo de Hammerstein-Weiner, el modelo ARX no lineal, el modelo ARMAX no lineal y el modelo de Volterra.
11.5.1 Modelo de Hammerstein- Weiner El modelo de Hammerstein-Weiner tiene la siguiente forma general (ver Figura 11.2):
y(t ) h(G ( q )· f (u(t )))
(11.5)
Donde:
f () es una función no lineal que actúa sobre los datos de entrada u(t):
11-5
TEMA 11: Identificación de sistemas no lineales
w(t ) f (u(t ))
(11.6)
G(q) es una función de transferencia lineal:
G(q)
B( q ) F ( q )
(11.7)
h() es una función no lineal que actúa sobre la salida x(t) del bloque lineal para generar la salida del sistema y(t)
y(t ) h( x(t ))
(11.8)
En el modelo w(t) y x(t) son variables internas que definen la entrada y la salida del bloque lineal. Ambas son de la misma dimensión que la entrada u(t) y la salida y(t) del sistema. No lineal u(t)
Lineal w(t)
f( )
No lineal x(t)
G(q)
y(t) h( )
Figura 11.2. Estructura de un modelo de Hammerstein-Weiner
Tanto f como h son funciones estáticas sin memoria, es decir, que el valor que generan en un instante t depende únicamente del valor de sus entradas en dicho instante t. Por 2
ejemplo: w(t ) r 0 r 1 ·u(t ) r 2 ·u (t ) ... . Si h=1 entonces se dice que se tiene un modelo de Hammerstein. Asimismo si g=1, se dice que se tiene un modelo de Weiner . En el caso de un sistema MIMO de m entradas y p salidas habría que diseñar m funciones f y p funciones h. Además G(q) sería una matriz de funciones de transferencia. Un modelo de Hammerstein-Wiener calcula la salida y en tres etapas: 1) Calculo de w(t)=f(u(t)). 2) Calculo de la salida del bloque lineal: x(t)=G(q) w(t)= (B(q)/F(q))·w(t). 3) Calculo de la salida del modelo mediante la transformación de la salida del bloque lineal x(t) usando la función no lineal h: y(t)=h(x(t).
11-6
Identificación de sistemas
En general el principal problema que presenta el uso de un modelo no lineal reside en encontrar la estructura más adecuada para el tipo de modelo no lineal elegido, ya que hay más grados de libertad y el usuario tiene que tomar más decisiones. La estructura de un modelo de Hammerstein-Weiner queda definida por la funciones no lineales f y h que se elijan, así como por los ordenes de los polinomios B(q) y F(q). Luego el diseñador debe tomar varias decisiones. Elegida una determinada estructura el vector de parámetros de un modelo de Hammerstein-Weiner está compuesto por los parámetros de la función f, los parámetros de los polinomios B(q) y F(q), y los parámetros de la función h. La estima de mínimos cuadrados se obtiene resolviendo el siguiente problema de optimización: 2 ˆ N arg min y (t ) yˆ (t ) 2
(11.9)
Siendo yˆ (t ) el predictor a un paso de la salida Para resolver este problema se puede seguir el siguiente esquema iterativo: 1) Resolver (11.9) dando unos valores iniciales a los parámetros de las funciones no lineales f y h. Se determina de este modo los parámetros del modelo lineal G(q) 2) Resolver (11.9) fijando los parámetros de G(q) con el valor obtenido en el paso 1. Se determinan los parámetros de las funciones no lineales f y h. 3) Repetir el paso 1 con los valores para los parámetros de las funciones no lineales f y h obtenidos en el paso 2. 4) Repetir el paso 3 con los valores de los parámetros del filtro lineal G(q) obtenidos en el paso 3. 5) Repetir los pasos 3 y 4 hasta obtener valores convergentes. La toolbox SIT de Matlab a partir de su versión 7.0 (Matlab R2007a) soporta la estimación de modelos de Hammerstein-Weiner mediante el uso del comando nl hw.
11-7
TEMA 11: Identificación de sistemas no lineales
11.5.2 Modelo NARMAX El modelo ARMAX no lineal o NARMAX (Nonlinear ARMAX) tiene la siguiente forma general:
y(t ) f ( y (t 1), ,..., y (t n y ), u(t 1),..., u(t nu ), e(t 1),..., e(t ne )) e(t ) (11.10) donde y(t) denota la salida, u(t) la entrada y {e(t)} es una secuencia de ruido blanco. Por su parte f(.) es una función no lineal. Expandiendo f(.) como un polinomio de grado L (donde L representa el grado de no linealidad) se obtiene la siguiente representación: n
y(t ) i · xi (t ) e(t )
(11.11)
i 1
donde L
n ni
(11.12)
n0 1
(11.13)
i 0
con
ni ni 1 ·(n y nu ne i 1) / i
i 1,..., L
(11.14)
Además i es el parámetro del modelo i-ésimo, x 1(t)=1, y p
q
r
xi (t ) y (t n yj )· u(t nuk )· e(t nem ) j 1
k 1
m1
i 2,..., n; p, q, r 0; 1 p q r L
1 n yj n y
1 nuk nu
(11.15)
1 nem ne
La expansión polinomial de f(.) produce una ecuación de diferencias no lineal que es lineal en los parámetros. Los componentes del modelo son funciones polinomiales lineales y no lineales de la entrada y de la salida. La estructura de un modelo NARMAX queda definida por los valores de n u, ny, ne y L. Mientras que el vector de parámetros tiene por lo tanto la siguiente forma:
11-8
Identificación de sistemas
1 ,..., n
(11.16)
Una vez fijada la estructura la estimación de los parámetros del modelo NARMAX puede ser formulado y resuelto como un problema estándar de mínimos cuadrados (11.9). Obviamente lo complicado es seleccionar la estructura correcta. Se puede comenzar fijando una estructura sencilla e ir gradualmente incrementando n u, ny, ne y L hasta conseguir la precisión deseada. No obstante esta forma de proceder suele conducir a modelos de órdenes elevados sobreparametrizados y además el procedimiento de estimación estará mal condicionado. Podría pensarse por otro parte en ir estimando los parámetros para todas las posibles estructuras y seleccionar la mejor de acuerdo con algún criterio de información como por ejemplo el criterio de información de Akaike (AIC). Sin embargo este método no resulta válido debido al gran número de estructuras a probar, incluso aunque el orden L de la expansión polinomial sea pequeño. Afortunadamente se han desarrollado diferentes algoritmos, como por ejemplo el propuesto en [Thomson et al., 1996], para seleccionar la estructura de un modelo NARMAX más adecuada, es decir con la complejidad mínima para reproducir adecuadamente la dinámica del sistema no lineal.
11.5.3 Modelo NARX El modelo ARX no lineal o NARX (Nonlinear ARX) tiene la siguiente forma general:
y(t ) f ( y (t 1), ,..., y(t n y ), u(t 1),..., u(t nu )) e(t )
(11.17)
donde y(t) denota la salida, u(t) la entrada y {e(t)} es una secuencia de ruido blanco. Por su parte f(.) es una función no lineal. Al igual que sucedía con los modelos NARMAX la función f() de un modelo NARX puede expandirse como un polinomio de grado L. La toolbox SIT de Matlab a partir de su versión 7.0 (Matlab R2007a) soporta la estimación de modelos NARX mediante el uso del comando nl ar x. Este comando considera la estructura para un modelo NARX que se muestra en la Figura 11.2. Dicho modelo calcula la salida y en dos etapas: 1) Calculo de los regresores a partir del valor actual de la entrada y de los valores pasados de la entrada y la salida.
11-9
TEMA 11: Identificación de sistemas no lineales
2) El estimador de la no linealidad genera la salida y del modelo usando una combinación de funciones lineales y no lineales sobre los regresores En el caso más simple se usan regresores estándar, es decir, las entrada y la salida en los instantes pasados, como por ejemplo y(t-3) y u(t-1). Aunque el comando nlarx también permite especificar regresores no lineales como por ejemplo, tan(u(t-1)) o u(t-1)*y(t-3). Por defecto todos los regresores son utilizados como entradas para las funciones lineales y no lineales del estimador de la no linealidad. Estimador de la no linealidad u Regresores u(t), u(t-1), y(t-1),…
Función no lineal
y
Función lineal
Figura 11.2. Estructura de un modelo NARX
También es posible seleccionar el tipo de estimador de la no linealidad a utilizar por el comando nl ar x, como por ejemplo, redes de partición en árbol (tree-partition), redes de wavelet y redes neurales multicapa. Además es posible excluir o el bloque de la función lineal o el bloque de la función no lineal del estimador de la no linealidad. El bloque de estimación de la no linealidad también puede incluir bloques lineales y no lineales en paralelo. Por ejemplo T F ( x ) L ( x r ) d g (Q( x r ))
(11.18)
donde, x es un vector de regresores, L T(x-r) + d es la salida del bloque de la función lineal y es afín cuando d0, d es un escalar, g(Q(x-r) representa la salida del bloque de la función no lineal, r es la media del vector de regresores x, y Q es una matriz de proyección que hace que los cálculos estén bien condicionados. La forma exacta de F(x) depende de la elección que se realice del estimador de la no linealidad. La estimación de un modelo NARX mediante el comando nl ar x, calcula los valores de los parámetros del modelo, tales como L, r, d, Q y otros parámetros específicos de g(.)
11-10
Identificación de sistemas
11.5.4 Modelo de Volterra El modelo de Volterra tiene la siguiente forma general: N
y(t ) 0 v M (t ) n
(11.19)
n 1
donde M
M
M
v (t ) ... n (i1 , i2 ,..., in )·u(t i1 )·u(t i2 )·...·u(t in ) n M
i10 i 2 0
(11.20)
in 0
Fijado el valor de M y de N se obtiene una clase de modelos de Volterra que es un conjunto de posibles modelos de media móvil. Por ejemplo entre los modelos contenidos en la clase de modelos de Volterra V (N=2, M=1) se encuentran los siguientes:
Modelo FIR:
y ( k ) u(t ) u(t 1)
Modelo de Hammerstein:
y( k ) u(t ) u(t 1) u 2 (t ) u 2 (t 1)
Modelo de Weiner:
y( k ) u(t ) u(t 1) u 2 (t ) u 2 (t 1) 2·u(t )·u(t 1)
Modelo de Robinson’s Volterra:
y ( k ) u(t ) u(t 1) 2·u(t )·u(t 1)
11.6 CONSIDERACIONES ADICIONALES SOBRE IDENTIFICACIÓN DE SISTEMAS NO LINEALES
LA
11.6.1 Prefiltrado El prefiltrado de los datos de entrada-salida permite en la identificación de sistemas lineales establecer en que rangos de frecuencia se desea que el modelo se ajuste mejor a los datos experimentales. El prefiltro ejercía dentro del criterio de identificación expresado en el dominio de la frecuencia el papel de función de peso configurable. Este comportamiento del prefiltro no se obtiene sin embargo en el caso de los sistemas no lineales, donde el prefiltrado de los datos puede introducir un error de sesgo no deseado. Por otra parte en los sistemas no lineales no es equivalente el prefiltrado de los datos y el prefiltrado del error de predicción. Mientras que el prefiltrado de los datos puede introducir error de sesgo, el prefiltrado del error puede tener efectos positivos sobre el ajuste de los modelos de tipo serie de Volterra a los datos.
11-11
TEMA 11: Identificación de sistemas no lineales
11.6.2 Análisis de los residuos Los test clásicos de análisis de los residuos (ver sección 6.6.2) consistentes en el estudio de la función de autocorrelación de los residuos y en el estudio de la función de correlación cruzada entre los residuos y las entradas, no son suficientes para el caso de sistemas no lineales. En este caso se requiere el estudio de las funciones de correlación de órdenes más altos para detectar la presencia de términos lineales o no lineales no modelados. Las funciones de correlación que hay que estudiar son las siguientes [Sriniwas et al., 1995]:
( u 2 ) ( ) E [(u 2 (t ))· (t )] 0
(11.21)
( u 2 ) 2 ( ) E [(u 2 (t )) · 2 (t )] 0
(11.22)
u ( ) E [ (t )· u (t )] 0
(11.23)
u ( ) E [u(t )· u (t )] 0
(11.24)
( ) (t )
(11.25)
donde
x (t ) x(t ) E [ x(t )]
(11.26)
N
( x(k ) x )·( y(k ) y ) xy ( )
k N
N
( x( k ) x ) · ( y(k ) y ) 2
k
(11.27)
2
k
N
N ( k )· ( k 1)·(u( k ) u )
u ( )
k N
( k )· (u(k ) u ) 2
k
N
(11.28)
2
k
Es decir, habrá que estudiar la representación gráfica de cada una de las funciones de correlación anteriores y comprobar que se son cercanas a 0 (se encuentran dentro del intervalo de confianza seleccionado).
11-12
Identificación de sistemas
Se puede demostrar [Sriniwas et al., 1995] que los residuos no contienen términos lineales o no lineales no modelados con un nivel de confianza del 95% si el valor absoluto de cada una de las anteriores funciones de correlación es menor que 1.96 / N .
BIBLIOGRAFÍA [Ljung, 2010]
L. Ljung. System Identification Toolbox 7. The Mathworks. 2010.
[Nelles, 2001]
Nelles, O. (2001). Nonlinear System Identification. SpringerVerlag.
[Rivera, 2007]
D. E. Rivera. Introducción a la Identificación de Sistemas . Curso impartido en el Dpto. de Informática y Automática de la UNED del 17-28 de septiembre de 2007.
[Spinelli et al, 2005]
W. Spinelli, L. Piroddi, M. Lovera M.On the role of prefiltering in nonlinear system identification. IEEE Transactions on Automatic Control, Vol.50, No.10, pp.1597-1602. 2005.
[Sriniwas et al., 1995]
G. R. Sriniwas; Y. Arkun, I, L. Chien; B. A Ogunnaike. (1995). Nonlinear identification and control of a high-purity distillation column: a case study. Journal of Process Control, Vol. 5, No. 3, pp. 149-162. 1995
[Thomson et al., 1996]
M. Thomson, S. P. Schooling, M. Soufian. The practical application of a nonlinear identification methodology . Control Engineering in Practice. Vol.4, No.3, pp. 295-306. 1996.
[Zhang et al., 2005]
L. F. Zhang, Q. M. Zhu; A. Longden. Nonlinear model validation using novel correlation tests . Proceedings of 2005 IEEE International Conference on Systems, Man and Cybernetics. Volume : 3. Pp. 2879 - 2884. 2005.
11-13