Método De Mínimos Cuadrados
Introducción
En el presente capítulo se hará una exposición detallada del método de mínimos cuadrados (MMC) para la identificación de sistemas discretos lineales. El MMC resulta, sin duda, uno de los enfoques básicos y más utilizados en la teoría y la práctica recientes de la identificación de procesos. Numerosos autores, tales como Eykhoff (1974), Peterka (1975) y muchos otros han dedicado un esfuerzo considerable al estudio de este método y sus diversas extensiones y modificaciones. Las razones son múltiples y bien fundamentadas: fundamen tadas: además de su indudable visión intuitiva, el MMC posee una serie de propiedades estadísticas muy útiles y sobre todo, posibilita la búsqueda de una forma recursiva lo suficientemente simple. Esta última posibilidad ha venido a ser la base de los llamados métodos de identificación en línea (on-line) de procesos, que han alcanzado gran popularidad, como resultado del desarrollo de los sistemas de control digital. En este capítulo se discutirá en detalle el método de mínimos cuadrados, tanto en su versión convencional como en sus varias modificaciones orientadas a mejorar la precisión del MMC cuando los datos utilizados están contaminados con ruido. El capítulo está organizado de la forma siguiente: en el Epígrafe 2.2 se introduce el modelo ARX en su variedad de formas posibles, que es la estructura básica utilizada para aplicar los métodos de identificación en línea. En el Epígrafe 2.3 se aplica el método general de mínimos cuadrados al modelo ARX y se obtienen expresiones para la estimación óptima de los parámetros así como de la matriz de covarianza de la estimación. En el Epígrafe 2.4 se discute una técnica heurística de extrema utilidad para la aplicación del método de mínimos cuadrados en tiempo real: la llamada técnica del olvido exponencial. En el Epígrafe 2.5 se deriva en detalle el algoritmo recursivo mínimo cuadrático convencional y se discuten las bondades y limitaciones de este método. En el Epígrafe 2.6 se introducen tres modificaciones del
MMC
que
tienen
como
objetivo
la obtención de
estimaciones insesgadas de los parámetros: mínimos cuadrados generalizados, variables instrumentales y mínimos cuadrados extendidos. Por último, en el Epígrafe 2.7 se presentan algunos ejemplos ilustrativos y en el Epígrafe 2.8 algunos problemas propuestos.
Estructura del modelo ARX
En el esquema de la Figura 2.1 se representa, de forma simplificada, una planta de una entrada y una salida, con un ruido aditivo v(t) en esta última.
Figura 2.1. Planta con ruido aditivo a la salida.
Supongamos que la entrada y la salida de la planta representada son accesibles, es decir, pueden ser medidas con un período de muestreo que ahora llamamos T en aras de la simplicidad de la notación. Independientemente de que el sistema original P pueda ser continuo, para describir el comportamiento dinámico de un conjunto discreto de mediciones de su entrada y su salida tomadas durante un cierto número de intervalos de tiempo T, es posible, en muchos casos, asumir el siguiente modelo lineal en diferencias:
() ∑ ( ) ∑ ( ) ()
Donde N es el número de muestras de las variables y los índices k, k-l,...,k-n se utilizan, en lugar de kT, (k-1) T,..., (k-n)T. Por comodidad y en aras de la claridad de la exposición hemos supuesto que el límite de ambas sumatorias es el mismo, dejando abierta la posibilidad de que algunos de los coeficientes a j o b j sean cero. El caso frecuente de sistemas con retardo de transporte, queda incluido, si se anulan algunos de los primeros coeficientes
b j, por ejemplo b 0, b1, etc. No obstante, en capítulos
posteriores será conveniente utilizar modelos en los que los órdenes de los dos sumatorios puedan ser distintos y también donde aparezca eventualmente el retardo de transporte de forma explícita. Por el momento, al entero n lo denominamos orden del modelo. La inclusión de b0 en el modelo que se propone, implica que el valor de la variable de entrada u(k) influye sobre la salida en el mismo tiempo y(k). Muchos autores utilizan una notación en la que no se considera esa influencia y se supone siempre la existencia, como mínimo, de un período de retardo en el modelo. Desde nuestro punto de vista consideramos que se trata sólo de un problema convencional y de cómo se interpreta el muestreo de las variables de entrada y salida; en el texto se ha adoptado la convención que se ilustra en la Figura 2.2. En la Figura 2.2, en efecto, se supone que la variable de entrada se calcula y se aplica antes de medir la variable de salida y aunque ambas se denotan con el mismo índice u(k), y(k) o u(k+1), y(k+1 ), etc., en realidad corresponden a tiempos distintos u(k), y(k+tm) o u(k+1), y(k+1+tm), etc., donde tm, como mínimo, es el tiempo necesario para calcular y aplicar la variable de entrada u(k) más el tiempo de medición de la variable y(k). Este tiempo, desde Juego, debe ser mucho menor que el período de muestreo. Desde el punto de vista que se ilustra en la Figura 2.2, resulta imprescindible, la inclusión del coeficiente b 0 en el modelo ARX.
Figura 2.2. Orden supuesto de las mediciones
El modelo discreto definido en la Ecuación (2.1), consta de tres partes fundamentales: una autorregresión de los valores anteriores de la salida hasta y(kn), una suma de valores previos de la entrada hasta u(k-n) y una componente estocástica exógena e(k). Aunque pueden encontrarse en
la
bibliografía
especializada diversos nombres para este modelo, nosotros adoptaremos el de modelo ARX (auto-regressive and exogenous variable) con el que se le conoce en el toolbox de identificación de MatLab. El término e(k) es un proceso estocástico al que pueden atribuirse varias interpretaciones. Desde el punto de vista puramente estadístico, este término generalmente se interpreta como el residuo o efecto no considerado en el modelo. Desde la óptica de los sistemas de control, el proceso e(k) puede asociarse al ruido o a la indeterminación presente en la planta. Como este ruido no es medible, el cálculo de e(k), a partir del modelo, puede servir como una estimación de éste. El hecho de suponer a
priori la
presencia del ruido sitúa la identificación del proceso en un plano más cercano a la realidad. En efecto, esto significa que se admite que la parte determinística del modelo asumido no es exacta, que refleja sólo parcialmente el proceso y que factores tales como la
no linealidad, la
imprecisión de
las mediciones, la
presencia de perturbaciones no consideradas explícitamente, etc., influyen sobre la salida. Todos estos efectos y muchas otras fuentes posibles de imprecisión, se engloban en el término e(k) considerado como ruido. Al término e(k), que en lo sucesivo será denominado ruido del modelo, se le atribuyen las siguientes propiedades estadísticas, para k=l ,2,3,...:
E{e(k)}=0
(2.2)
E{e2(k)}= 2
(2.3)
E{e(k)e(k-i)}=0, i ≠0
(2.4)
E{e(k)y(k -i)} =0, E{e(k)u(k -i)} =0
(2.5)
donde el operador E{.} simboliza a la esperanza matemática que puede interpretarse como el "valor más esperado" o en muchos casos como el "valor
medio" de la variable o función en el argumento. Entonces, e(k) se considera un proceso de ruido blanco, con media cero y varianza constante
2,
no
correlacionado con la entrada o la salida. El modelo (2.1) puede escribirse también en la forma: y(k) = y(k)+ e(k)
(2.6)
donde
() ∑ ( ) ∑ ( ) (2.7) El término y(k) en la Ecuación (2.7) puede interpretarse entonces como la predicción de la salida en el tiempo k, a partir de las mediciones anteriores y(k-1), y(k-2),..., y(k-n), u(k), u(k-1),....,u(k-n) y los parámetros del modelo. Nótese que, de acuerdo con (2.6) y (2.7), se cumple:
E {y(k)} = y(k)
(2.8)
Una manera alternativa de expresar el modelo (2.1), muy usada en la bibliografía especializada, resulta de introducir el operador de retardo z- 1, definido como sigue: z-i y(k) = y(k-i)
(2.9)
Definiendo además los polinomios: A( z-1)= a1 z-1 + az z-2 +... + an z-n
(2.10)
B(z- 1)= b0 + b1 z- 1 + b2 z-2 +... + b n z-n
(2.11)
y aplicando la transformada z a la Ecuación 2.1 podemos escribir entonces el modelo ARX en la forma (1- A(z- 1))y(k) = B(z -1)u(k) + e(k)
(2.12)
o también
) ( () () () () () (2.13)
El segundo término de la parte derecha de la Ecuación (2.13) puede identificarse con una versión discretizada del ruido aditivo v(t) que aparece en la Figura 2.1. Esta última forma del modelo ARX pone en evidencia un hecho de gran importancia para la identificación de los parámetros del modelo (2.1) o (2.13), y es que el ruido resultante que actúa sobre la salida no satisface generalmente las condiciones de ruido blanco no correlacionado supuestas en (2.4) y (2.5). En efecto, el término estocástico del modelo (2.13) es un ruido filtrado a través de la función de transferencia 1 / (1- A(z -1)). La Ecuación (2.13) puede escribirse entonces:
) ( () () () () (2.14) Donde
( ) () ( ) (2.15) Y también
() ∑ ( ) ()
(2.16)
De la Ecuación (2.16) resulta evidente que v(k) es un ruido correlacionado. En el contexto de las series cronológicas (Box and Jenkins, 1970), el proceso descrito en (2.16) se conoce como una serie o proceso autorregresivo. Resumiendo el análisis anterior podemos afirmar que aun cuando al ruido del modelo e(k) se le atribuyan
las propiedades
del ruido blanco no
correlacionado, el ruido resultante sobre la salida de la planta no cumple
en
general con esas condiciones, pues se trasmite a través del filtro 1/(l-A). Ahora vamos a introducir otra forma del modelo ARX que será de extrema utilidad cuando se estudien los algoritmos recursivos de identificación.
La Ecuación
(2.1)
puede,
en efecto, escribirse de la siguiente forma más
compacta: y(k) = PT z(k) + e(k)
(2.17)
donde PT y z(k) son respectivamente los vectores de los parámetros y de las mediciones. A este último se le conoce como vector de regresión. Ambos vectores pueden definirse de varias formas; una muy conveniente, desde el punto de vista de los algoritmos de identificación
en línea, es la
siguiente: PT = [b0 a1 b1,…,an bn ]
(2.18)
Z T (k)= [u(k) y(k -1) u(k - 1),…, y(k- n) u(k- n)]
(2.19)
PT y ZT son vectores de dimensión El modelo
(2.17)
2n+1.
puede expresarse
en forma
observaciones del par entrada-salida (u,y) como sigue:
generalizada para
t