„,. Determine el factor de atenuación a a partir de la ecuación siguiente: ™
1+a
5. Determine elpunto de frecuencia donde la magnitud del sistema no compensado G^(jv) es igual a -20 log(l/Va ). Escoja esta frecuencia como la nueva frecuencia de cruce de ganancia. Esta fre cuencia corresponde a vm= 1/(■Jar), y a esta frecuencia se presenta el corrimiento máximo de fase
v~~
Polo del compensador de adelanto:
v =—
ar
7. Verifique el margen de ganancia para asegurarse de que es satisfactorio. De lo contrario, repita el proceso de diseño modificando la localización de los polos y de los ceros del compensador hasta que se obtenga un resultado satisfactorio. La función primordial del compensador de adelanto es proporcionar atenuación en el rango de altas frecuencias para un margen de fase suficiente para el sistema. Las características del atraso de fase no tienen consecuencias en la compensación mediante atraso. COMPENSACIÓN DE ATRASO I. Suponga la forma siguiente para el compensador de atraso:
La función de transferencia en lazo abierto del sistema compensado puede escribirse como
G n(w )G (w )
l -f- TW
= K d 1 + p~w G ( w^ 1 + TW
1 + /3t w
www.FreeLibros.me
274
Diseño de sistemas de control en tiempo discreto mediante métodos convencionales
Capítulo 4
donde G,(w) = KDG(w). Determine la ganancia KDque satisfaga el requisito de la constante de error de velocidad estática dada. 2. Si el sistema no compensado G¡(w) no satisface las especificaciones referentes a los márgenes de fase y de ganancia, entonces encuentre el punto de frecuencia donde el ángulo de fase de la fun ción de transferencia en lazo abierto sea igual a-180° más el margen de fase requerido. El margen de fase requerido es el margen de fase especificado más 5o a 12°. (La adición de 5° a 12° compen sa el atraso de fase del compensador de atraso.) Escoja esta frecuencia como la nueva frecuencia de cruce de ganancia. 3. A fin de evitar efectos perjudiciales de atraso de fase en razón del compensador de atraso, el polo y el cero del compensador de atraso deberán estar localizados bastante más abajo que la nueva frecuencia de cruce de ganancia. Por lo tanto, escoja la frecuencia de esquina v = 1/r (corres diente al cero del compensador de atraso de fase) una decena por debajo de la nueva frecuenc cruce. 4. Determine la atenuación necesaria para llevar la curva de magnitud hacia abajo hasta 0 dB nueva frecuencia de cruce de ganancia. Notando que esta atenuación es -20 log ¡3, determi valor de ¡3. Entonces la otra frecuencia de esquina (que corresponde al polo del compensad! atraso) queda determinada a partir de v = \l{bt). Una vez diseñado el compensador de atraso en el plano w, Gn(w) deberá transformar: el compensador de atraso en el plano z, GD(z). Note que el polo y el cero en el compensador de atra; el plano z están muy cerca uno de otro. (Están cerca del punto z = 1.) Ya que los coeficientes de! filt deben realizar mediante palabras binarias que utilizan un número limitado de bits, si el número dt empleado resulta insuficiente, las localizaciones de polos y ceros del filtro pueden no realizarse como se desea, y el compensador resultante podría no comportarse como se espera. Es importante q polo y el cero del compensador de atraso se presenten en un número finito de puntos discretos asigna
Precaución.
Problema A-4-11 Diseñe un controlador digital para el sistema que se muestra en la figura 4-54. Utilice el métodi diagrama Bode en el plano w. Las especificaciones de diseño consisten en que el margen de fase defc de 55°, el margen de ganancia por lo menos de 10 dB, y la constante de error de velocidad estática seg-1. El período de muestreo se especifica como 0.1 seg, es decir T= 0.1. Una vez diseñado el control trace un diagrama del lugar geométrico de las raíces. Localice los polos en lazo cerrado del diagra encuentre el número de muestras por ciclo de la oscilación senoidal amortiguada. Solución
La transformada de z de la planta precedida por un retén de orden cero es 1 - e-7i
,
1
-siTTT).
Transformemos G(z) en G(h>) utilizando la transformación bilineal siguiente:
1 + ( 7 W 2 ) = 1 + 0 .0 5 w 1 - (7W /2) “ 1 - 0.05w
www.FreeLibros.me
apítulo 4
Problemas de ejemplo y soluciones
Figura 4-54
275
Sistema de control digital.
Al sustituir esta última ecuación en G(z), obtenemos 0.0046831 t + + 0.9355 - 0.05w
G (w ) =
= 0.5(1 + 0 .0 01666w )(l - 0.05w ) w (l + 0.5016w )
El diagrama Bode de G(jv) aparece en la figura 4-55. Escogeremos ahora la función de transferencia del controlador en la forma 1 +~
1
Gd ( w) = Ko , + TW = Ko1 + arw
ü w l +b
donde a = \¡t y b = l/(ar). La función de transferencia en lazo abierto es 1 + (iv/a) 0.5(1 + 0.001666tv)(l - 0.05w) ‘ l + ( wlb ) >v(l + O.SOlóvt')
G d( w)G( w ) = Kd -
La constante de error de velocidad estática requerida de Kv. Es 5 seg-1. O de ahí,
Kv = lim [tvG 0 (w )G (tv)] = 0.5A:d = 5 W— *0 a partir de la cual determinamos que
K d = 10 Utilizando una técnica de diseño convencional, se determina la función de transferencia del controlador digital como
/ 1+ GD(w) = 10 --\
+
.
\
1 994
w
121 /
Por lo tanto, la función de transferencia en lazo abierto se convierte en
G o { w ) G { w ) = 10
1.994 0.5(1 + 0.001666w)(l - 0.05w)
w
w ( 1 + 0.5 0 1 6 tv )
\ 1 + Í 2I I
www.FreeLibros.me
Diseño de sistemas de control en tiempo discreto mediante métodos convencionales
Capítuk
v ( r a d /s }
Figura 4-55
Diagrama Bode correspondiente al sistema considerado en el problema A-4-11
Esta función de transferencia en lazo abierto da el margen de fase de aproximadamente 55c > margen de ganancia de alrededor de 12.4 dB. La constante de error de velocidad estática Kv es 5 seg Por lo tanto, se satisfacen todos los requisitos y la función de transferencia del controlador diseñ Gri(w) es satisfactoria. A continuación, transformamos GD{w) en G„(z). Se deberá utilizar la siguiente transforman bilineal 2 z
tv = —
1
Tz +1
2
0.1 z + 1
2 + 1
Entonces
20 - l\ 1.994 z + 1 Gd(z) = 10 20 z - 1 1 + 12.5 z + 1 / \ 1 +
= 42 423^ ^ 182) = 42 m ( 1 I 0-8-187^ \z - 0.2308/
\1 - 0.2308z~‘
La función de transferencia pulso en lazo abierto ahora se convierte en °( )
( )
0.1987(z + 0.9355) (z - 0.2308)(z - 1)
La figura 4-56 muestra el diagrama del lugar geométrico de las raíces para el sistema. Al usar condición de magnitud, encontramos que los polos en lazo cerrado están localizados en z = 0.51b yO.388. En el diagrama del lugar geométrico de las raíces, se superponen los lugares geométricos de
www.FreeLibros.me
Capítulo 4
Problemas de ejemplo y soluciones
2 77
Figura 4-56 Diagrama del lugar geométrico de las raíces para el sistema diseñado en el problema A-4-11.
constante para £= 0.5 y para £=0.6. Se puede ver del diagrama que el factor de amortiguamiento relativo £ de los polos en lazo cerrado es de aproximadamente 0.55. La linea que conecta el polo en lazo cerrado en la parte superior del plano z con el origen tiene un ángulo de 37°. Por lo tanto, el número de muestras por ciclo de la oscilación senoidal amortiguada es 360°/37° = 9.73. Problema A-4-12 Considere el sistema de control digital mostrado en la figura 4-57, donde la función de transferencia de la planta es 1/í2. Diseñe un controlador digital en el plano w, tal que el margen de fase sea de 50° y el margen de ganancia sea de por lo menos 10 dB. El período de muestreo es 0.1 seg, es decir T= 0.1. Después de diseñar el controlador, obtenga la constante de error de velocidad estática Kv. También, obtenga la respuesta del sistema diseñado ante una entrada escalón unitario. Solución
Primero obtendremos la transformada z precedida por un retén de orden cero:
G (z)=z Z =
1 - e ' T$ 1 = (1 - z - ^ Z s s2
1
T2( l + z ' V 2(1 _ - z,-.v> ~'f
0.005(1 + z ~ ' ) z 0.005(z + 1) (1 - z - ') 2 (z - l ) 2 A continuación, utilizando la transformación bilineal dada por z =
1 + (Tw/2) 1 - (T w
l2 )
1 + 0.05>v ~ 1 - 0.05w
www.FreeLibros.me
27 8
Diseño de sistemas de control en tiempo discreto mediante métodos convencionales
Capítulo 4
Figura 4-57 Sistema de control digital.
transformamos G(z) en G(w): 0 .0 0 5 s
+ \ 1 -
0 .0 5 w
G(w) = — t----------- cj'\
+ 0 .0 5 w
_
)
l -
0 .0 5 t v
'
,1 - 0.05w
Por lo tanto 1 - 0.05/v G 0 )=
{jyf
La figura 4-58 muestra el diagrama Bode de G(Jv) que se obtiene de esta manera. Observe que el margen de fase es -12°. Será necesario añadir una red de adelanto para conseguir el margen de fase y el margen
v (rad/s
Figura 4-58
)
Diagrama Bode para el sistema considerado en el problema A-4-12.
www.FreeLibros.me
27 8
Diseño de sistemas de control en tiempo discreto mediante métodos convencionales
Figura 4-57
Capítute4
Sistema de control digital.
transformamos G(z) en G(w): 0.005 + , \ l ~ 0.05w I G (w ) = — t----------- ry+ 0.05w ' v1 - 0.05w
i - 0.05w
Por lo tanto 1 - 0.05jv
G 0 '") =
(;V >2
La figura 4-58 muestra el diagrama Bode de G(jv) que se obtiene de esta manera. Observe que el marga* de fase es -12°. Será necesario añadir una red de adelanto para conseguir el margen de fase y el marga*
v ( rad/s
Figura 4-58
)
Diagrama Bode para el sistema considerado en el problema A-4-12.
www.FreeLibros.me
Capítulo 4
Problemas de ejemplo y soluciones
279
de ganancia requeridos. Mediante la aplicación de una técnica convencional de diseño, puede verse que la red de adelanto siguiente satisface los requisitos:
La adición de esta red de adelanto modifica el diagrama Bode. La frecuencia de cruce de ganancia se recorre a v = 4. Note que el adelanto de fase máximo c¡>mque puede producir esta red de adelanto es 61.93°, ya que 1 - é
A la frecuencia de cruce de ganancia v = 4, el ángulo de fase de GD(Jv)G(Jv) se convierte en -191.31° + 61.93° = 129.38°. Por lo tanto, el margen de fase es 50.62°. El margen de ganancia se determina aproxi madamente en 12 dB. Por lo tanto, se satisfacen las especificaciones de diseño dadas. Ahora transformamos la función de transferencia del controlador GD(w) en GD(z). Mediante la transformación bilineal
obtenemos
= 37.3331
G d(z ) = 64
z - 0.9048 z - 0.1111
Entonces, la función de transferencia pulso en lazo abierto se convierte en
0.1867(1 - 0.9048z1) ( l + z~')z~l (1 - 0.1 1 1 1 z ' ) ( l - z - ') 2 La constante de error de velocidad estática K„ se obtiene como sigue:
Kv = lim Z—*1
1—
í
?— G
d(z
)G (z )
í l - z - ' 0.1867(1 - 0 .9 0 4 8 z-')(l + z-')z~' 0-1
OO
( i - O .llll z - 'X l - z - 1)2
Por lo tanto, la constante de error de velocidad estática K,. es infinita. No existe error en el estado perma nente en la respuesta rampa. La función de transferencia pulso en lazo cerrado del sistema es C(z) _
R (z )
0.1867z~' + 0.0178z~2 - 0.1689z 3 1 - 1.9244Z-' + 1.2400z'2 - 0.2800z~3
La figura 4-59 muestra la respuesta escalón unitario. Note que el cero del controlador digital de z = 0.9048 está cerca del polo doble en z = 1. Un par polo-cero cerca del punto z = 1genera una cola larga de pequeña amplitud en la respuesta.
www.FreeLibros.me
Diseño de sistemas de control en tiempo discreto mediante métodos convencionales
280
Capitulo *
1.6 1 .4
1
1
c[kT) 0 0 0 0
0
0.2
0.4
0.6
0.8
1.0
1.2
1.4
1.6
1.8
2.0
2.2
2.4
kT (s ) Figura 4-59 Gráfica de c(kT) en función de kT para el sistema diseñado en el problema A-4-12.
Problema A-4-13 Considere el sistema de control digital mostrado en la figura 4-60. La función de transferencia de i* planta incluye un atraso de transporte e E l tiempo de atraso es 5 seg, es decir L = 5. La salida desead* c(t) en respuesta a una entrada escalón unitario es como se muestra en la figura 4-61a). La curva se ele\* desde cero hasta su valor final en 10 seg (medido desde t = 5 hasta / = 15). Y no existe ni sobrepaso ni error en estado permanente. El tiempo de asentamiento es de 15 seg (medido desde t = 0 hasta r = 15). Se requiere que no existan componentes oscilatorias entre muestras en la salida después de haber alcanzad el tiempo de asentamiento. Diseñe un controlador digital Gn(z). Solución Seleccionemos el período de muestreo como de 5 seg, es decir 7 = 5. (Podemos, naturalmen te, elegir el período de muestreo como de 2.5 seg, 1 seg u otro valor. En este ejemplo, sin embargo, par* simplificar nuestra presentación, hemos definido el período de muestreo en 5 seg.)
Figura 4-60
Sistema de control digital.
www.FreeLibros.me
Capítulo 4
Problemas de ejemplo y soluciones
281
20
15
10
25
30
r (s )
(»)
(b)
Figura 4-61 a) Salida deseada c(t) en respuesta a una entrada escalón unitario; b) Gráfica de u(t) en función de t.
La transformada z de la planta, precedida por un retén de orden cero, es
G (z)=Z
1 - e 10i + 1
= (1 - z~x)z~xZ
1 5(105 + 1)
0.3935z~2 1 - 0.6065z“ Note que no existe ningún polo inestable o críticamente estable en G(z). Por lo tanto, en este caso no hay problema de estabilidad. Definamos la función de transferencia pulso en lazo cerrado como F(z):
C(z) _ GD(z)G{z) = F(z) R(z) 1 + G d (z ) G ( z )
(4-80)
En el caso presente, la salida c(t) en la respuesta escalón unitario se define tal y como se muestra en la figura 4-6la). En vista que h[ 1— 1(15~5>] = h( 1-e~') = 1tenemos que h = 1.5820. A partir de la curva de respuesta con oscilaciones muertas que se muestra en la figura 4-61a) obtenemos c(0) = 0 c ( l) = 0
www.FreeLibros.me
282
Diseño de sistemas de control en tiempo discreto mediante métodos convencionales
Capítulo t
c( 2) = h(l - e~05) = 1.5820 x 0.3935 = 0.6225 c(k) = 1,
k = 3 ,4 ,5 ,...
de lo cual obtenemos C (z) = 0.6225z“ 2 + z “ 3 + z -4 + z ^5 + ••• = 0.6225z“ 2 + z ~3-- -— 1 - z ^1 = 0.6225z~2 + 0.3775z~ 3 1 - z~‘ Si se observa que 1 C (z) = F(z)R(z) = F( z ) y T ^ T
0.6 2 2 5 z'2 + 0.3775z" j _ 2-.
obtenemos
F(z) = 0.6225z~2 + 0.3775z ' 3 = 0.6225(1 + O.ÓOÓSz-^z" 2 Una vez determinada F(z), la función de transferencia pulso del controlador digital puede obtenerse * partir de la ecuación (4-80):
G d {z )
G (z )[
1- F(z )]
Observe que de la ecuación (4-48) tenemos 1 - F(z) = (1 - z~')N(z) es decir 1 - 0.6225z~2 - 0.3775z" 3 = (1 - z_ 1)Af(z) Al dividir (1 - 0.6225z~2- 0.3775z-3) entre (1 - z~‘), se puede determinar A'íz) como sigue:
N(z) = 1 + z ' 1 + 0.3775z' 2 Y, en consecuencia, 1 - F (z ) = (1 - z_1) ( l + z~x + 0.3775z“ 2) y
G ° ( 2) _
0.6225(1 + 0.6065z~')z~2 n 0.3935Z _ (1 _ z _1)(1 + z _, + 0 3175z-2j 1 - 0.6065z
1.5820(1 - 0.3678z “2) _ (1 - z - ‘) ( l + z" 1 + 0.3775z~2) Esta última ecuación da la función de transferencia pulso del controlador digital. Dado que c(t) debe ser la unidad en estado permanente, u{t), una señal en tiempo continuo, deberá ser constante una vez alcan zado el estado permanente. Determinemos u(z): iu ,\ _ £ ( £ ) _ U ^z >
G(z)
0-6225Z-2 + 0.3775Z-3 _ n m í e , -2 ' _! 0.3935z (' Z ^-O .Ó O óSz - 1
1 .582U
/1 - 0.3678z-2 \ 1 - z"
= 1.5820 + 1.5820z_1 + z “ 2 + z ' 3 + z " 4 + •••
www.FreeLibros.me
Capítulo 4
Problemas de ejemplo y soluciones
283
Al tomar la transformada z inversa de U(z), encontramos que u(k) es constante para k> 2. Por lo tanto, no existen componentes oscilatorias entre muestras en la salida una vez que se ha alcanzado el tiempo de asentamiento. La señal u(t) en función de t aparece grafícada en la figura 4-61b). Problema A-4-14 Considere el sistema de control digital que se muestra en la figura 4-62. Diseñe un controlador digital Gd{¿) tal que el sistema en lazo cerrado exhiba el tiempo de asentamiento mínimo con un error en estado permanente cero en una respuesta rampa unitaria. El sistema no podrá tener componentes oscilatorias entre muestras en estado permanente. El período de muestreo t se supone de 1seg. Después de diseñar el controlador, investigue la respuesta del sistema a una entrada delta de Kronecker y a una entrada escalón unitario. Solución El primer paso en el diseño será determinar la transformada z de la planta que está antecedida por un retén de orden cero:
G {z)=Z
1
1
1
s
s
= ( i - z~xy z
(1 +
2(1 - z - y Ahora definamos la función de transferencia pulso en lazo cerrado como F(z):
C{z) R(z)
G d(z )G( z ) 1+
G
d (z
)G (z )
- F(z)
Observe que si G(z) se expande a una serie en z 1 entonces el primer término será 0.5 de z '. Por lo tanto,
F(z) debe de empezar con un término en z~[: F(z) = at z-1 + a2z~2 + ••■+ aNz~N donde N > n siendo n el orden del sistema. Dado que el sistema aquí es de segundo orden, n = 2. En vista de que la entrada es una rampa unitaria, de la ecuación (4-48) requerimos que 1 - F(z) = (1 -
z
(4-81)
- ' ) 2N ( z )
Note que G(z) tiene un polo doble críticamente estable en z = 1. Por lo tanto, desde el punto de vista del requisito de estabilidad, 1- F(z) deberá tener un cero doble en z = 1. Sin embargo, 1- F(z) ya implica un término (1 - z 1)2, satisfaciendo por lo tanto el requisito de estabilidad. Dado que el sistema no debe mostrar componentes oscilatorias entre muestras en el estado perma nente, requerimos que U(z) sea del tipo siguiente de la serie en z 1:
U(z) - ¿>0 + biZ 1 + b2z 2 + ••■+ bN-iZ N+> + b(z~
Figura 4-62
Sistema de control digital.
www.FreeLibros.me
•)
284
Diseño de sistemas de control en tiempo discreto mediante métodos convencionales
Capítuc 4
Dado que la función de transferencia de la planta Gp(s) incluye un doble integrador, b debe ser cero, i Di lo contrario, la salida aumentará en forma parabólica, en vez de linealmente.) En consecuencia, tena" mos
U(z) = b0 + b¡ z~' + ■■• + bN~iz~N+> De la figura 4-62, U(z) puede darse en la forma
V{Z)
C(z) _ C(z) R(z) G(z) R(z) G(z)
R(z) H z ) G( z )
2(1 - z ~ y
= F(z)
(1 - z " ) 2 (1 + z - V 1
2
= F(z)
1 + z" 1
Para que U(z) sea una serie en z 1 con un número finito de términos, F(z) debe ser divisible entre 1- rl
F(z) = (1 + z-')F¿z) Entonces, U(z) se puede escribir como sigue:
U{z) = 2F,(z)
i
donde Ft(z) es un polinomio en z_l con un número finito de términos. Al comparar las ecuaciones (4-81) y (4-82) y mediante un simple análisis, vemos que F(:i incluir un término con por lo menos z~3. Por lo tanto, suponemos
F(z) = a¡z~l + a2z~2 + a3z ~3 Esta forma supuesta de F(z) involucra sólo el número mínimo de términos, la respuesta transitoria asentará en tres períodos de muestreo. Determinaremos ahora las constantes ab a2y av De la ecuación (4-81) tenemos 1 - ai z 1 - a2z
a3z
(1 - z~')2N(z)
Si dividimos el primer miembro de esta última ecuación entre (1 -z ')2, el cociente es 1+ (2 - a c residuo es [2(2 - a,) - (1 + a2)]z~2- [(2 - a,) + a3]z'3. De ahí, se determina N(z) en la forma
N(z) = 1 + (2 — ai)z~' y el residuo se ¡guala a cero: [2(2 - ai) - (1 + a2)]z~2 - (2 - a3 + a3)z ~3 = 0 Para satisfacer esta última ecuación, es necesario que
2(2 - ai) - (1 +a2) = 0 2—«i +a3 = 0 De la ecuación (4-82), tenemos a jz ' 1 + a2z 2 + a3z 3 = (1 + z ')Fi(z ) Si dividimos el primer miembro de esta última ecuación entre 1+z 1, el cociente es a ,z 1+ (a2- a c i residuo es (a, - a2+ a3)z~3. Por lo tanto, Fi(z) = ai z
1 + (a 2 - a i) 2
www.FreeLibros.me
apítulo 4
Problemas de ejemplo y soluciones
285
y el residuo se iguala a cero: ai - a2 + a3 = 0
(4-86)
Al resolver las ecuaciones (4-84), (4-85) y (4-86) en función de a¡, a2y a3, obtenemos a i = 1.25,
a2 = 0.5,
a3 = -0.75
Por lo tanto. N(z) = 1 + 0.75Z- 1 y
Fi(z) = 1.25z_1 - 0.75z~2 = 1.25z_,(l - 0.6z“ ')
y F(z) se determina como sigue: F(z) = 1.25z“ ' + 0.5z' 2 - 0.75z' 3 = 1.25z“ '( l + z - ')(l - 0.6z‘ l)
El controlador digital G„(z) se determina a continuación de la ecuación (4-50): r
í 7\ = F{z) d( > G (z )( 1 - z-')2(V(z)
=
1.25z~‘(l + z~‘)( l - O.óz^"1) ^
^
( l -
z
" ) 2 ( l + 0.75z-)
2.5(1 - O.óz^1) 1 + 0.75Z' 1
Con el controlador digital así diseñado, la salida del sistema en respuesta a una entrada rampa unitaria se obtiene como sigue: C(z) = F(z)R(z) A 7 C » - t\ = (1.25z~' + 0.5z 22 - 0 .7 5 z '3)
Z
'(1 - z - 1)2
1.25z“ 2 + 3z~3 + 4z' 4 + 5z“ 5 + ■■■ Y por lo tanto,
c(0) = 0 c (1 ) = 0 c(2) = 1.25
c(k) = k,
k = 3 ,4 ,5 ,...
Observe que de la ecuación (4-83) tenemos
U(z) = 2fi(z) = 2(1 .2 5 z-1) (l - O.óz-1) = 2.5z_1 - 1 .5 z-2 Por lo tanto, la señal de control U(k) se convierte en cero para k> 3. Consecuentemente, no habrá componentes oscilatorias entre muestras en la respuesta en estado permanente. La figura 4-63 muestra las gráficas de c(k) en función de k, u(k) en función de k y u(t) en función de / en la respuesta rampa unitaria.
www.FreeLibros.me
286
Diseño de sistemas de control en tiempo discreto mediante métodos convencionales
f (s)
Capítuic
Figura 4-63 Gráficas de c(k) en función de k, u(k) en func k y u(t) en función de t en la respuesta rampa unitaria del si diseñado en el problema A-4-14.
A continuación, investiguemos la respuesta de este sistema a una entrada delta de Kronec una entrada escalón unitario. En el caso de una entrada delta de Kronecker
C (z) = F(z )R (z ) = F(z) = 1.25z ' 1 + 0.5z~2 - 0.75z “3 Note que U(z) en este caso se convierte en: V ( r \ = F (7\ ^ ¿ L = 1 2 5 z '(1 + z " 1) ( 1 ~ Q - 6 ^ 1)
K
K ’ G{z)
(1 + z _1) z “V[2( 1 - z 1)2]
= 2.5(1 - 0 .6 z -')(l - z - ' f
= 2.5 - 6.5z“‘ + 5.5 z“2 - 1.5z“3 La señal de control u(k) se convierte en cero para k >4. Por lo tanto, no habrá componentes osci entre muestras después de t > 4T= 4.
www.FreeLibros.me
Capítulo 4
Problem as de ejemplo y soluciones
287
En el caso de la entrada escalón unitario,
C(z) = F{z)R(z) = (1.25z_1 + 0.5z-2 - 0.75z~3) - - } = 1.25z-1 + 1.75z-2 + z“ 3 + z ~4 + z~s + ••• E l sobrepaso máximo es de 75% en la respuesta escalón unitario. Observe que
U(z) = F(z)
R(z) _ 1.25z~'(l + z-’X l - O.óz-1) G(z) 2(1 - z-'):
= 1.25(1 - 0.6z‘ 1)(2 )(l - z~x) = 2.5 - 4z_1 + 1.5z“ 2 La señal de control u(k) se convierte en cero para k > 3. En consecuencia, no habrán componentes oscilatorias entre muestras después de que se ha alcanzado el tiempo de asentamiento. En la figura 4-64a) se muestran las gráficas de c(k) en función de k, u(k) en función de k y u(t) en función de t en respuesta a la entrada delta de Kronecker. La figura 4-646) muestran gráficas similares para la respuesta escalón unitario. Note que cuando el sistema se ha diseñado para la entrada rampa la respuesta a una entrada escalón ya no es oscilatoria. cW A
c{k)l
a) b) Figura 4-64 a) Gráficas de c(k) en función de k, u(k) en función de k y u(l) en función de t en la respuesta a una entrada delta de Kronecker del sistema diseñado en el problema A-4-14; b) Gráficas de c(k) en función de k, u(k) en función de A y u(r) en función de t en la respuesta escalón unitario para el mismo sistema.
www.FreeLibros.me
288
Diseño de sistemas de control en tiempo discreto mediante métodos convencionales
Capfti
PRO BLEM A S Problema B-4-1 Considere las regiones en el plano i que se muestran en las figuras 4-65a) y b). Dibuje las regiooo correspondientes en el plano z. E l período de muestreo T se supone de 0.3 seg. (La frecuencia de muesra es ai,. = 2ir!T= 2-77/0.3 = 20.9 rad/seg.)
(a)
(b) Figura 4-65 a) Región en el plano s limitada pn líneas de
Problema B-4-2 Considere la siguiente ecuación característica: z3 + 2.1z2 + 1.44z + 0.32 = 0 Determine si cualquiera de las raíces de la ecuación característica están o no fuera del círculo unitario < centro en el rigen del plano z. Problema B-4-3 Determine la estabilidad del siguiente sistema en tiempo discreto:
Y(z) X (z )
_______________z ^ _____________ 1 + 0.5z“ ' - 1.34z-2 + 0.24z-
Problema B-4-4 Considere el sistema de control en tiempo discreto en lazo cerrado mostrado en la figura 4-13. Determi el intervalo de la ganancia K para estabilidad mediante el uso del criterio de estabilidad de Jury.
www.FreeLibros.me
Capítulo 4
Problemas
289
Problema B-4-5
Resuelva el problema B-4-4 utilizando la transformación bilineal junto con el criterio de estabilidad de Routh. Problema B-4-6
Considere el sistema 2M = r ( X{z)
v = b° + b' z ~' + ••• + 1 +a l z~l + ••• + a„z~"
Suponga que la secuencia de entrada {*(&)} es acotada. Esto es, jx(/c)| < M¡ = constante, siendo k = 0,
1 ,2 ,...
Demuestre que, si todos los polos de G(z) están dentro del círculo unitario en el plano z, entonces la salida
y(k) también es acotada; esto es, \y{k)| < M2 = constante, siendo k = 0,
1, 2 , . . .
Problema B-4-7
Enuncie las condiciones de estabilidad, inestabilidad y estabilidad crítica en términos de la secuencia de ponderación g(kT) de un sistema de control en tiempo discreto lineal e invariante con el tiempo. Problema B-4-8
Considere el sistema de control digital que se muestra en la figura 4-66. Trace los lugares geométricos de las raíces conforme se varía la ganancia K desde 0 hasta Determine el valor crítico de la ganancia K para estabilidad. El período de muestreo es de 0.1 seg, es decir 7"=0.1. ¿Qué valor de la ganancia K dará un factor de amortiguamiento relativo £ de los polos en lazo cerrado igual a 0.5? Con la ganancia K definida para obtener £ = 0.5, determine la frecuencia natural amortiguada cu,,y el número de muestras por ciclo de la oscilación senoidal amortiguada.
Problema B-4-9
Refiriéndonos al sistema de control digital mostrado en la figura 4-67, diseñe un controlador digital
G„(z) tal que el factor de amortiguamiento relativo £de los polos dominantes en lazo cerrado sea 0.5 y el número de muestras por ciclo de la oscilación senoidal amortiguada sea 8. Suponga que el período de muestreo es de 0.1 seg es decir T= 0.1. Determine la constante de error de velocidad estática. También, determine la respuesta del sistema diseñado a una entrada escalón unitario. Problema B-4-10
Considere el sistema de control mostrado en la figura 4-68. Diseñe un controlador digital adecuado que incluya una acción de control integral. Las especificaciones de diseño son que el factor de amortiguamiento relativo £de los polos dominantes en lazo cerrado sea 0.5 y que existan por lo menos 8 muestras por ciclo
www.FreeLibros.me
290
Diseño de sistemas de control en tiempo discreto mediante métodos convencionales
Figura 4-67
Sistema de control digital para el problema B-4-9.
Figura 4-68
Sistema de control digital para el problema B-4-10.
Capítulo 4
de la oscilación senoidal amortiguada. El período de muestreo se supone de 0.2 seg es decir T= 0.2. Una vez diseñado el controlador digital, determine la constante de error de velocidad estática Kv. Problema B-4-11
Considere el sistema de control digital mostrado en la figura 4-69, donde la planta es de primer orden y tiene un tiempo muerto de 5 seg. Seleccionando un periodo de muestreo razonable T, diseñe un controlador digital Pl tal que los polos dominantes en lazo cerrado tengan un factor de amortiguamiento relativo £de 0.5 y el número de muestras por ciclo de la oscilación senoidal amortiguada sea 10. Después de diseñar el controlador, determine la respuesta del sistema a una entrada escalón unitario.
Figura 4-69
Sistema de control digital para el problema B-4-11.
Problema B-4-12
Diseñe un controlador proporcional y derivativo digital para la planta cuya función de transferencia es 1/
s2 tal y como se muestra en la figura 4-70. Se desea que el factor de amortiguamiento relativo £ de los polos dominantes en lazo cerrado sea de 0.5 y la frecuencia natural no amortiguada sea 4 rad/seg. El período de muestreo es 0.1 seg, es decir T= 0.1. Después de diseñar el controlador, determine el número de muestras por ciclo de la oscilación senoidal amortiguada.
www.FreeLibros.me
Capítulo 4
Problemas
291
Figura 4-70
Sistema de control digital para el problema B-4-12.
Problema B-4-13 Al hacer referencia al sistema considerado en el problema A-4-9, rediseñe el controlador digital de tal forma que la constante de error de velocidad estática A,, sea 12 seg-1, sin cambiar en forma apreciadle las posiciones de los polos dominantes en lazo cerrado en el plano z. El período de muestreo se supone de 0.2 seg o 7’= 0.2. Una vez rediseñado el controlador, obtenga la respuesta escalón unitario y la respuesta rampa unitaria del sistema de control digital. Problema B-4-14 Considere el sistema de control digital mostrado en la figura 4-71. Dibuje un diagrama Bode en el plano w. Defina la ganancia K de tal manera que el margen de fase sea igual a 50°. Con la ganancia K definida de esta forma, determine el margen de ganancia y la constante de error de velocidad estática Kr. Se supone que el período de muestreo es de 0.1 seg. es decir T = 0.1.
Figura 4-71
Sistema de control digital para el problema B-4-14.
Problema B-4-15 Utilizando el método del diagrama Bode en el plano w, diseñe un controlador digital para el sistema mostrado en la figura 4-72. Las especificaciones de diseño consisten en que el margen de fase sea de 50°. el margen de gafiancia de por lo menos 10 dB, y la constante de error de velocidad estática A',, sea de 20 seg-1. El período de muestreo se supone de 0.1 seg, es decir T= 0.1. Una vez diseñado el controlador, calcule el número de muestras por ciclo de la oscilación senoidal amortiguada.
Figura 4-72
Sistema de control digital para el problema B-4-15.
www.FreeLibros.me
292
Diseño de sistemas de control en tiempo discreto mediante métodos convencionales
Capítufe 4
Problema B-4-16 Considere el sistema de control digital de la figura 4-73. Al usar el método del diagrama de Bode en d plano w, diseñe un controlador digital de tal forma que el margen de fase sea de 60°, el margen de ganancia de 12 dB o más, y la constante de error de velocidad estática de 5 seg-1. El período de muestreo se supone de 0.1 seg, es decir T = 0.1.
Figu ra 4-73
Sistema de control digital para el problema B-4-16.
Problema B-4-17 Considere el sistema mostrado en la figura 4-74. Diseñe un controlador digital utilizando un diagrarai Bode en el plano w de tal forma que el margen de fase sea de 50° y el margen de ganancia de por lo menea 10 dB. Se desea que la constante de error de velocidad estática K„ sea de 10 seg-i. El período de muestra* está especificado como 0 .1 seg, es decir T = 0.1. Una vez diseñado el controlador, determine el númeai de muestras por ciclo de la oscilación senoidal amortiguada.
Figura 4-74
Sistema de control digital para el problema B-4-17.
Problema B-4-18 Considere el sistema de control digital mostrado en la figura 4-75. Diseñe un controlador digital G0(risÉ que la salida del sistema tenga una respuesta con oscilaciones muertas a una entrada escalón unitan* (esto es, el tiempo de asentamiento será el mínimo posible y el error en estado permanente será cera, también, la salida del sistema no mostrará componentes oscilatorios entre muestras una vez alcanzado el tiempo de asentamiento). El período de muestreo T se supone de 1 seg, es decir T= 1.
Figura 4-75
Sistema de control digital para el problema B - 4 - 1 S.
www.FreeLibros.me
5 Análisis en el espacio de esta d o
5-1 IN TRO D U CCIÓ N En los capítulos 3 y 4 nos ocupamos de los métodos convencionales para el análisis y el diseño de los sistemas de control. Métodos convencionales como los del lugar geométrico de las raíces y los de respuesta en frecuencia, son útiles para los casos de sistemas con una entrada y una salida. Los métodos convencionales son conceptualmente sencillos y nada más requieren de un número razona ble de cálculos, pero sólo son aplicables a sistemas lineales invariantes en el tiempo con una entrada y una salida. Se basan en la relación entrada— salida del sistema, es decir, en la función de transfe rencia o la función de transferencia pulso. No se aplican a sistemas no lineales, excepto en casos simples. Asimismo, los métodos convencionales no son aplicables al diseño de sistemas de control óptimo y adaptable, mismos que son, en su mayor parte, variantes en el tiempo y/o no lineales. Un sistema de control moderno puede tener muchas entradas y muchas salidas, y éstas están interrelacionadas de una manera complicada. Los métodos en el espacio de estado para el análisis y la síntesis de sistemas de control son más adecuados para tratar con sistemas con varias entradas y varias salidas que se requiere que sean óptimos en algún sentido.
Concepto del método en el espacio de estado. Este método se basa en la descripción del sistema en términos de n ecuaciones en diferencias o diferenciales de primer orden, que pueden combinarse en una ecuación matricial en diferencias o diferencial de primer orden. La utilización de la notación matricial simplifica en gran medida la representación matemática de los sistemas de ecuaciones. El diseño del sistema mediante el uso del concepto de espacio de estado permite al ingeniero diseñar sistemas de control con respecto a índices de desempeño dados. Además, el diseño en el espacio de estado se puede realizar para toda una clase de entradas, en lugar de una función de entrada específica como la función impulso, la función escalón o la función senoidal. Asimismo, los 293
www.FreeLibros.me
294
Análisis en el espacio de estado
Capítulo 5
métodos en el espacio de estado permiten al ingeniero incluir condiciones iniciales dentro del dise ño. Ésta es una característica muy importante, que no tienen los métodos de diseño convencional. A continuación definiremos primero lo que es estado, variable de estado, vector de estado y espacio de estado, y luego presentaremos las ecuaciones en el espacio de estado.
Estado. El estado de un sistema dinámico es el conjunto más pequeño de variables (llama das variables de estado) tales que el conocimiento de dichas variables en t = t0, junto con el conoci miento de la entrada para t > t0, determinan por completo el comportamiento del sistema para cual quier tiempo / > t0. El concepto de estado de ninguna manera está limitado a sistemas físicos; tam bién se aplica en sistemas biológicos, sistemas económicos, sistemas sociales y otros. Variables de estado. Las variables de estado de un sistema dinámico son las que conforman el conjunto más pequeño de variables que determinan el estado del sistema dinámico. Si para descri bir en su totalidad el comportamiento de un sistema dinámico se requiere de por lo menos n variables x,,x2, . . . , x„ (de tal forma que una vez dada la entrada para t> t0y el estado inicial en t= t0, el estado futuro del sistema queda completamente determinado), entonces dichas n variables se consideran un conjunto de variables de estado. Observe que las variables de estado no necesitan ser cantidades físicamente medibles u obser vables. Aquellas variables que no representan cantidades físicas y aquellas que no se pueden medir ni observar, se pueden seleccionar como variables de estado. Esta libertad en la selección de varia bles de estado es una ventaja de los métodos en el espacio de estado. Sin embargo, en la práctica, lo conveniente es seleccionar cantidades fácilmente medibles como variables de estado, si esto fuera posible, ya que las leyes de control óptimo requerirán la retroalimentación de todas las variables de estado, con una adecuada ponderación. Vector de estado. Si se necesitan n variables de estado para describir completamente el com portamiento de un sistema dado, entonces estas n variables de estado se pueden considerar como los n componentes de un vector x. Dicho vector se conoce como vector de estado. Un vector de estado es, por tanto, un vector que determina en forma única el estado x(/) del sistema para cualquier tiempo t > t0, una vez dado el estado en / = t0y especificada la entrada u(/) para t > t0. Espacio de estado. El espacio de n dimensiones cuyos ejes coordenados están formados por el eje x¡, eje x2, .. . , eje x„ se conoce como espacio de estado. Cualquier estado puede representarse por un punto dentro del espacio de estado. Ecuaciones en el espacio de estado. En el análisis en el espacio de estado se tratará con tres tipos de variables que están involucradas en el modelado de sistemas dinámicos: las variables de entrada, las de salida y las de estado. Como se verá en la sección 5-2, la representación en el espacio de estado para un sistema dado no es única, con la excepción de que el número de variables de estado es el mismo para cualquiera de las distintas representaciones en el espacio de estado del mismo sistema. Para sistemas (lineales o no lineales) de tiempo discreto variantes en el tiempo, la ecuación de estado se puede escribir como x(k + 1 ) = f[x (& ), u(/c), /c] y la ecu ació n de sa lid a co m o
www.FreeLibros.me
Sección 5-1
295
Introducción
y(k) = g[x(fc), u(£), £] Para los sistemas lineales de tiempo discreto variantes en el tiempo, la ecuación de estado y la ecuación de salida se pueden simplificar a
x(k + 1) = G(k)x(k) + H(&)u(fc) y(k) = C (k)x(k) + D(k)u(k) donde
x{k) = vector n
(vector de estado)
y (k) - vector m
(vector de salida)
u (¿) = vector r
(vector de entrada)
G(k) = matriz n x n
(matriz de estado)
H (k) = matriz n x r
(matriz de entrada)
C(k) = matriz m y n
(matriz de salida)
D (k) = matriz m * r
(matriz de transmisión directa)
La presencia de la variable k en los argumentos de las matrices G(&), H(A), C(k) y D(/t) implica que estas matrices varían con el tiempo. Si la variable k no aparece en forma explícita en estas matrices, se supone que son invariables en el tiempo, es decir, constantes. Esto es, si el sistema es invariante en el tiempo, entonces las dos últimas ecuaciones se pueden simplificar a
x(k + 1) = Gx(k) + Hu(*)
(5-1)
y(k) = Cx(k) + Du(/t)
(5-2)
A l igual que en el caso del tiempo discreto, los sistemas de tiempo continuo (lineal o no lineal) se pueden representar mediante la siguiente ecuación de estado y la siguiente ecuación de salida:
x(í) = f[x (í),u (/),í] y(f) = g[x(í), n(f), t] Para sistemas lineales de tiempo continuo variantes en el tiempo, las ecuaciones de estado y de salida están dadas por
x(t) = A(f)x(í) + B(í)u(í) y(í) = C(f)x(f) + D(í)u(f) Si el sistema es invariante en el tiempo, entonces las dos últimas ecuaciones se simplifican a
x(f) = Ax(í) + Bu(í)
(5-3)
y (t) = Cx(í) + Du(f)
(5-4)
En la figura 5-la ) se muestra la representación en diagrama de bloques del sistema de control en tiempo discreto definido por las ecuaciones'(5-1) y (5-2), y la figura 5-16) muestra el sistema de control en tiempo continuo definido por las ecuaciones (5-3) y (5-4). Observe que las configuracio nes básicas de los sistemas en tiempo discreto y en tiempo continuo son las mismas.
www.FreeLibros.me
296
Análisis en el espacio de estado
Capítulo 5
(b) Figura 5-1 a) Diagrama de bloques de un sistema de control lineal en tiempo discreto invariante en el tiempo representado en el espacio de estado; b) diagrama de bloques de un sistema de control lineal en tiempo continuo invariante en el tiempo representado en el espacio de estado.
Observe que en este libro u(£) [o bien u(/)] denota tanto el vector de entrada a un sistema coi el vector de control (entrada de control a una planta). Por tanto, u(&) [o u(/)] se interpreta ya como el vector de entrada o como el vector de control, de acuerdo con las circunstancias.
Reseña del capitulo. La sección 5-1 presentó una introducción del método en el espacio estado y definió algunos términos básicos. La sección 5-2 se ocupa de varias representaciones en espacio de estado de sistemas lineales de tiempo discreto invariantes en el tiempo. La sección 5 primero obtiene la solución de la ecuación de estado lineal de tiempo discreto invariante en el tiempi mediante el procedimiento de recursión y el método de la transformada z. Posteriormente pre: un método para calcular (zl - G )"1, y concluye con un análisis para la solución de la ecuación estado lineal de tiempo discreto invariante en el tiempo. La sección 5-4 se ocupa de la matriz de función de transferencia pulso. La sección 5-5 en principio trata la discretización de las ecuación en el espacio de estado lineal de tiempo continuo y luego analiza la respuesta en tiempo entre
www.FreeLibros.me
¿n 5-2
Representaciones en el espacio de estado de sistemas en tiempo discreto
297
'gantes de muestreo consecutivos. La sección final, sección 5-6, presenta el análisis de estabilidad :r _ apunov. Empieza con la discusión de la función de Liapunov y las definiciones de estabilidad sistemas dinámicos. Asimismo, presenta el teorema principal de estabilidad de Liapunov, seguido ' sus aplicaciones al análisis de estabilidad de sistemas lineales de tiempo continuo y de tiempo : :_reto.
ESENTACIONES EN EL ESPACIO DE ESTADO SISTEMAS EN TIEMPO DISCRETO
Formas canónicas para ecuaciones en el espacio de estado en tiempo discreto. Existen t -.ras técnicas para obtener representaciones en el espacio de estado correspondientes a sistemas i" : empo discreto. Considere el sistema en tiempo discreto descrito por y ( k ) + axy ( k - 1 ) + a2y ( k - 2 ) + •■• + any ( k - n) = b0u (k ) + b xu{k - 1) + ••• + bnu ( k - n)
(5-5)
Zi--zt u(k) esla entrada c y{k) es la salida del sistema en el instante de muestreo k. Observe que i-±-~ os deloscoeficientes a,(i = 1 ,2 ,.. ., rí) y bj( j = 0, 1 ,2 ,...,« ) pueden ser cero. La ecuación se puede escribir en la forma de la función de transferencia pulso como
Y {z ) _ b0 + b xz~1 + ■■■ + bnz~n U(z) ~ 1 + a i z - 1 + ••• + anz~n
(5' 6)
Y ( z ) _ b0z n + b xz n 1 + ••• + bn U(z) z n + axz n~l + •■■ + an
( 5' 7)
Existen muchas formas de llevar a cabo representaciones en el espacio de estado para el siste ma r" tiempo discreto descrito por las ecuaciones (5-5), (5-6) o (5-7). Aquí se presentan las siguien-
! Forma canónica controlable 2. F orma canónica observable 5 Forma canónica diagonal 4 . Forma canónica de Jordán pF-:>- : que se refiere al significado de los términos controlable y observable, vea las secciones 6-2 f La forma canónica controlable se puede obtener con el método de programación directa. (Vea |f rr; riema A-5-1.) La forma canónica observable se puede obtener a partir del método de progra ma: : -. anidada. (Vea el problema A-5-2.) La forma canónica diagonal y la forma canónica de Jordán K roe jen obtener utilizando el método de expansión en fracciones parciales. (Vea los problemas A-
. a-5-4.) Forma canónica controlable La representación en el espacio de estado del sistema en tiemp t : sereto obtenida de las ecuaciones (5-5), (5-6) o (5-7) se puede expresar en la forma dada por las fc-ac t nes siguientes:
www.FreeLibros.me
298
Análisis en el espacio de estado
x¡ (k + 1 ) x 2(k + 1 )
0 0
1 0
• •
0 1
'
0 0
x n. f k + 1 ) _ x n{k + 1 ) _
‘ o"
* l(* )
x 2(k)
=
0
+ 0
0
0 1
. ~ an
1 ■
— fln -2
u (k )
Xn-l(k) . xÁ k ) .
- f l l _
(5-8*
0
_1 _
* i(* ) * 2(£ )
y ( k ) = |>„ - anb ¿b „-, - a„-!b0: •••:í>i ~ «í^o]
Capitule 5
+ b0u ( k )
(5-H
x n(k) Las ecuaciones (5-8) y (5-9) son las ecuaciones de estado y salida, respectivamente. La representa ción en el espacio de estado dada por las ecuaciones (5-8) y (5-9) se conoce comúnmente corra forma canónica controlable. [Para la deducción de las ecuaciones (5-8) y (5-9) vea el problema A5-1.] Observe que si se invierte el orden de las variables de estado, es decir, si se define nue\ variables de estado, de acuerdo con la forma
xfk) x 2(k)
=
Jn(k).
0 0
0
• • 0 • • 1
0
1
0
• • 0
0 _xn(k)
0
xfk) x 2(k)
1
entonces la ecuación de estado se puede escribir como sigue:
X\(k + 1 ) x 2(k + 1 ) x f k + 1)
-ai =
x„(k + 1 )_
1 0 0
~a2 ■ 0 ■• 1 0
••
0 0
0 0
1
0
’ l"
xfk) x 2(k) x 3(k)
~a„
fln-t
+
_ * A k ).
0 0 u( k)
(5-31
0_
La ecuación de salida se puede dar en la forma
y ( k ) = [bx - aibo'-.bj - a2b¿ •••\bn - anb0]
xfk) x 2(k)
(5-11
+ b0u (k )
Jn(k)_ Las ecuaciones (5-10) y (5-11) también están en la forma canónica controlable.
Forma canónica observable. La representación en el espacio de estado del sistema en tk po discreto dada por las ecuaciones (5-5), (5-6) o (5-7) se puede expresar en la forma siguiente: x¡ (k + 1 ) x2(k + 1 ) x„-t(k + 1 ) _ xn(k + 1 ) _
0 0
■■ 0
1
■ • 0
0 0
0 0
0 0
• • 1 • • 0
0 1
'o
—
1
b„ <*nb0 K - 1 ~ an-1 bo
x2(k) +
-a2
xn-i{k) . ~ ai . *n(k) .
www.FreeLibros.me
u(k)
b2 — a2bo bi — «i bo
(5-1
Sección 5-2
R epresentaciones en el espacio d e e s ta d o de sistem as d e tiem po discreto
299
Xi(k) x2(k) # ) = [0
0
0
1]
+ b0u ( k )
(5-13)
xn-i(k) .
X n (k )
-epresentación en el espacio de estado dada por las ecuaciones (5-12) y (5-13) se conoce como canónica observable. [Para la deducción de las ecuaciones (5-12) y (5-13), vea el problema -2 ] Observe que la matriz de estado de n x n de la ecuación de estado dada por la ecuación (5es la transpuesta de la matriz correspondiente de la ecuación de estado definida por la ecuación Observe que si se invierte el orden de las variables de estado, es decir, si se definen X ¡ (k)
x2(k)
=
0 0
0 0
• • 0 • • 1
r 0
X\(k) x2(k)
1
0
• • 0
0
.X n (k )
-ces la ecuación de estado y la ecuación de salida se convierten en: X\(k + 1) x2(k + 1) x„-i(k + 1) _ xn(k + 1) _
-a i ~a2
1 0
0 1
■• 0 • • 0
o'
—an-\ an
0 0
0 0
• • 0 • • 0
1 x„-i(k) 0 _ . Xn{k) .
0
Xi(k) x 2(k)
bi ~ axbü - a2b0 +
u(k)
(5-14)
-- 1
0 c
1
bn-i — an~i b0 bn
Xi{k) x2(k) y (* ) = [ i
o
o
0]
+ b0u(k)
(5-15)
xn - i(k) X n (k )
lí
ecuaciones (5-14) y (5-15) también están en la forma canónica observable.
Forma canónica diagonal. Si los polos de la función de transferencia pulso dados por las -iciones (5-5), (5-6) o (5-7) son todos distintos, entonces la representación en el espacio de estado r^ede expresar en la forma canónica diagonal como sigue: x x{k + 1 ) x2(k + 1 ) x„(k + 1 )_
Pi 0 • • 0 p2 • • = 0
0
0 ' Xi(k) 0 x2(k)
• • Pn.
.X n (k )_
www.FreeLibros.me
+
'l 1 1_
u(k)
(5 - 1 6 )
300
Análisis en el espacio de estado
y (Je) = [d
c2
xjk) x 2(k)
C,]
+ b0u(k)
Capítulo 5
(5-17)
x„(k)_ [Para las correspondientes deducciones de las ecuaciones (5-16) y (5-17), vea el problema A-5-3.]
Forma canónica de Jordán. Si la función de transferencia pulso dada por las ecuaciones (5-5), (5-6) o (5-7) incluye un polo múltiple del orden m en z = p x y todos los demás polos son distintos, entonces la ecuación de estado y la ecuación de salida se pueden expresar como sigue: ' x j k + 1) x 2(k + 1 )
x m(k + 1 ) x m+1(k + 1 ) _ x n(k -1- 1 )
y(k
=
...
o' o
...
o
Xm(k)
0 ••• 0 iPm+1
...
o
Xm+1(k)
0 ••• 0
••• pnm x„(k)
1 0 P}
0 • 1 •
0
0
0 ••• P l
0
0
_0
0
Vi
= [Cl
c2
0 1 0 0 ¡ 0
...
0
0 xjk) x 2(k)
Cn]
■xjk) ^ x2(k)
’o 0 1
+
u(k)
(5-18)
1
_1 _
+ b0u lk)
(5-19)
*n{k)_ [Las deducciones de las ecuaciones (5-18) y (5-19), aparecen en el problema A-5-4.] La matriz de estado de n x n está en la forma canónica de Jordán. (Para mayores detalles sobre las formas canóni cas de Jordán, vea el apéndice A.) Ejemplo 5-1 Considere el sistema siguiente: Y(z)
z+1
U(z)
z2 + 1.3z + 0.4
Las representaciones en el espacio de estado en las formas canónica controlable, canónica observable y canónica diagonal, se convierten en: FORM A CANO NICA C O N T R O LA BLE:
"o
1
1]
y(k) = [1
1
Xx(k)
U)
1
+ 1)
x2(k + 1 )
O
Xx ( k
_x2(k)
_1_
0 u(k) 1
xjk) x2(k)
FORM A CANO NICA O B SE R V A BL E!
1
1
O
o
x¡ (k + 1 ) x2(k + 1 )
1 -1.3
# ) = [0
Xx(k) x2(k)
1 u(k) 1
Xx(k)
1] x2(k)
FORM A CANÓ NICA DIAGO NAL!
La función de transferencia pulso Y(z)lU(z) obtenida se puede expandir como sigue!
www.FreeLibros.me
scción 5-2
Representaciones en el espacio de estado de sistemas de tiempo discreto
I(£) U(z )
5/3 2+ 0.5
301
-2/3 2 + 0.8
Y, por tanto. -0.5
0 1
OO O
o
X, (k + 1) xi(k + 1)
X\{k) x2(k)
1 u(k) 1
x, (k) xi(k)
y(k) =
No unicidad de las representaciones en el espacio de estado. Para un sistema con función e transferencia pulso dada, la representación en el espacio de estado no es única. Se ha demostrado _e existen diferentes representaciones en el espacio de estado para un sistema con función de ansferencia pulso. Las ecuaciones de estado, sin embargo, están relacionadas unas con otras me ante una transformación de similitud. Considere el sistema definido por x(k + 1) = Gx(A:) + Hu(£:)
(5-20)
y (k) = Cx(/c) + Du(fc)
(5-21)
define un nuevo vector de estado í ( k ) mediante
x(k) = Px(fc)
(5-22)
: nde P es una matriz no singular. [Observe que, en vista de que tanto \(k) como\ {k) son vectores e dimensión n, están relacionados uno con el otro mediante una matriznosingular.] Entonces, al sustituir la ecuación (5-22) en la ecuación (5-20) se obtiene
Px(& + 1) = GPx(it) + Hu(/t) -emultiplicando ambos lados de la ecuación (5-23) por P
(5-23)
da
x(k + 1) = P ' 1 GPx(&) + p-'HuOt)
(5-24)
-.''.niendo
P G P = G,
P H
= H
: ecuación (5-24) se puede escribir como sigue:
x(k + 1) = Gx(fc) + Hu(/c)
(5-25)
Y 'orma similar, si se sustituye la ecuación (5-22) en la ecuación (5-21), se obtiene
y (k) = CPx( k) + Du (k)
(5-26)
le'niendo
CP = C,
D = D
t ecuación (5-26) se puede escribir como
y (k) = Cx( k) + Du(fc)
(5-27)
de -a demostrado así que la representación en el espacio de estado dada por las ecuaciones (5-20) y
www.FreeLibros.me
302
Análisis en el espacio de estado
Capítulo 5
x(k + 1) = G x(k) + Hu(fc) y (k) = Cx(k) + Du(fc) es equivalente a la representación en el espacio de estado dada por las ecuaciones (5-25) y (5-27).
x(k + 1) = Gx(k) + Hu(ifc) y(k) = Cx(k) + Du(k) Los vectores de estado x(k) y x(k) están relacionados entre sí mediante la ecuación (5-22). Dado que la matriz P puede ser cualquier matriz no singular de n * n, para un sistema dado existe una cantidad infinita de representaciones en el espacio de estado. En algunas aplicaciones se podría desear diagonalizar la matriz de estado G. Esto se puede llevar a cabo si se selecciona en forma adecuada una matriz P, de forma que P 'G P = matriz diagonal En el caso donde la diagonalización no sea posible, P G P puede transformarse a la forma canónica de Jordán: P G P = J = forma canónica de Jordán Refiérase al apéndice A para métodos de transformación de la matriz G a una matriz diagonal o a matriz en la forma canónica de Jordán. [Observe que si se utiliza el método de programación expansión en fracciones parciales, la matriz de estado se convierte en diagonal si todos los po involucrados son distintos, y se convierte en una forma canónica de Jordán si en Y(z)/(J(z) involucrados polos múltiples.]
5-3 SOLUCIÓ N DE LA S ECUACIONES DE ESTADO EN TIEMPO DISCRETO En esta sección, primero se presenta la solución de la ecuación lineal de estado en tiempo disc invariante en el tiempo
x(k + 1) = Gx(k) + Hu(/t) mediante un procedimiento de recursión y, posteriormente, a través del método de la transform Luego se analizan los métodos para calcular (zl - G )'1. Por último, se resuelve la ecuación de lineal en tiempo discreto y variante en el tiempo
x(k + 1) = G(k)x(k) + H(k)u(k) Solución de la ecuación de estado lineal en tiempo discreto e invariante en el tiempo. general, las ecuaciones de tiempo discreto son más fáciles de resolver quelas ecuaciones difei les, porque las primeras pueden resolverse simplemente medianteun procedimientode rec Éste es bastante sencillo y conveniente para cálculos digitales. Considere las siguientes ecuación de estado y ecuación de salida:
x(k + 1) = Gx(&) + Hu(A:) y (k ) = C x(k ) + Du(/c)
www.FreeLibros.me
(:
c ón 5-3
Solución de los ecuaciones de estado en tiempo discreto
303
solución de la ecuación (5-28) para cualquier entero positivo k se puede obtener directamente por •íjursión, como sigue:
x (l) = Gx(0) + Hu(0) x(2) = G x(l) + H u(l) = G2x(0) + GHu(O) + H u(l) x(3) = Gx(2) + Hu(2) = G3 x(0) + G2Hu(0) + GH u(l) + Hu(2)
'•’rdiante la repetición de este procedimiento, se obtiene *-i
x(*) = G*x(0) + 2 Gk-'-l n u( j) ,
k = 1 ,2 ,3 ,...
y=0
(5-30)
: iramente, x(k) está formado de dos partes, una que representa la contribución del estado inicial x(0) y - ::ra. la contribución de la entrada u(y'), dondey = 0, 1,2, 1. La salida y(k) está dada por *-i y (k) = CGk x(0) + C 2 G* - ' - 1 Hu(y) + Du(A:) (5-31) ;=0
Matriz (le transición de estado.
Observe que es posible escribir la solución de la ecuación de
: :sdo homogénea
x(k + 1) = Gx(k)
(5-32)
x(k) = V(k)x( 0)
(5-33)
r- a forma
:: "de 'J'(A ) es una matriz única de « * « que satisface la condición
V ( k + 1) = G V ( k ),
'I'(O ) = I
(5-34)
E : ;¡aro que ^ ( k ) puede estar dada por ¥ ( * ) = G*
(5-35)
le la ecuación (5-33), se puede ver que la solución (5-32) es simplemente una transformación del :adoinicial. Porlo tanto, la matriz única '¡'(A ) se llama matriz de transición de estado. También se _ " ,xe como matriz fundamental. La matriz de transición de estado contiene toda la información ?:e los movimientos libres del sistema definidos por la ecuación (5-32). En términos de la matriz de transición de estado ^(A ), la ecuación (5-30) se puede escribir en _ rórma
r
fc-i
x(k) = W(k)x(0) + X V ( k - j - l)H u(y) M
(5-36)
= ¥ (* )x (0 ) + 2 V (/)H u (* - / - 1)
(5-37)
k-1
M - -ustituir la ecuación (5-36) o la (5-37) en la ecuación (5-31), se puede obtener la siguiente ecuación x >alida:
www.FreeLibros.me
304
Anál ¡sis en el espacio de estado
Capí*
*-i
y( k) = C V ( k ) x ( 0 ) + C 2 V (k - j - l)H u (/) + Du(jfe) /=U
k-1
= C T (¿ )x (0 ) + C 2 ¥ (j)H u (k - / - ! ) ;=0
+ D u (it)
(í
Método de la transformada z a l a solución de las ecuaciones de estado en tiempo discreto. continuación se presenta la solución de una ecuación de estado en tiempo discreto mediante el m do de la transformada z. Considere el sistema en tiempo discreto descrito por la ecuación (5-28
x ( k + 1) = Gx(k) + H u(& )
(5
Si se toma la transformada z de ambos lados de la ecuación (5-40) se obtiene
z X ( z ) - z x ( 0) = G X (z ) + H U (z ) donde X(z) = 2"[x(A)] y U(z) = F [u (¿ )]. Entonces (z l - G )X (z ) = zx(0) + H U (z ) Premultiplicando ambos lados de esta última ecuación por (zl - G )'1, se obtiene X (z ) = (z l - G ) 'I zx(0) + (z l - G ) -1 H U (z )
(5
A l tomar la transformada inversa z en ambos lados de la ecuación (5-41), da x (* ) = r ~ 1[(z l - G )_ 1 z]x(0) + Z ~ x[(z\ - G )- 1 H U (z )]
<5
A l comparar la ecuación (5-30) con la ecuación (5-42), obtenemos G* = 2 '-1[(z I - G ) -1 z] y k - l
S G ^ - ' H u U ) = Z ~ l[{zl - G )- 'H U (z )] donde k = 1, 2, 3 ,... . Observe que la solución del método de la transformada z involucra el proceso de invertir la (zl - G ), lo que puede realizarse mediante métodos analíticos o utilizando una rutina de comprn La solución también requiere de las transformadas inversas z de (zl - G )-1 z y (zl - G )-1 H U (r¡ Ejemplo 5-2 Obtenga la matriz de transición de estado del siguiente sistema en tiempo discreto:
x(k + 1) = Gx(fc) + H u(k) y(k) = Cx(k) donde G =
0
-0.16
1 -1
H =
C = [1
0]
Posteriormente obtenga el estado x(k) y la salida y(k) cuando la entrada u(k) = 1 para k = 0, 1.2. Suponga que el estado inicial está dado por x(0) =
x,(0)
x2(0)
www.FreeLibros.me
1 -1
Sección 5-3
Solución de las ecuaciones de estado en tiempo discreto
305
De las ecuaciones (5-35) y (5-43), la matriz de transición de estado ^ ( k) es
9 ( k ) = G* = 2 "'[(z l - G )- 'z ] Por tanto, primero se obtiene (zl - G ) '1: (z I - G )-1 =
z -1 0.16 z + 1 z + 1______ (z + 0 .2)(z + 0 .8)
1 _________________ (z + 0 .2 )(z + 0 .8)
-0.16 _(z + 0.2)(z + 0.8)
z________ (z + 0 .2)(z + 0.8).
—i
5
—i
z + 0.8
z + 0.2
z + 0.8
i
z + 0.2 _ 0 .S 3
+
0 .8 _l_________ 3
_z + 0.2
_ 1 3
z + 0.8
4 3
,
z + 0.2
z + 0.8
La matriz de transición de estado '?(&) se obtiene ahora como sigue: 1 =
2" '
3 z + 0.2 0.8
3 z + 0.2
3 z + 0.8 +
3 z + 0.2
0.8 3 z + 0.8
3 z + 0.2
3 z + 0.8 +
3 z + 0.8.
_ Q \k 5 ( 0.2 ) * f5 /(- C\ 0 .8 )
i(- 0 .2 )‘ - i(- 0 .8 )*
(5-45) -24>(-0.2)‘ + 2jS(-0.8)'t
-i(- 0 .2 )* + K-0.8)*
La ecuación (5-45) da la matriz de transición de estado. Ahora, se calcula \{k). La transformada z de \(k) está dada por Z[x(fc)] = X (z) = (z l - G )-‘ zx(0) + (z l - G )-‘ H Í/(z) = (z l - G)-'[zx(0) + H U (z)] Dado que
U(z) = se obtiene zx(0) + H U(z) =
l - z-1
z- 1
z z - 1
r
z z - 1
z2 z - 1 -z 2 + 2z z - 1
Por tanto X (z) = (z l - G ) '’[zx(0) + Ht/(z)]
{z2 + 2)z (z + 0 .2 )(z + 0 .8)(z - 1 ) (- z 2 + 1.84z)z L(z + 0.2)(z + 0.8)(z - 1 )J
www.FreeLibros.me
]
306
Análisis en el espacio de estado
— 12 r
_L_
6 ^
,
2 + 0.2 6
*
22 7 9
,
9
. 2 + 0 .2
,
2 + 0.8 A
2 + 0.8
Capítulo
25 7 18
2 -1 18
2 — 1.
Por tanto, e! vector de estado x(¿) está dado por - £ (- 0 .2 )* + f(- 0 .8 )* + f§ x(*) = 2 '-,[X(z)] =
¥ (- 0.2)‘ - iiá (- 0 .8 )* + i
Finalmente, la saliday(k) se obtiene como sigue: - T Í - 0 -2 )
y(k) = C x(k) = [[11 0 0]]
+ f
(-0.8)*
+ ff
¥ (- 0 .2 )* - ^ ( —0.8)* + ^
-£ (-0.2)* + ?(- 0 .8 )* + ?l
Cálculo de (zl - G ) La solución de la ecuación de estado dada por la ecuación (5-28 mediante el método de la transformada z requiere del cálculo de (z I- G )_l. E l cálculo de (zl -G)~ por lo general, una tarea que toma mucho tiempo, excepto en casos simples. Existen métodos t analíticos como de cómputo para el cálculo de (zl - G )_l. Aquí se presenta uno. Método para calcular (zl - G)~\ Este método está basado en la expansión de la adjunta (zl - G ). La inversa de (zl - G ) se puede escribir en términos de la adjunta de (zl - G ), como sis
Observe que en el determinante |zl - G¡ se puede escribir como sigue: |zl - G| = z" + a iz n_1 + a2z n~2 + • • ■ + an
(5-4
Se puede demostrar (vea el problema A-5-13), que adj(zl - G ) se puede obtener mediante adj (z l - G ) = I z n~' + Hj z" - 2 + H 2 z" ' 3 + ••• + H„_! donde H, = G + a j
H 2 = G H j + a21
H„ i — GHn 2 + an-i I H„ = GH„_! + fl.I = 0 Observe que a,, a2, . . ., an son los coeficientes que aparecen en el determinante dado por ecuación (5-47). Las a, también se pueden obtener (vea el problema A-5-13) mediante el empleo la traza, como sigue:
www.FreeLibros.me
Sección 5-3
307
Solución de las ecuaciones de estado en tiempo discreto
«i = - tr G a2 = — 5 t r G H i (5-50)
- 3 trG H 2
a„ — —— tr GH„_! (La traza de una matriz de n x n es la suma de sus elementos diagonales.) Para un determinante de orden superior (n > 3), la expansión del determinante |zl - G| en la forma dada por la ecuación (5-47) puede ocupar mucho tiempo, en este caso, resulta útil emplear la ecuación (5-50) para calcular las a„ ya que a u H „ a2, H 2, . . . , a„_ „ H „ _ , se pueden calcular fácilmente de manera secuencial. A l sustituir la ecuación (5-49) en la ecuación (5-48) y sustituyendo la ecuación resultante en la ecuación (5-46), se obtiene la inversa de (zl - G ). Este método es conveniente para soluciones en computadora; ya existe un programa estándar. Ejemplo 5-3 Determine la inversa de la matriz (zl - G), donde 0.1
0.1
G = 0.3
- 0.1
0
- 0.2 -0.3
0
0
También obtenga G*. De las ecuaciones (5-46), se tiene (z l - G ) - 1 =
adj (z l - G ) 1*1 - G|
A pesar de que el determinante |zl - G| se puede expandir fácilmente, utilizaremos aquí, para efectos de demostración, la ecuación (5-50) para el cálculo de a,, a2y ay Primero observe que 0.1
0.1
«i = - trG = -tr 0.3
- 0.1
0
0
- 0.2 0.3
0
= 0.3
Entonces, de la ecuación (5-49), se obtiene 0.1
0.1
H] = G + flil = 0.3
- 0.1 0
0
0.4 0.3
0.1 0 0.2 -0.2
0
0
trG H i = - j tr
0.1
0.1
0.3
- 0.1
0
=_i
tr
0
0
0
0.3 0 0 0.3
0
Por tanto «2 =
0.3 • 0
0
- 0.2 -0.3
0.07 0.03 0.09 0.01 0 0
-0.02 0.02 0
0
0
- 0.2 -0.3
= - 0 .0 4
www.FreeLibros.me
0.4 0.1 0.3 0.2 0
0
0
- 0.2 0
308
Análisis en el espacio de estado
Capítulo!
Si se sustituye la matriz H, y el valor de a2 que se acaba de obtener en la ecuación (5-49) se obtiene
0.03 H 2 = GH, + a2l = 0.09 0
0.03 -0.02" -0.03 0.02 0 -0.04
y
0.012
0 0.012 0
a3 = —4 trG H 2 = —i tr 0 0
0 0 0.012
=
-
0.012
Observe que H 3 = GH 2 - 0.0121 = 0 La adjunta de (zl - G) se puede dar ahora mediante la ecuación (5-48), es decir adj (z l - G ) = Iz 2 + H ,z + H 2 1 0 0
0 1 0
0 0.4 0 z2 + 0.3 1 0
0 0.03 - 0.2 z + 0.09
0.1 0.2 0
0
0
z2 + 0.4z + 0.03 0.3z + 0.09
O.lz + 0.03 z2 + 0.2z - 0.03
0
0
-
0.03 -0.03
- 0.02 0.02
-0.04
0 0.02
-0.2z + 0.02 z2 - 0.04
También, |zl - G| = z3 + a\ z2 + a2z + ü3 = z3 + 0.3z2 - 0.04z - 0.012 = (z + 0.2)(z - 0.2)(z +0.3) Por tanto, (z l - G)
adj (z l - G)
¡zl ~ G| z + 0.1 (z + 0.2)(z - 0.2)
(z + 0.2)(z - 0.2)
- 0.02 (z + 0.2)(z - 0.2)(z + 0.3)
(z + 0.2)(z - 0.2)
z - 0.1 (z + 0.2)(z - 0.2)
- 0 .2 (z - 0.1 ) (z + 0.2)(z - 0.2)(z + 0.3)
0
0
0.3
0.1
1
z + 0.3
Esta última ecuación da la inversa de (zl - G). A continuación, se obtendrá G*. De la ecuación (5-43), se tiene G* = 2'~1[(z l - G ) ” 1 z]
= Z~
0.25z z+ 0.2
0.75z z - 0.2
0.25z z+ 0.2
0.25z z - 0.2
0.75z z+ 0.2
0.75z z - 0.2
0.75z z + 0.2
0.25z z - 0.2
0
0
www.FreeLibros.me
0.5z z + 0.2 1.5z z+ 0.2
O.lz z - 0.2
0.4z z + 0.3
O.lz 1.6z +• z - 0.2 z + 0.3
z z + 0.3
- 5-3
309
Solución de las ecuaciones de estado en tiempo discreto
0.25(—0.2)* + 0.75(0.2)* —0.75(-0.2)* + 0.75(0.2)*
-0.25(-0.2)‘ + 0.25(0.2)* 0.75(-0.2)* + 0.25(0.2)*
0
0
0.5(-0.2)* - 0.1(0.2)* - 0.4(—0.3)* -1.5(-0.2)* - 0.1(0.2)* + 1.6(-0.3)* (-0.3)*
(5-51)
Solución de las ecuaciones de estado lineales en tiempo discreto y variantes en el tiempo. dere la siguiente ecuación de estado lineal en tiempo discreto y variante en el tiempo junto con -respondiente ecuación de salida: x(k + 1) = G(k)x(k) + H(k)u(k)
(5 _5 2 )
y(k) = C (k)x(k) + D(£)u(fc)
(5 . 5 3 )
-cion de la ecuación (5-52) se puede encontrar fácilmente mediante recursión, como sigue: x(h + 1) = G(h)x(h) + H(h)u(h) x(h + 2 ) = G(h + l)x(h + 1) + H (h + l)u(/t + 1) = G(h + 1)G (h)x(h) + G(h + \)B(h)u(h) + H (h + l)u(/i + 1)
_a matrizde transición de estado (matriz fundamental) para el sistema definido por la ecuación se define como¥ ( k, h). Se trata de una matriz única, que satisface las condiciones V ( k + í ,h ) = G(k)V(k,h),
V(h,h) = l
< = h. h + 1, h + 2 , . . . Se puede ver que la matriz de transición de estado rP(£, h) está dada por n V ( k , h ) = G (k - 1)G (k - 2) • • • G(h),
k>h
(5-54)
rjdo 'P(¿, h), la solución de la ecuación (5-52) se convierte en *-1
x(k) = ^ ( k , h ) x { h ) + 2 ¥ ( k , j + l)H (/)u (;),
k > h
(5-55)
*e que el primer término segundo miembro de la ecuación (5-55) es la contribución del esta\(h) al estado actual x(k), y que el segundo término es la contribución de la entrada u(/?), ...,u (* - l) .
fácil verificar la ecuación (5-55). En referencia a la ecuación (5-54), se tiene V ( k + l , h ) = G(k)G(k - 1) • • • G(h) = G ( k ) V { k , h ) s-srmye la ecuación (5-56) en k
x(fc + 1) = V ( k + l , h ) x{ h ) + S W(k + 1 +
l)H (;)u (;)
x(k + 1) = G ( k ) V ( k , h ) x ( h ) + 2 * ( k + 1,7 + l)H (;)u(y) j=h
+ V ( k + l , k + l)H(k)u(k)
www.FreeLibros.me
(5-56)
310
Análisis en el espacio de estado
Capitule
5
k -1
= G (k) V ( k , h ) x ( h ) + 2 9 ( k , j + l)H (/ )u (;) L ;=* = G (k)x(k) + H (* )u (* ) Por tanto, se ha demostrado que la ecuación (5-55) es la solución de la ecuación (5-52). Una vez obtenida la solución de x(k), la ecuación de salida, ecuación (5-53), se convierte en; k-l
y (* ) = C ( k ) V ( k , h ) x ( h ) + 2 C ( k ) V ( k , j + l)H (/ )u (/ ) + D (* )u (* ),
k > h
i=h
Si G (k) es no singular para todos los valores de k considerados, de forma que la inversa de h) exista, entonces la inversa de ^(A, h), denotada como ty{h, k), está dada como sigue;
^ ~ \k ,h ) = V (h,k) = [G (* - 1 )G (* - 2) ---G(/z)] 1 = G ^ ( h ) G - \ h + 1) •••G ‘(A: - 1)
Resumen sobre ^ ( k , h).
Un resumen de la matriz de transición de estado ^( k ,
(5-5"i t i)
da lo
siguiente; 1. ¥ (*, k) = I 2. SF(k, h) = G(k - 1)G (k - 2) ■■•G(h), 3. Si la inversa de ^ ( k , ti) existe, entonces
k> h
V ~ \k ,h ) = V (h,k) 4.
Si G(k) es no singular para todos los valores de k considerados, entonces
'i'ík, i) = yl'(k, jf'V'ij, i),
para cualquier i,j, k
Si G(k) es singular para cualquiera de los valores de k, entonces
^( k, i) = 'V{k, jj'Vij, i),
para k > j > i
5-4 MATRIZ DE FUNCIÓN DE TRANSFERENCIA PULSO Un sistema en tiempo discreto de una entrada y una salida se puede representar o modelar mediante una función de transferencia pulso. La extensión del concepto de la función de transferencia pulso a un sistema en tiempo discreto de varias entradas y varias salidas da la matriz de función de transfe rencia pulso. En esta sección se estudiará la relación entre la representación en el espacio estado y la representación mediante la matriz de función de transferencia pulso.
Matriz de función de transferencia pulso. La representación en el espacio de estado de un sistema lineal en tiempo discreto e invariante en el tiempo de orden «, con r entradas y m salidas, se puede dar mediante x(k + 1) = G x( k) + H u(& )
(5-58)
y( k) = C x( k) + Du(&)
(5-59)
www.FreeLibros.me
■ 5-4
Matriz de función de transferencia pulso
\f k) es un vector-«, u(L) es un vector-r y y(k) es un vector-m, G es una matriz de n x n, H es etriz de « x r, C es una matriz de m x n y D es una matriz de m x r. A l tomar las transformadas 15 ecuaciones (5-58) y (5-59), se obtiene z X (z ) - zx(0) = G X (z ) + H U (z ) Y (z ) = C X (z ) + D U (z ) ■•e que la definición de función de transferencia pulso exige la suposición de condiciones es cero, aquí también suponemos que el estado inicial x(0) es cero. Entonces se obtiene X (z ) = (z l - G )- ’ H U (z )
Y (z ) = [C (z l - G ) ' 1 H + D ]U (z ) = F (z )U (z )
F (z ) = C (z l - G ) ‘ H + D
(5-60)
•e conoce como matriz de función de transferencia pulso. Se trata de una matriz de m x r. La ■ce función de transferencia pulso F(z) caracteriza la dinámica de entrada/salida del sistema de : discreto dado. En vista de que la inversa de la matriz (zl - G ) se puede escribir en la forma
~ z de función de transferencia pulso F(z) se puede dar mediante la ecuación w
.
C adj (z l - G )H
F(z) °
¿ I - Gí
„
•+ P
*: que los polos de F(z) son los ceros de \zl - G| = 0. Esto significa que la ecuación caracterís; sistema en tiempo discreto está dada por
\zl - G| = 0 z n + di z"
+ a2z"
+■■• + an-i z + an = 0
: s coeficientes a, dependen de los elementos de G.
Transformación de similitud.
Se ha demostrado que para el sistema definido por
\ ( k + 1) = G \ ( k ) + Hu(/c) y( k) = Cx(k) + D u (^ ) z de función de transferencia pulso es F (z ) = C (z l - G ) 1! ! + D sección 5-2 se mostró que varias representaciones en el espacio de estado distintas para un i cedo están interrelacionadas por una transformación de similitud. A l definir un nuevo vector \ -. ) utilizando una matriz de transformación de similitud P, es decir
www.FreeLibros.me
312
Análisis en el espacio de estado
Capítulo 5
x(fc) = Px(k) donde P es una matriz no singular de n * n, se tiene
x(k + 1) = Gx(k) + Hu (k)
(5-61)
y (k) = C x(k) + D u(& )
(5-62)
donde G, H , C, D y G , H , C , D , están relacionadas, respectivamente, mediante P _1G P = G P ‘H = H CP = C D = D La matriz de función de transferencia pulso F (z) para el sistema definido por las ecuaciones (5-61 i y (5-62) es F (z ) = C (z l - G )_1H + D Observe que las matrices de función de transferencia pulso F(z) y F (z) son iguales, en vista de que F (z ) = C (z l - G )_1H + D = C P (z I - P 'G P ) 'P ^ H + D = C P (z P - G P ) 'H + D = C (z P P _1 - G P P -1) _1H + D = C (z l - G )- ‘ H + D = F (z ) Por tanto, la matriz de función de transferencia pulso es invariante bajo una transformación de simi litud. Es decir, no depende del vector estado determinado x(k) seleccionado para la representado del sistema. La ecuación característica |zl - G| = 0 también es invariante bajo una transformación de si1 litud, ya que |zl - G| = |P_1||zI - G||P| = ¡zl - P- ‘ GP| = |zl - G| Por tanto, los valores característicos de G son invariantes bajo una transformación de similitud.
5-5 DISCRETIZACIÓN DE LA S ECUACIONES EN EL ESPACIO
DE ESTADO EN TIEMPO CONTINUO En el control digital de plantas en tiempo continuo es necesario convertir ecuaciones en el espacio t estado en tiempo continuo, en ecuaciones en el espacio de estado en tiempo discreto. Se pu realizar dicha conversión si se introducen en los sistemas en tiempo continuo muestreadores y i positivos de retención ficticios. E l error introducido por la discretización se puede hacer despre utilizando un período de muestreo suficientemente pequeño en comparación con la constante. tiempo más significativa del sistema.
Repaso de la solución de las ecuaciones de estado en tiempo continuo. la matriz exponencial eAl. La matriz exponencial se define como »A' = I + A i + — 1 A—2r 2 + • • • +■ 2!
U
k\
www.FreeLibros.me
= Í
A *'*
*=0 k !
Primero se revis
' 5-5
313
Discretización de las ecuaciones en el espacio de estado en tiempo continuo
Debido a que la serie finita :r¡o para dar
^ converge, la serie se puede diferenciar término por
A kt k-i — eA¡ = A + A 2í + ■+ dt 2! T
*
+
7TT + ( k - 1 )!
A 2í 2
A * ' 1 i * "1
2!
(k - 1 )!
= A I + A í + —r r - + • •• + I + Ai +
A 2í 2
2!
+
+
= AeAr
A = eA‘A
(k - 1 )!
La matriz exponencial tiene la propiedad de que
eM¡+j) = gA' eAí se puede probar como sigue: „A r„A s
e""
=
A*i‘V ¿ A V ,
S
k-0 k\ J\k=0
k=0
(i + s )k _ k
i 'r
2a<
,=0i'.(k ~ O i -A(t+s)
-nicular, si s = -i, entonces
eA!e Aí = e A‘eAt santo, la inversa de eAI es e Al. Dado que siempre existe la inversa de eAl, eAI es no singular. Es importante apuntar que e(A+B), = eA
si A B = B A
e(A+B)' 4 eA,e*‘,
s iA B = ¿ B A
A continuación se obtendrá la solución de la ecuación de estado en tiempo continuo x = Ax + Bu
(5-63)
x es el vector de estado (vector n), u es el vector de entrada (vector r), A es una matriz ~.ante de n x n, y B es una matriz constante de n x r. Sí la ecuación (5-63) se escribe en la forma x (í) - A x (í) = B u (í) remultiplicamos ambos lados de esta última ecuación por e A', obtenemos
e A'[x(í) - Ax(í)] = — [e A'x(í)] = e A'B u (í) ".egrar la ecuación anterior entre 0 y t, da
e~A,x(t) = x(0) + í e _ArBu(T)íÍT
x(f) = eA'x(0) + í eA(' t)B u (t)¿ t Jn
www.FreeLibros.me
(5-64)
314
Análisis en el espacio de estado
Capítulo
5
La ecuación (5-64) es la solución de la ecuación (5-63). Observe que la solución de la ecuación de estado que comienza en el estado inicial x(/0) es x(f) = eA('~'o) x(í0) + f eA('~T)B u (t ) d r
(5-65»
<0 Discretízación de las ecuaciones en el espacio de estado en tiempo continuo.
Ahora se presentará un procedimiento para la discretización de ecuaciones en el espacio de estado en tiempo continuo. Se supone que el vector de entrada u(r) cambia sólo en instantes de muestreo uniforme mente espaciados. Observe que la operación de muestreo aquí es ficticia. Se deducirá una ecuación de estado en tiempo discreto y una ecuación de salida que den como resultado los valores exactos en t = kT, donde ¿ = 0 ,1 ,2 ,... Considere la ecuación de estado en tiempo continuo y la ecuación de salida x = Ax + Bu
(5-66i
y = Cx + Du
(5-67 i
En el siguiente análisis, con el objeto de simplificar la presentación, se utilizará la notación k T y ( k ~ 1)T en vez de k y k + 1. La representación en tiempo discreto de la ecuación (5-66) tomará la forma
x((k + 1 )7 ) = G (T )x ( kT ) + H ( T ) u ( k T )
(5-68)
Observe que las matrices G y H dependen del período de muestreo T. Una vez fijo el período de muestreo T, G y H son matrices constantes. Para determinar G (7 ) y H (7), se utiliza la ecuación (5-64), solución de la ecuación (5-66). Se supone que la entrada u(í) es muestreada y alimentada a un retenedor de orden cero, de forma que todos los componentes de u (í) sean constantes en el intervalo entre dos instantes de muestreo conse cutivos cualesquiera, es decir u(r) = u(¿7),
para k T < t < k T + T
(5-69)
En vista de que f(k + l)T
x ((¿ + 1)7) = eA(t+1,r x(0) -I- eA(i+1)T
Jo
e AtB u (t)í/ t
(5-70)
y r kT
x( k T) = eAkrx(0) + eAkT
Jo
e~ArB u (r)d T
(5-71)
al multiplicar la ecuación (5-71) por eAl y sustraerla de la ecuación (5-70) nos da r(*+i)r x ((k + 1 )7 ) = eATx ( kT ) + eA(k+1)T
e AtB u (r )d r
J kT
Dado que la ecuación (5-69) u(í) = u(¿7) para kT < t < kT + 7, se puede sustituir u (r) = ti(kT) = constante en esta última ecuación. [Observe que u(r) puede tomar un valor en t = kT + 7 es decir, u{kT + T), que puede ser distinto de u{kT). Este valor en u (r) con r = kT+T, que es el límite superior de la integración, no afecta el valor de la integral en esta última ecuación, ya que el integrando no incluye funciones impulso.] Por lo tanto podemos escribir
www.FreeLibros.me
5-5
Discretización de las ecuaciones en el espacio de estado en tiempo continuo
315
x((k + 1)7) = eATx(kT) + eAT T e~A,Bu(kT)dt = eATx(kT) + f eAÁBu(kT)dÁ
(5-72)
G(T) = eAT
(5-73)
H (T) = ( [ r eA*dÁ)B
(5-74)
A = T - 1 . Si se definen
es la ecuación (5-72) se convierte en
x((k + 1)T) = G(T)x(kT) + U(T)u(kT)
(5-75)
la ecuación (5-68). Entonces, las ecuaciones (5-73) y (5-74) dan las matrices deseadas G(T) Note que G (7 ) y H (7 ) dependen del período de muestreo T. Con referencia a la ecuación (5ecuación de salida se convierte en
y (kT) = Cx(kT) + Du (kT)
(5-76)
las matrices C y D son matrices constantes y no dependen del período de muestreo T. Si la matriz A es no singular, entonces H (7 ) dada por la ecuación (5-74) se puede simplificar
o
Comentarios En el enfoque del espacio de estado, observe que al suponer el vector de entrada u(/) constante dos instantes de muestreo consecutivos cualesquiera, la representación en tiempo discre:: se puede obtener simplemente integrando la ecuación de estado en tiempo continuo sobre período de muestreo. La ecuación de estado en tiempo discreto dada por la ecuación (5-68) se conoce como equivalente con retenedor de orden cero de la ecuación de estado en tiempo ;:ntinuo dada por la ecuación (5-66). En general, para convertir la ecuación de un sistema en tiempo continuo en una ecuación de un 5 ;:ema en tiempo discreto, es necesario algún tipo de aproximación. Es importante apuntar c _e la ecuación (5-75) no incluye ninguna aproximación, siempre que el vector de entrada u(t) sea constante entre dos instantes de muestreo consecutivos cualesquiera, tal y como se supuso e- la deducción. I ? serve que para T « 1, G (7 ) e- G (0) = eA0 = I. Por tanto, conforme el período de muestreo T se nace muy pequeño, G (7 ) se aproxima a la matriz de identidad. e '.r r e
5-4 : -ü d ere el sistema en tiempo continuo dado por
,
Y(s)
1
www.FreeLibros.me
316
Análisis en el espacio de estado
Capitulo
5
Obtenga la representación en el espacio de estado en tiempo continuo de este sistema. Luego discretice te ecuación de estado y la ecuación de salida y obtenga la representación en el espacio de estado en tiemp* discreto del sistema. También obtenga la función de transferencia pulso del sistema mediante el empico de la ecuación (5-60). La representación en el espacio de estado en tiempo continuo del sistema es simplemente
x = -a x + u y =x Ahora se discretiza la ecuación de estado y la ecuación de salida. Con referencia a las ecuaciones (5-731 y (5-74), se tiene
G(T) = e-°7 1- e
'¿A
H(T) = f e Jo
Por tanto, la versión discretizada de las ecuaciones de este sistema es
x(k + 1) = e aTx(k) H
1 - e~aT
u(k)
y(k) = x(k) Con referencia a la ecuación (5-60), la función de transferencia pulso para este sistema es
F(z) = C(zl - G)~7H (1 - e~aT)z~'
r)
a( 1
rz~')
Este resultado concuerda con la transformada z de G(s) cuando está precedida por un muestreador y un retenedor de orden cero [es decir, en donde la señal u(t) se muestrea y alimenta a un retenedor de orden cero antes de que sea aplicada a G(s)]:
G(z)=Z
1
1
1
s
s +a
= (1 - z " ) Z
s(s + a)
(1 ~ e - T)z~' a( 1 - e~aTz~7) Ejemplo 5-5 Obtenga las ecuaciones de estado y de salida en tiempo discreto y la función de transferencia pulso (cuando el período de muestreo T= 1) del sistema en tiempo continuo siguiente:
G(s)
Y (j)
1
U(s)
s(s + 2)
mismo que se puede representar en el espacio de estado mediante las ecuaciones
¿1 _ X 2_
0 0 [1
l" X i + - 2 *2
o" 1
0]
La ecuación de estado en tiempo discreto deseada tendrá la forma x((* + l ) r ) = G(T)x(kT) + H(T)u(kT)
www.FreeLibros.me
Sección 5-5
317
Discretización de las ecuaciones en el espacio de estado en tiempo continuo
donde las matrices G(7) y H(7) se obtienen a partir de las ecuaciones (5-73) y (5-74) como sigue: 1 |( 1 - e ' 2r) j
G(T) = eA
dt
2\
2 i ( l - e~2T)
Por tanto,
1 | ( 1 - e~20 0 e _2T
+ 1)71 x2((k + 1)T)
- 1
~x,{kT) x2(kT)
2V
2
u(kT)
i ( l - e - 2T)
La ecuación de salida se convierte en
y(kT) = [1 0]
r x¡(kT) x2(kT)
Cuando el período de muestreo es de 1segundo, es decir, T= 1, la ecuación de estado en tiempo discreto y la ecuación de salida se convierten, respectivamente, en
x¡(k + 1 ) x2{k + 1 )
"1 0.4323’ *i(*) 0 0.1353 x2(k)
y(k) - [i
0.2838 u(k) 0.4323
Xi(k)
o] x2{k)
La representación en la función de transferencia pulso de este sistema se puede obtener a partir de la ecuación (5-60), como sigue:
F(z) = C(zl - G )-‘H + D =
[1 0]
= [1
=
0]
-1
- 1 0
-0.4323 ’ z - 0.1353
1 - 1
0.4323 (z - l)(z - 0.1353) 1 z - 0.1353
"0.2838’ +0 0.4323 ’c C
0.2838z + 0.1485 (z - l)(z - 0.1353)
=
0.2838Z'1 + 0.1485z~2 (1 - z - 'X l - 0.1353Z-1) Observe que se puede obtener la misma función de transferencia pulso si se toma la transformadaz de G(s) cuando está precedida de un muestreador y un retenedor de orden cero. Al suponer T = 1, se obtiene
G (z)=Z
1
s
= (1 - z ~' )Z
s(s + 2)
= (1 - z - ' ) Z = (1 - z-1)
0.5 -> s
1 í 2(s + 2)
0.25 0 .2 5 ] • s s + 2J
O.Sz' 1
1 (1 - z" ')2
0.25 1- z
0.2838Z'1 + 0.1485z~2 (1 - z - ' ) ( l - 0.1353z_1)
www.FreeLibros.me
0.25 1 - 0.1353z'
318
Análisis en el espacio de estado
Capítuc
Enfoque de M ATLAB para la discretización de ecuaciones de estado en tiempo contin M A T LA B tiene un comando muy útil para discretizar una ecuación de estado en tiempo continuo x = Ax + Bu y convertirla a
x( k + 1) = Gx(k) + Hu(A:) E l comando M A T LA B para discretización es [G ,H ] = c 2 d ( A ,B ,T ) donde T es el período de muestreo del sistema en tiempo discreto. T se deberá especificar en según Si se requiere de buena precisión en la obtención de G y de H utilice format long. Si solam se necesitan cuatro decimales, utilice format short. Si no se incluye enunciado de formato en programa, M A T LA B producirá G y H en format short. Considere el ejemplo siguiente: si el sistema en tiempo continuo está dado por 0 -25
*1
M.
\ *i + '0 ' -4 „*2_ 1
entonces, al considerar que el período de muestreo es de 0.05 segundos, se obtienen G y H co sigue:
A = [0 1; —25 - 4 ]; B = [0; 1] ; [G ,H ] = c2d(A,B,0.05) G = 0.9709 -1.1212
0.0448 0.7915
H =
0.0012 0.0448
Observe que la matriz de estado G y la matriz de entrada H de la ecuación en el espacio estado de tiempo discreto
x(k + 1) = G x(k) + H u( k) dependen del período de muestreo T. Por ejemplo, considere la discretización del sistema en tiem continuo dado por la ecuación (5-77) con dos períodos de muestreo distintos: T= 0.2 segundos y = 1 segundo. Como se ha visto en las salidas de M A T LA B anteriores y en las que siguen, un conj to de matrices G y H difieren en función de un período de muestreo T diferente.
www.FreeLibros.me
~ 5-5
Discretización de las ecuaciones en el espacio de estado en tiempo continuo
A = [0 1; —25 - 4 ]; B = [0; 1}; [G ,H ] = c2d(A,B,0.2 )
A = [0 1; —25 - 4 ]; B = [0; 1] ; [G ,H ] = c2 d (A ,B ,1 )
G =
G = 0.6401 -2.9 017
0.1161 0.1758
-0.0761 0.7321
H =
319
-0.0293 0.0410
H = 0.0144 0.1161
0.0430 -0.0293
Como otro ejemplo, veamos el siguiente sistema: x = Ax + Bu
A A
0 20.601 — — 0 -0.4905
1 0 0 0
0 0 0 0
o' 0 , 1 0
B =
0 ' -1 0 0.5
oner que el período de muestreo T es de 0.5 segundos y sin especificar el formato, se obtiene ente ecuación de estado en tiempo discreto:
x(k + 1) = G x(& ) + Hw(&) as matrices G y H se pueden encontrar en la siguiente salida de computadora: A = [0 1 0 20.601 0 0 0 0 0 -0.4905 0 0 B = [0; —1 ;0;0.5]; [G ,H ] = c2d(A,B,0.05)
0 0 1 01;
G = 1.0259 1.0389 -0.0 0 06 -0.0247
0.0504 1.0259 - 0.0 0 00 -0.0006
0 0 1.0000 0
H = -0.0013 -0.0 5 04 0.0006 0.0250
www.FreeLibros.me
0 0 0.0500 1.0000
320
Análisis en el espacio de estado
Capítulo 5
Respuesta en tiempo entre dos instantes de muestreo consecutivos. En un sistema en tiem po continuo muestreado, la salida es constante en el tiempo. Como se vio en los capítulos 3 y 4, la solución mediante la transformada z de la ecuación del sistema en tiempo discreto da la respuesta de la salida sólo en los instantes de muestreo. En la práctica, se puede desear determinar la salida entre dos instantes de muestreo consecutivos. Existen algunos métodos para encontrar la respuesta (sali da) entre dos instantes de muestreo consecutivos, como el método de la transformada de Laplace y el método de la transformada z modificada (vea el apéndice B ). Aquí se demostrará cómo se puede modificar fácilmente el método en el espacio de estado para obtener la salida entre dos instantes de muestreo consecutivos cualesquiera. Considere el sistema en tiempo continuo invariante en el tiempo definido por x = Ax + Bu y = Cx + Du Se supone que la entrada u se muestrea y alimenta a un retenedor de orden cero. Entonces u ( t ) = u(kT) para k T < r < k T + T. Con referencia a la ecuación (5-65), la solución de la ecuación de estado que comienza con el estado inicial x(r0) es
x(t) =
x(/b) + f eA('-T)B u (r)d T
>0 Para obtener la respuesta del sistema muestreado en t = kT + AT, donde O < A T < T, se hace que t = u ( t ) = u(kT) en la solución x(í). Entonces,
kT + AT, t0 = kT y
fkT+AT
x ( k T + AT) = eAATx ( k T ) +
e « kT+AT-* B u (k T )d T Jk T fá T
= eAATx( k T) +
Jo
eAXB u (k T) d Á
donde A = kT + A T - r. Se define
G(AT) = eAAT
(5-78)
H (4 7 ) = ^ " e ^ d Á ^ B
(5-79)
x ( k T 4- AT ) = G ( AT )x ( kT ) + H ( A T )u ( kT )
(5-80)
Por tanto, se obtiene
La salida y (kT + AT) se puede dar mediante y ( k T + AT) = C x ( k T + AT) + D u (ítr) = C G (4 7 > (* r ) + [C H (A T ) + D ]u (itr)
(5-81)
Por tanto, losvalores de x(kT + AT) y y {kT + AT) entre dos instantes de muestreo consecutivos cualesquiera se pueden obtener si se calcula G (A 7) y H (A 7 ) para varios valores de AT, donde 0 < AT < T, y se introducen dichos valores calculados en las ecuaciones (5-80) y (5-81). (Estos cálculos se pueden programar fácilmente en una computadora digital.)
www.FreeLibros.me
: ón 5-6
Análisis de estabilidad de Liapunov
321
mplo 5-6 Considere el sistema analizado en el ejemplo 5-5. Obtenga la ecuación de estado en tiempo discreto así como la ecuación de salida en t= kT + AT. También obténgalas expresiones específicas correspondientes a la ecuación de estado y la ecuación de salida cuando T= 1 segundo y A T = 0.5 segundos. En el ejemplo 5-5, se obtuvieron las matrices G(7) y H(7) como sigue: G (T) =
4(1 -
e - 2 r )
- 1
H (T) = |(1 - *-2r) Para obtener la ecuación de estado y la ecuación de salida en /= kT+ AT, donde 0 < AT
x,(kT + A 7") x2(kT + AT)
- e~2AT) o
y ( k T + AT) = [1 0]
-2
ar
fl / x ,(* r)
1
\{ AT + e~ T
x2(kT)
u(kT)
1(1 - e - 2AT)
" l t ( l - e~2AT) 'xi(kT) x2(kT) 0 e~2AT
1/ e -2AT + [1 0] 2 { á T + - Y 1(1 - e ' 2Ar)
u(kT)
Para T= 1y A T - 0.5 se obtiene la ecuación de estado y la ecuación de salida como sigue:
x¡ (k + 0.5) x2(k + 0.5)
1 0.3161 0 0.3679
x\(k) _1_ 0.0920 i u(k) x2(k) 0.3161
y{k + 0.5) = [1 0.3161] * .(* ) x2(k)
+ (0.0920)«(fc)
SIS DE ESTABILIDAD DE LIAPUNOV -.nálisis de estabilidad de Liapunov juega un papel importante en el análisis de la estabilidad de sistemas de control descritos por ecuaciones en el espacio de estado. Existen dos métodos de ¡sis de estabilidad de Liapunov, llamados primer método y segundo método', ambos se aplican i determinar la estabilidad de los sistemas dinámicos descritos por ecuaciones diferenciales o en rencias ordinarias. El primer método está formado por procedimientos en los que se utilizan las ^.as explícitas de las soluciones de las ecuaciones diferenciales o de las ecuaciones en diferencias a el análisis. Por otra parte, el segundo método no requiere de las soluciones de las ecuaciones renciales o en diferencias, por lo que resulta más útil en la práctica. Aunque existen muchos criterios de estabilidad poderosos para los sistemas de control, como el criterio de estabilidad de Jury y el criterio de estabilidad de Routh— Hurwitz, éstos están ringidos a sistemas lineales invariantes en el tiempo. Por otro lado, el segundo método de Liapunov
www.FreeLibros.me
322
Análisis en el espacio de estado
Capítulo
5
no está limitado a sistemas lineales invariantes en el tiempo: es aplicable tanto a sistemas lineales como no lineales, variantes e invariantes en el tiempo. En particular, el segundo método de Liapunov es indispensable para el análisis de estabilidad de sistemas no lineales en los que las soluciones exactas no son posibles. (Es importante señalar, sin embargo, que a pesar de que el segundo método de Liapunov es aplicable a cualquier sistema no lineal, los resultados no son una tarea fácil. Se necesita experiencia e imaginación para llevar a cabo el análisis de estabilidad en la mayoría de los sistemas no lineales.) E l segundo método de Liapunov también se conoce como método directo de Liapunov.
Segundo método de Liapunov. De la teoría de la mecánica clásica, se sabe que un sistema vibratorio es estable si su energía total se reduce continuamente, hasta alcanzar un estado de equilibrio. E l segundo método de Liapunov se basa en una generalización de lo anterior: si el sistema tiene un estado de equilibrio asintóticamente estable, entonces la energía almacenada en él desplaza da dentro del dominio de atracción se decrementa al aumentar el tiempo, hasta que por último adopta su valor mínimo en el estado de equilibrio. Sin embargo, para sistemas puramente matemáticos, no existe una forma simple de definir una “ función de energía” . Para vencer esta dificultad, Liapunov introdujo la función de Liapunov, una función ficticia de energía. Esta idea es más general y más utilizada que la de la energía. De hecho, cualquier función escalar que satisfaga las hipótesis de los teoremas de estabilidad de Liapunov (vea los teoremas 5-1 hasta 5-6) puede servir como función de Liapunov. Antes de que se analice más profundamente la función de Liapunov, es necesario explicar la definición positiva de las funciones escalares. Definición positiva de funciones escalares. Se dice que una función escalar V(x) es defini da positiva en una región í i (que incluye el origen del espacio de estado) si F(x) > 0 para todos los estados x no cero de la región í i y si F(0) = 0. Se dice que una función variante en el tiempo V(x, t) es definida positiva en una región í i (que incluye el origen del espacio de estado) si está limitada por debajo por una función definida positiva invariante en el tiempo, es decir, si existe una función definida positiva F(x) tal que V(x, t) > V(x), V(0, t) > 0,
para toda t > t0 para toda t > t0
Definición negativa de funciones escalares.
Una función escalar F(x) es definida negativa
si -V(x) es definida positiva.
Semidefinición positiva de funciones escalares. Una función escalar V(x) es semidefimida positiva si es positiva en todos los estados en la región í i excepto en el origen y en determinados estados donde es cero. Semidefinición negativa de funciones escalares.
Una función escalar V(x) es semidefimida
negativa si -V(x) es positiva semidefinida.
Indefinición de funciones escalares. Una función escalar V(x) es indefinida si en la región í i adopta tanto valores positivos como negativos, independientemente de lo pequeña que sea la región ÍI.
www.FreeLibros.me
5-6
323
Análisis de estabilidad de Liapunov
.pío 5-7 : ' este ejemplo se dan varias funciones escalares y sus clasificaciones de acuerdo con las definiciones interiores. Aquí se supone que x es un vector de dos dimensiones. 1. V(x) = x¡ +
definida positiva
2. F(x )= *í + -
definida positiva
1+ x 2
3. V(x) = (x¡ +x2f
semidefinida positiva
4. V{x) = -x¡ - (x, +x2f
definida negativa
5. V(x) = x¡x2 + x\
indefinida
Funciones de Liapunov. La función de Liapunov, que es una función escalar, es una fiin¿efinida positiva y es continua junto con sus primeras derivadas parciales (en relación con sus entos) en la región O alrededor del origen y tiene una derivada con respecto al tiempo que, ¿o se toma a lo largo de la trayectoria, es definida negativa (o semidefinida negativa). Las ones de Liapunov involucran a x „ x 2, . . . ,x„ y, posiblemente, a t. Se expresan en la forma V(x¡, . x„. t), o sólo mediante F(x, í). Si las funciones de Liapunov no incluyen a t en forma explícita, cas se expresan mediante V(xu x 2, . . . , x„), o bien, V(x). Observe que V (x, í) es de hecho la derivada de V(x, t) con respecto a t a lo largo de una : an del sistema. Por tanto, V (x, t) < 0 implica que V(x, t) se va decrementando en función de t. ■-ííeión de Liapunov no es única para un sistema dado. (Por esta razón, el segundo método de -iov es una herramienta más poderosa que las consideraciones convencionales de energía. ■e que para un sistema cuya energía E se reduce en promedio, pero no necesariamente es e en cada instante, E no es una función de Liapunov.) Más adelante en esta sección se demostrará que en el segundo método de Liapunov el compor t o del signo de V(x, t) y el de su derivada de tiempo V (x, t) = dV(x, t)/dt dan información .a estabilidad de un estado en equilibrio sin tener la solución. Observe que la función definida positiva más sencilla es de forma cuadrática: n
n
V (x ) = 'Z X q¡jXiXj, /=i/=i
i , j = 1 , 2 , .. . , n
eneral, las funciones de Liapunov pueden no ser de forma cuadrática simple. No obstante, en el ce cualquier función de Liapunov, los términos de grado menor en V deben ser pares. Esto se ver como sigue. Si se definen
Xi - = xu n
x2 ~ = x 2, n
X„-1
x n—1
ces en la vecindad del origen, sólo los términos de grado más bajo se harán dominantes y V(x') ede escribir como K ( x ) = X Pn V ( X u X 2, . . . , X „ - i , l )
mantienen las x, fijas, V(x¡, x2, . . . , Jc,M , 1) será una cantidad fija. Para el caso de p impar, x¡¡ e adoptar tanto valores positivos como negativos cerca del origen, lo que significa que F(x) no finida positiva. Por tanto, p deberá ser par. A continuación se dan las definiciones de sistema, estado de equilibrio, estabilidad, estabili¿intótica e inestabilidad.
www.FreeLibros.me
324
Análisis en el espacio de estado
Sistema.
Ca
E l sistema que se considera está definido como x = f (x ,í)
donde x es un vector de estado (un vector-«) y f(x, t) es un vector-« cuyos elementos son funciai de x,, x2, . . . , x,„ y de t. (Observe que como modelo se utiliza un sistema de tiempo continuo p presentar los conceptos básicos sobre el análisis de estabilidad mediante el segundo método Liapunov. Posteriormente se extienden los resultados obtenidos al sistema en tiempo discreto.» supone que el sistema de la ecuación (5-82) tiene una solución única, que empieza en la condid inicial dada. La solución de la ecuación (5-82) se denota como <¡>(t; x0, tQ), donde x = x0en t = ít es el tiempo observado. Por tanto, *o> k) = Xo
Estado de equilibrio.
En el sistema de la ecuación (5-82), un estado xt„ donde f(xt„ t) = 0,
para toda t
se llama estado de equilibrio para el sistema. Si el sistema es lineal e invariante en el tiempo, e s t o s si f(x, t) = Ax, entonces sólo existirá un estado de equilibrio si A es no singular, y un número in fin S de estados de equilibrio si A es singular. En el caso de los sistemas no lineales, pueden existir u n o J más estados de equilibrio. Estos estados corresponden a las soluciones constantes del sistema (x =J para toda t). La determinación de los estados de equilibrio no involucra la solución de la ecuackd diferencial del sistema, ecuación (5-82), sino sólo la solución de la ecuación (5-83). 1 Cualquier estado de equilibrio aislado (es decir aislado de otros) puede ser desplazado al orw gen de las coordenadas, o f(0, t) = 0, mediante traslación de coordenadas. En esta sección, única mente se tratará el análisis de estabilidad de este tipo de estados.
Estabilidad en el sentido de Liapunov. A continuación, una región esférica de radio r, alre dedor de un estado de equilibrio xe se denotará como ||x - xe|| < r donde ||x - x,.| se llama norma Euclidiana y se define como sigue: l|x - Xe)l = [(*! - x u )2 + (x2 -
X 2e f
+ ■'• + ( * „ - X nef ] m
Sea S(8) el conjunto formado por todos los puntos tales que ||xo - xe|| < S y hagamos que S(e) sean todos los puntos tales que ||
t0) -
x t,||
< 8,
para todo t > t0.
Se dice que un estado de equilibrio x, del sistema de la ecuación (5-82) es estable en el sentido de Liapunov si, para cada S(e) existe un S(8) tal que las trayectorias que se inicien en S(8) no salgan de S(e) al aumentar t en forma indefinida. El número real 5 depende de e y, en general, también depende de t0. Si 6 no depende de t0, se dice que el estado de equilibrio es uniformemente estable. Lo que se ha enunciado aquí es que primero se escoge la región S(é) y, para cada S(e), deberá existir una región S(8) tal que trayectorias que se inicien dentro de S(8 ) no salgan de S(e ) conforme t se incrementa en forma indefinida.
www.FreeLibros.me
Se-::
5-6
325
Análisis de estabilidad de Liapunov
Estabilidad asintótica. Se dice que un estado de equilibrio xe del sistema de la ecuación |f-52 >es asintóticamente estable si es estable en el sentido de Liapunov y si cada solución que se ■tic e desde el interior de S{$) converge, sin salir de S(e) hacia xe conforme t se incrementa en forma ■cer'.nida. En la práctica, la estabilidad asintótica es más importante que la simple estabilidad. Sin embar ga -¿do que la estabilidad asintótica es un concepto local, el hecho de establecer la estabilidad K r.:o:ica no necesariamente significa que el sistema operará de manera correcta. Por lo general, es ■tcesario algún conocimiento del tamaño de la región más grande de la estabilidad asintótica. Esta tes: : n se conoce como dominio de atracción. Es esa parte del espacio de estado en la cual se origi■ar as trayectorias asintóticamente estables. En otras palabras, cualquier trayectoria que se origine en r dominio de atracción es asintóticamente estable. Estabilidad asintótica global. Si la estabilidad asintótica es válida para todos los estados (pera :odos los puntos en el espacio de estado) a partir de donde se originan todas las trayectorias, se üce cae el estado de equilibrio es estable asintóticamente global. Esto es, el estado de equilibrio xe ik sistema dado por la ecuación (5-82) se dice estable asintóticamente global si es estable y cada p;-_cion converge a xt, conforme t se incrementa en forma indefinida. Es claro que una condición pecuaria para la estabilidad asintótica global es que exista sólo un estado de equilibrio en la totalifáhi ¿el espacio de estado. En problemas de ingeniería de control, la estabilidad asintótica global es una característica «seeble. Si el estado de equilibrio no es estable asintóticamente global, entonces el problema se ccr ■erte en determinar la región más grande de estabilidad asintótica. Esto por lo regular es muy mf,:.]. No obstante, para efectos prácticos, es suficiente con determinar una región de estabilidad ¡a&r.totica lo suficientemente grande para que ninguna perturbación la exceda. Inestabilidad. Se dice que un estado de equilibrio xe es inestable si para algún número real . > cualquier número real S > 0, sin importar qué tan pequeño, siempre existirá un estado x0 en S ; tal que la trayectoria que se inicie en ese estado salga de S(e). *
1 Representación gráfica de estabilidad, estabilidad asintótica e inestabilidad. Una repre sentación gráfica de las definiciones anteriores aclarará sus significados. Consideremos el caso de dos dimensiones. Las figuras 5-2a), b) y c) muestran los estados de cci- ibrio y las trayectorias típicas que corresponden a estabilidad, estabilidad asintótica e inestabi-
(a)
(b)
(c)
Figura 5-2 a) Estado de equilibrio estable y una trayectoria representativa; b) estado de equilibrio estable asintóticamente y una trayectoria representativa; c) estado de equilibrio inestable y una trayectoria representativa.
www.FreeLibros.me
326
Análisis en el espacio de estado
lidad en forma respectiva. En la figura 5-2a), b) o c), la región S(S) limita el estado inicial x_ v región 5(e) corresponde a los límites de la trayectoria que se inicia de cualquier estado inicial x, < la región S(8). Observe que las definiciones anteriores no especifican la región exacta de las condick* iniciales permisibles. Por tanto, las definiciones sólo se aplican a la vecindad del estado de eqol brio, a menos que S(é) corresponda a la totalidad del plano de estado. Observe que en la figura 5-2c) la trayectoria sale de S(e) y, por tanto, todo el estado de eqsi brio es inestable. No podemos, sin embargo, decir que la trayectoria se irá al infinito, ya que podi acercarse a un ciclo límite fuera de la región S(é). (S i un sistema lineal de tiempo invariante* inestable, las trayectorias que se inician incluso cerca del estado de equilibrio inestable van al infii to. Pero tratándose de sistemas no lineales, esto no es necesariamente cierto.) Es importante señalar que las definiciones aquí presentadas no son las únicas que definen I conceptos de la estabilidad de un estado de equilibrio. De hecho, existen algunos libros con difera tes formas de definir la estabilidad. Por ejemplo, en la teoría de control convencional, sólo aquel sistemas que son estables asintóticamente se denominan sistemas estables, y aquellos sistemas esl bles en el sentido de Liapunov, pero que no son estables asintóticamente, se llaman inestables. Ql ejemplo es la estabilidad B IB O . Un sistema lineal de tiempo invariante se llama estable de ential acotada y salida acotada (estable B IB O ) si la salida que se inicia a partir de un estado inicial arbia rio queda acotada cuando la entrada también está acotada. Se debe notar, sin embargo, que en a libro, cuando se utilice la palabra “ estabilidad” , por lo general significará estabilidad asintótica en sentido de Liapunov.
Teorema de Liapunov sobre la estabilidad asintótica. Se puede demostrar que si una fa ción escalar F(x), donde x es un vector n, es definida positiva, entonces los estados x que satisfaa V (x ) = C donde C es una constante positiva, están en una hipersuperficie cerrada en el espacio de estado de* dimensiones, al menos en la vecindad del origen. Si L(x) —* <* conforme ||x|| —><*, entonces esi superficies cerradas se extienden sobre la totalidad del espacio de estado. La hipersuperficie V{\)C, está enteramente en el interior de la hipersuperficie V(x) = C2 siempre que C, < C2. Para un sistema dado, si es posible encontrar una función escalar definida positiva L(x). S que su derivada de tiempo tomada a lo largo de una trayectoria sea siempre negativa, entona conforme el tiempo aumenta, P(x) toma valores cada vez más pequeños de C. Conforme el tierap aumenta, L(x) finalmente se reduce a cero y, por tanto, x también se reduce a cero. Esto imptk estabilidad asintótica del origen del espacio de estado. El teorema principal de estabilidad de Liapuno que es una generalización de lo anterior, proporciona una condición suficiente para la estabilida asintótica. Este teorema puede enunciarse como sigue. Teorema 5-1.
Suponga que un sistema está descrito por X = f (x ,í)
donde f(0, t) = 0,
para todo t
Si existe una función escalar K(x, t) con derivadas parciales de primer orden continuas y que sati: gan las condiciones
www.FreeLibros.me
5-6
Análisis de estabilidad de Liapunov
327
I (x, t) es definida positiva. í'(x , t) es definida negativa. ees el estado de equilibrio en el origen es uniforme y asintóticamente estable. Si. además, K(x, t) ^ conforme ||x|| -> entonces el estado de equilibrio en el origen es rme y asintóticamente estable global. (Para probar este teorema, vea el problema A-5-18.) Las condiciones de este teorema se pueden modificar como sigue: . í (x. t) es definida positiva. . *' (x, i) es semidefinida negativa. . r (<£(/; x0, t0), t) no desaparece para t > t0 para cualquier tQy para cualquier x0 A 0, donde é
Teorema de Liapunov sobre la estabilidad. Para probar la estabilidad (pero no la estabilidad :::ca) del origen del sistema definido por la ecuación (5-82) se puede aplicar el siguiente teo-
Teorema 5-2.
Suponga un sistema descrito por
x = f ( x ,í) f 0. /) = 0 para toda t. Si existe una función escalar V(x, t) que tenga derivadas parciales de . orden continuas y que satisfaga las condiciones - x. t) es definida positiva. ■'
¡nestabilidad. Si un estado de equilibrio x = 0 de un sistema es inestable, entonces existe una t . escalar W{x, t) que determina la inestabilidad del estado de equilibrio. A continuación se sará un teorema sobre la inestabilidad.
www.FreeLibros.me
328
Análisis en el espacio de estado
Teorema 5-3.
Cap
Suponga que un sistema está descrito por x = f (x ,í)
donde f(0, t) = 0,
para todo t > t0
Si existe una función escalar IV(\, t) que tenga primeras derivadas parciales continuas y que ga las condiciones 1. W(x, t) es definida positiva en alguna región alrededor del origen. 2. W(x, t ) es definida positiva en la misma región. entonces el estado de equilibrio en el origen es inestable.
Observaciones. Cuando se aplica el análisis de estabilidad de Liapunov a sistemas no 1 les es necesario hacer algunos comentarios. 1. En la aplicación de los teoremas de estabilidad de Liapunov a un sistema no lineal, las ciones de estabilidad obtenidas a partir de una función de Liapunov determinada son co nes suficientes pero no son condiciones necesarias. 2. Una función de Liapunov para un sistema determinado no es única. Por tanto, es in r señalar que el no encontrar una función de Liapunov adecuada para mostrar estabif estabilidad asintótica o inestabilidad del estado de equilibrio bajo consideración, puede información sobre la estabilidad. 3. Aunque una función de Liapunov determinada puede probar que el estado en equilibrio consideración es estable o estable asintóticamente en la región O donde incluye este estr equilibrio, esto no necesariamente significa que los movimientos son inestables fuera región fl. 4. Para un estado de equilibrio estable o asintóticamente estable, siempre existe una func; Liapunov con las propiedades requeridas.
Análisis de estabilidad de los sistemas lineales invariantes en el tiempo. Existen métodos para la investigación de la estabilidad asintótica de sistemas lineales invariantes en el po. Por ejemplo, para un sistema de tiempo continuo descrito por la ecuación x = Ax se puede decir que una condición necesaria y suficiente para la estabilidad asintótica del oriw sistema es que todos los valores propios de A tengan partes reales negativas, o que los c polinomio característico |jI - A| = sn + axsn~l + ••• + an-iS + an tengan partes reales negativas. De igual manera, para un sistema en tiempo discreto representado por la ecuación
x( k + 1) = G x(k) una condición necesaria y suficiente que se puede enunciar para la estabilidad asintótica del es que todos los valores propios de G tengan magnitud menor que la unidad, o que los c polinomio característico
www.FreeLibros.me
329
Análisis de estabilidad de Liapunov
|zl - G| = z" + axz n ’ + ■•• + a„_iZ + an merrren en el interior del círculo unitario centrado en el origen del plano z. 5 " embargo, encontrar los valores propios puede ser difícil, en el caso de sistemas de orden »: * a cuando algunos de los coeficientes del polinomio característico no son numéricos. En rasos. puede aplicarse el criterio de estabilidad de Jury o los criterios de estabilidad de Routh— x z El método de Liapunov, que proporciona una alternativa al análisis de estabilidad de sistejre a ’es invariantes en el tiempo, es algebraico y no requiere factorización del polinomio caraco. como más adelante se verá. Es importante notar que para los sistemas lineales invariantes ze~po, el segundo método de Liapunov no da sólo condiciones suficientes, sino también ■ores necesarias y suficientes para la estabilidad o para la estabilidad asintótica. E _ el siguiente análisis de estabilidad de sistemas lineales invariantes en el tiempo, se supone >alor propio A, de la matriz A es una cantidad compleja, entonces A debe contener a A,, que z :r zgado complejo de A,, como su valor propio. Entonces, cualesquiera valores propios com ee A aparecerán como pares complejos conjugados. Asimismo, en las siguientes discusiones estabilidad, se utilizará la expresión de transpuesta conjugada, en lugar de la expresión de -jésia de la matriz A, ya que los elementos de la matriz A pueden incluir conjugados compleL í transpuesta conjugada de A se describe como A*. Es una conjugada de la transpuesta:
A* = A T Análisis de estabilidad Liapunov de sistemas lineales en tiempo continuo e invariantes en el t
Considere el siguiente sistema lineal invariante en el tiempo:
x = Ax
(5-84)
x es el vector de estado (un vector-n) y A es una matriz constante de n x n. Se supone que A s -.zular. Entonces el único estado de equilibrio es el origen, x = 0. La estabilidad del estado de ver o del sistema lineal invariante en el tiempo se puede investigar fácilmente mediante el se■método de Liapunov. Eira el sistema definido por la ecuación (5-84), se escoge como posible función de Liapunov V(x) = x*Px P es una matriz hermítica definida positiva. (S i x es un vector real, entonces P se puede -•r r.ar como una matriz simétrica real definida positiva.) La derivada en el tiempo de K(x) a lo re cualquier trayectoria es
V(x) = x*Px + x*Px = (Ax)*Px + x*PAx = x*A*Px + x*PAx = x*(A*P + PA)x - rué l ’(x) se escogió para ser definida positiva, se requiere, para la estabilidad asintótica, que sea definida negativa. Por tanto, se requiere que
F (x ) = -x * Q x
www.FreeLibros.me
330
Análisis en el espacio de estado
Capítulo.
donde
Q = - (A”P + PA) = definida positiva Por tanto, para la estabilidad asintótica del sistema de la ecuación (5-84), es suficiente que Q se definida positiva. Para probar que una matriz de n x n es definida positiva, se aplica el criterio de Sylvester, qa dice que una condición necesaria y suficiente para que una matriz sea definida positiva es que determinantes de todos los menores principales de la matriz sean positivos. Considere, por ejemph la siguiente matriz hermítica P de n x n (si todos los elementos de P son reales, entonces la maní hermítica se convierte en una matriz simétrica real):
p =
Pu Pl2 P 12 Pl2 .Pin Pin
' ‘ Pin ' P2n ■
Pnn
donde p t], representa el complejo conjugado de p y. La matriz P es definida positiva si todos la menores principales sucesivos son positivos, esto es, si
Pl 1 > o,
Pu Pll > 0 , P 12 P22
•••,
Pu P\2 p 12 P 22 p in Pht
'•
Pin ■ Pin Pnn
En vez de especificar primero una matriz definida positiva P y examinar si Q es definid positiva, es conveniente especificar una matriz definida positiva Q primero y a continuación exaroi nar si P calculada a partir de
A*P + PA = - Q es definida positiva o no. Observe que el que P sea definida positiva es una condición necesaria j suficiente. Se resumirá lo anterior en forma de teorema. Teorema 5-4.
Considere el sistema descrito por
x = Ax donde x es un vector de estado (un vector rí) y A es una matriz no singular constante de n x n. L * condición necesaria y suficiente para que el estado de equilibrio x = 0 sea asintóticamente estábil global es que, dada cualquier matriz Q hermítica definida positiva (o cualquier matriz simétrica real da finida positiva), existe una matriz P hermítica definida positiva (o una matriz simétrica real definida po sitiva) tal que
A*P + PA = - Q
(5-851
La función escalar x*Px es una función de Liapunov para este sistema. [Observe que en el sistena lineal considerado, si el estado de equilibrio (el origen) es asintóticamente estable, entonces a asintóticamente estable global.]
Comentarios. Al aplicar el teorema 5-4 al análisis de estabilidad de sistemas lineales di tiempo continuo e invariantes en el tiempo, se pueden hacer algunos comentarios importantes.
www.FreeLibros.me
1-í z z .ón 5-6
Análisis de estabilidad de Liapunov
331
1. Si V (x) = -x’Qx no se desaparece a lo largo de cualquier trayectoria, entonces Q se puede seleccionar para ser semidefinida positiva. 2. Si Q se escoge como una matriz definida positiva arbitraria [o una matriz semidefinida positi va arbitraria si V (x) no se desaparece a lo largo de cualquier trayectoria] y la ecuación matricial
A*P + PA = - Q se resuelve para determinar P, entonces la definición positiva de P es una condición necesaria y suficiente para la estabilidad asintótica del estado de equilibrio x = 0. 3. El resultado final no depende de la matriz Q determinada escogida, siempre y cuando Q sea definida positiva (o semidefinida positiva, según el caso). 4. Para determinar los elementos de la matriz P, se igualan las matrices A 'P + A P y -Q, elemento por elemento. Esto resulta en n(n + l)/2 ecuaciones lineales para determinar los elementos p(y = p¡, de P. Si se identifican los valores propios de A como A „ A2, . . . , A,„ cada uno es repetido varias veces en relación con su multiplicidad como una raíz de la ecuación característica, y si por cada suma de dos raíces Ay + A* * o
entonces los elementos de P están determinados en forma única. (Observe que para una matriz estable A la suma A¡ + \ k es siempre diferente de cero.) 5. Al determinar si existe o no una matriz P simétrica real definida positiva o hermítica definida positiva, es conveniente escoger Q = I, donde I es la matriz identidad. Entonces los elementos de P quedan determinados a partir de
A*P + PA = - I y se prueba si la matriz P es definida positiva.
Ejemplo 5-8 Determine la estabilidad del estado de equilibrio del sistema siguiente: i i = -Xi - 2x2
x2 = Xi - 4x 2 El sistema sólo tiene un estado de equilibrio en el origen. Seleccionando Q = I y sustituyendo I en la ecuación (5-85), se tiene A*P + PA = - I Si observamos que A es una matriz real, P deberá ser una matriz simétrica real. Esta última ecuación se puede escribir como sigue: -1 -2
1 Pn Pn Pn + -4 .P12 p22 Pn
Pn P22
-1 - 2 1 -4
"l 0" 0 1
donde se observa que p2¡ = p,2 con lo que se hace la sustitución apropiada. Si la matriz P resulta ser definida positiva, entonces x'Px es una función de Liapunov y el origen es asintóticamente estable.
www.FreeLibros.me
332
Análisis en el espacio de estado
Capítulo
La ecuación (5-86) produce las siguientes tres ecuaciones:
2pu + 2pn — 1 -2p n ~ 5p 12 + p 22 = 0
~4p 12 — 8p22 = ~ 1 Al resolver para las p, se tiene n — 23 Pn -
P'2 -
P22 = &
Por tanto, 23 60
—26 0
_ J7 . 60
U 60
De acuerdo con el criterio de Sylvester, esta matriz es definida positiva. Por tanto, se concluye que origen del sistema es asintóticamente estable global. Debe hacerse notar que una función de Liapunov para este sistema es
V(x) = x*Px = [X\ x2]
23 60
_7_ 60
-2
11
60
60
= ¿(23*? - 14*, * 2 + 11*?) y V (x) está dado por
V(x) = -*? - *? Análisis de estabilidad de Liapunov de sistemas en tiempo discreto. A continuación extenderá el análisis de estabilidad de Liapunov a los sistemas en tiempo discreto. Como en el de los sistemas en tiempo continuo, la estabilidad asintótica es el concepto más importante en estabilidad de los estados de equilibrio de los sistemas en tiempo discreto. Ahora se presentará un teorema de estabilidad para sistemas lineales o no lineales de tie discreto e invariantes en el tiempo, basados en el segundo método de Liapunov. Hay que señalar en los sistemas de tiempo discreto, en vez de V (x), se utilizará la diferencia directa V(x(k + 1) V{\(kT)), es decir A V (x ( kT ) ) = V( x (k + 1)1) - V(x(kT)) Teorema 5-5.
(5
Considere el siguiente sistema en tiempo discreto
x( (k + 1 )T) = f (x(kT)) donde
x = vector-n f(x) = vector-/? con la propiedad de que f(0) = 0 T = período de muestreo Suponga que existe una función escalar L(x) continua en x tal que 1. K(x) > 0 para x ¥= 0. 2. AF(x) < 0 para x + 0, donde
AV (x ( k T ) ) = V( x (k + \ ) T ) - V(x(kT))
www.FreeLibros.me
V (f(x (k T ))) -
V (x (kT ))
5-ó
Análisis de estabilidad de Liapunov
333
; ( 0) = o i'ix) —» se cuando J¡x¡| -a <*.
* 4.
cr.ces el estado de equilibrio x = 0 es asintóticamente estable global, y K(x) es una función de Dbserve que en este teorema la condición 2 se puede reemplazar por la condición 2 . AK(x) < 0 para toda x, y A L(x) no se desaparece para cualquier secuencia solución {x(/t7)} que satisfaga la ecuación (5-88). —: que significa que no es necesario que AK(x) sea definida negativa si no se desaparece en cualr_:er secuencia solución de la ecuación de diferencias.
Análisis de estabilidad de Liapunov de los sistemas lineales en tiempo discreto e invariantes en el tiempo. Considere el sistema en tiempo discreto descrito por x (k + 1) = Gx(k)
(5-89)
'.de x es el vector de estado (vector-n) y G es una matriz no singular constante de n '
V(x{k)) = x*(k)Vx(k) re d e P es un matriz hermítica definida positiva (o una matriz simétrica real definida positiva). Drtences
AV'(xOfc)) = V(x (k + 1)) - V(x(k)) = x*(k + í)Px(k + 1) - x*(&)Px(&) = [Gx(fc)]*P[Gx(fc)] - x*(k)Vx(k)
= x*(A:)G*PGx(&) - x*(£)Px(&) = x*(^)(G*PG - P)x(Jt) 2-rdo que V(\(k)) se seleccionó para ser definida positiva, se requiere, para la estabilidad asintótica, rué A 1’(x (*)) sea definida negativa. Por tanto
AV(x(/fc)) = -x*(*)Q x(it) n :-de Q = - (G 'P G - P ) = definida positiva De ese modo, para la estabilidad asintótica del sistema en tiempo discreto de la ecuación (5-89), es suficiente que Q sea definida positiva. Como en el caso de sistemas lineales de tiempo continuo, es conveniente especificar primero xr r matriz Q hermítica definida positiva (o simétrica real definida positiva) y a continuación ver si a matriz P determinada por
G*PG - P = - Q
www.FreeLibros.me
334
Análisis en el espacio de estado
Capítulo 5
es definida positiva o no. Observe que una P definida positiva es una condición necesaria y suficien te. Se resumirá en un teorema lo que se ha enunciado aquí.
Teorema 5-6.
Considere el sistema en tiempo discreto
x(& + 1) = G x(k) donde x es el vector estado (vector-«) y G es una matriz no singular constante de n x n. Una condi ción necesaria y suficiente para que el estado de equilibrio x = 0 sea asintóticamente estable global es que, dada cualquier matriz Q hermítica definida positiva (o simétrica real definida positiva) existe una matriz P hermítica definida positiva (o simétrica real definida positiva) tal que G *PG - P = - Q
(5-90)
La función escalar x'Px es una función de Liapunov para este sistema. Si A V(x(k)) = -x'(k)Qx(k) no se desaparece a lo largo de ninguna serie de soluciones, entonces Q puede ser escogida como semidefinida positiva.
Estabilidad de un sistema en tiempo discreto obtenido al discretizar un sistema en tiempo continuo. Si el sistema se describe en términos de ecuaciones en el espacio de estado, la estabili dad asintótira de un estado de equilibrio de un sistema en tiempo discreto obtenido al discretizar un sistema en tiempo continuo, equivale a la del sistema en tiempo continuo original. Considere un sistema en tiempo continuo
x = Ax y el sistema correspondiente en tiempo discreto
x((k + 1) T) = Gx(kT) donde G = eKT Si el sistema en tiempo continuo es asintóticamente estable, es decir, si todos los valores propios de la matriz A tienen partes reales negativas, entonces ||G"||—>0,
cuando n —>oo
y el sistema discretizado también es asintóticamente estable. Esto se debe a que, si las A, son los valores característicos de A, entonces las eA,/ son los valores propios de G. (Observe que \ek,T | < 1 si A,T es negativa.) Se debe notar que si se discretiza un sistema en tiempo continuo con polos complejos, enton ces en casos excepcionales puede ocurrir inestabilidad oculta, en función de la selección del período de muestreo T. Es decir, en algunos casos donde el sistema en tiempo continuo no es asintóticamente estable, el sistema discretizado equivalente pudiera parecer estable asintóticamente, si se observan únicamente los valores de salida en los instantes de muestreo. Este fenómeno ocurre sólo para algu nos valores del período de muestreo T. Si se varía el valor de T, entonces esta inestabilidad oculta aparece en forma de inestabilidad explícita. Vea el problema A-5-15.
Contracción. Una norma de x denotada como ||x|| se puede pensar como una medida de la longitud del vector. Existen diferentes definiciones de norma. Cualquier norma, sin embargo, tiene las siguientes propiedades:
www.FreeLibros.me
i -6
335
Análisis de estabilidad de Liapunov
11*11 = o,
para x = 0
MI > o,
para x
II* + yll ^ 11*11 + llyll.
para toda x y y
IIMI =
para toda x y constante real k
\k\
Mil,
0
:ión f(x) es una contracción si f(0) = 0 y
l|f(x)|| < ||* ¿un conjunto de valores de x ¥= 0 y alguna norma. ■"ara sistemas en tiempo discreto se puede utilizar una norma ||x|| como función de Liapunov. ere el siguiente sistema en tiempo discreto:
x(k + 1) = f (* (* )),
f(0 ) = 0
(5-91)
x es un vector-n y f(x) es también un vector-w. Suponga que f(x) es una contracción para toda '-na norma. Entonces el origen del sistema de la ecuación (5-91) es asintóticamente estable ;• una de sus funciones de Liapunov es V(x) = ||x|| ruede ver como sigue. Dado que V(x) = ||x|| es definida positiva y
¿ V (x (* )) = V (f(x (k ))) - V(x(k)) = ||f(x)|| - ||x|l ' da negativa, porque f(x) es una contracción para toda x, se encuentra que V(x) = ||x|| es una de Liapunov y, según el teorema 5-5, el origen del sistema es asintóticamente estable global, problema A-5-20.)
- rnsidere el siguiente sistema: o -0.5
xi(k + 1) x2(k + 1)
r -1
x¡(k ) x i(k)
term ine la estabilidad del origen del sistema. Se escoje Q como I. A continuación, con referencia a la ecuación (5-90), la ecuación de estabilide Liapunov se convierte en -0.5" Pn P n 1 -1 P 12 P 22
'o
0 -0.5
1 -1
Pn Pn
Pn P 22
1 O’ 0 1
(5-92)
se encuentra que la matriz P es definida positiva, entonces el origen x = 0 es asintóticamente estable -:bal. De la ecuación (5-92) se obtienen las siguientes tres ecuaciones:
0.25p22 ~ pn ~ ~1 0 .5 ( - p i2 + P 22) ~ P n = 0 Pw ~ 2/712 = —1
'as cuales se obtiene Pn =
P 12 = f,
p22 ~ %
www.FreeLibros.me
336
Análisis en el espacio de estado
Capítuo
En consecuencia,
A l aplicar el criterio de Sylvester para probar la definición positiva de la matriz P, se encuentra que P definida positiva. Por tanto, el estado de equilibrio, el origen x = 0, es asintóticamente estable globai. Observe que en vez de escoger Q como I se podría haber escogido Q como una matriz semideñ; positiva, tal como
0 o Q = 0 1 siempre y cuando A K(x) = -x'(k)Qx(k) no se desaparezca a lo largo de cualquier serie de soluciones. Pl la matriz Q semidefinida positiva recién definida, se tiene
AV(x) = -xl(k) Para el sistema actual, x2(k) idénticamente cero implica quex¡{k) es idénticamente cero. Por tanto, A II no se desaparece a lo largo de cualquier serie de soluciones, excepto en el origen. Por tanto, se púa escoger esta matriz Q semidefinida positiva para determinar la matriz P de la ecuación de estabilidad Liapunov. La ecuación de estabilidad de Liapunov, en este caso se convierte en ’o 1
- 0 .5 ’ -1
0 -0 .5
Pn P 12 p 12 P 2 2
1 -1
Pn P 12
0 0
P 12 P 22
0' 1
A l resolver esta última ecuación, se obtiene 3 i 5 5 4 12
5 5
A l aplicar el criterio de Sylvester, se encuentra que P es definida positiva, por tanto se obtiene la conclusión que antes: el origen es asintóticamente estable global.
PRO BLEM AS DE EJEM PLO Y SO LU C IO N ES Problema A-5-1 (Método de programación directa) Considere el sistema en tiempo discreto definido por
F (z )
U(z)
b0z n + b, z"~l + ■••+£>„ zn + fliz"-1 + ••• + an
Muestre que una representación en el espacio de estado de este sistema puede estar dada por
x, ( k + 1 ) x2(k + 1 ) +
* 3
x„-i(k +
1)
=
0 0
1
0
•
0
1
■
0
0
0
•
0 0
0 0
X i(k )
x2(k) +
. ~ a"
~
@n —2
•
x„-i(k) -«!_ _ x„(k) _ 1
y{k) = [bn - anb0':b„-i - a„~xb0: ■■■\bl ~ a^bü]
xt(k) x2(k) x „ ( k)
www.FreeLibros.me
u(k)
0 1
+ b0u(k)
jio 5
337
Problemas de ejemplo y soluciones
Solución
El sistema dado puede modificarse a la forma y (¿ ) _ b0 + bjZ~l + b2z~2 + ••• + bnz~" U(z) 1 + a¡z~' + a2z~2 + ••• + anz~n
= b + (¿1 ~ aib0)z~' + ( b2 - a2bo)z~2 + •■• + (b„ - a„b0)z~n 0 1 + a¡z~l + a2z~2 + ■■■ + a„z~" Esta última ecuación se puede escribir como sigue:
Y(z) = b0 U(z) (,bi - al bo)z~1 + ( b2 - a2bQ)z~2 + ••• + (¿>„ - a„b0)z~" 1 + a¡z 1 + a2z 2 +■■■+ a„z " ^ Z^
(5-95)
(bi - ai b0)z 1 + (b2 - a2b0)z 2 +■■■ + (b„ - a„b0)z “ F(Z ) = --------- 1 + fliZ -1 + a2z ' 2 '+'••• + anz~n--------- Í7(Z)
(5-96)
Se define
Entonces la ecuación (5-95) se convierte en
Y( z ) = b0U(z) + Y{z)
(5-97)
Al rescribir la ecuación (5-96) a la forma siguiente:
____________________ ñ z ) ____________________ (bi -
ü\ bo)z 1 +
(b2 - a2b0)z 2 + ■■■ + (b„ - a„b0)z~n
= _____________ m ¡ ) ______________ = n ( v 1 + a i Z ' 1 + a2z ' 2 + ••• + anz ' n De esta última se pueden obtener las dos ecuaciones siguientes:
Q(z) = —aiz~' Q(z) - a2z~2Q{z) - - - - - a„z~"Q(z) + U(z)
(5-98)
\
Y (z ) = (bi - ai bo)z~xQ (z ) + ( b2 - a2b0)z~2 Q (z ) + •■•
+ ( bn - a„b0)z~nQ(z )
(5-99)
Ahora se definen las variables de estado como sigue:
Xi(z) = z-"Q(z) X 2(z) = z~"+1Q(z) (5-100)
X^i(z)*= z~2Q(z) X„(z) = z 1Q(z) Entonces, claramente se tiene
zXi(z) = X 2{z) zX2(z) = X 3(z)
z X n~i(z) = X „ ( z )
www.FreeLibros.me
338
Análisis en el espacio de estado
Capítulo 5
En términos de ecuaciones en diferencias, las n - 1 ecuaciones anteriores se convierten en
Xi(k + 1) = x2{k) x2{k + 1) = x3(k)
(5-101»
x„-¡(k + 1) = x„(k) Al sustituir la ecuación (5-100) en la ecuación (5-98) se obtiene
zX„(z) = -aiX„(z) - a2X„-i(z) -
- anAr,(z) + U(z)
que puede ser transformada a una ecuación de diferencias:
x„(k + 1) = - a nxi(k) - an- xx2(k) - ■■■ - a^xn{k) + u(k)
(5-102»
Asimismo, la ecuación (5-99) se puede rescribir como sigue:
Y(z) = (b¡ - a¡ b0)X„(z) + (b2 - a2bn)X„-,(z) + ■• ■+ (b„ - anb0)X¡{z ) Al usar esta última ecuación, la ecuación (5-97) puede ser escrita de la manera
y(k) = ( b„ - anb0)xi(k) + (¿»„-, - an- t b0)x2(k) + • ■• + (bi - aibo)xn(k) + b0u (k)
(5-103»
Si se combinan las ecuaciones (5-101) y (5-102) obtenemos como resultado la ecuación de estado dad» por la ecuación (5-93). La ecuación de salida, ecuación (5-103), se puede volver a escribir en la form» dada por la ecuación (5-94). Problema A-5-2 (Método de programación anidada)
C( \
Considere el sistema con función de transferencia pulso definido por ZÍ£>=feo + friZ~' + ••• + bnz~"
= U(z)
1 + alZ~ ' + ■■■ + anz~n
Muestre que la representación en el espacio de estado de este sistema puede estar dado como sigue: xi(k + 1) x2(k + 1)
0 0 1 0
• ■ 0 0 • • 0 0
-a„
úíi-i
Xi(k) x2{k)
x„-i(k + 1) _ xn(k + 1) _
0 0 0 0
• • 1 0 • • 0 1
~a2 - ai
xn-i(k) x„(k )
bn - a„b0 n- 1 — a„~ib u(k)
(5-10«|
0
1
b2 bi — ai b0 x, (k) x2(k) H * ) = [o
o
o
+ b„u(k)
i]
x„-,(k) x„(k)
www.FreeLibros.me
(5-105|
-jlo 5Problemas de ejemplo
Solución
339
y soluciones
Vuelva a escribir la función de transferencia pulso como sigue:
Y (z ) - boU(z) + z - l[at Y (z ) - b, U(z)] + z ^ [ a 2Y (z ) - b2 t/(z)] + •■• + z~"lan Y (z ) - b„ t/(z)] = 0 o bien Y (z) = b0U(z) + z ' ( b x U(z) - a, Y (z) + z -'{b2 U(z) - a2Y(z) + z“ 1[i>3U{z) - «3Y (z)+ ••■]})
(5-106)
Ahora se definen las variables de estado de la siguiente manera:
X„(z) = z-'[b i U(z) - ax Y (z) + X n. x(z)] X H. x{z) = z~l[b2 U(z) - a2 Y (z) + X„-2(z)] :
(5-107)
X 2(z) = z~l{b„-x U(z) - a,-,.Y(z) + X x(z)) X x(z) = z~'[b„ U(z) - a„ Y(z)] Entonces la ecuación (5-106) se puede escribir en la forma (5-108)
Y(z) = b„U(z) + X n(z)
AI sustituir la ecuación (5-108) en la ecuación (5-107) y multiplicar ambos lados de las ecuaciones por z, se obtiene
z X n{z) = X„~x(z) - «i X„(z) + (bi - axbc)U(z) zX„-i(z) = X„-2(z) - a2X„(z ) + (b2 - a2b0)U(z)
z X2(z) = X t(z) - an-¡X„(z) + (b„-i - a„-xb0)U(z ) zXi(z) = - a„X„{z) + ( b„ - a„b0)U{z) A l tomar las transformadas inversaz de las n ecuaciones anteriores y al escribir las ecuaciones resultantes en orden inverso, se obtiene
x x(k + 1)
=
- a„x„(k)+ ( b„ - a„bü)u(k )
x2(k + 1)
=
x x(k) - an- xx„(k) +
xn- x(k + 1) x„(k + 1)
=
x„-2(fc) - a2x„(k) + =
*„-!(&) - axx„(k) +
(b„-x- a„~xb0)u(k)
(b2 - a2ba)u(k) ( bx - axba)u(k)
También, la transformada inversaz de la ecuación (5-108) da
y{k) = xn(k) + b„u(k) A i \olver a escribir la ecuación de estado y la ecuación de salida en la forma estándar matricial, obtene~os las ecuaciones (5-104) y (5-105), respectivamente.
iC Kma A-5-3
Método de programación de expansión en fracciones parciales) zansferencia pulso dado por
www.FreeLibros.me
Considere el sistema con función de
340
Análisis en el espacio de estado
Capítu c
5
Y (z ) _ bpz" + zn~' + •■■+ b„ U(z) z n + ai zn í + ■■■+ a„ Demuestre que la ecuación de estado y la ecuación de salida se pueden dar en la forma canónica diagonal siguiente, si todos los polos son distintos. X i( k + 1)
• • ■ •
0 0
p2
x„(k + 1)
0
0
xi(k) x2(k)
0 0
y(k) = [cj c2
c„j
xi(k) x2(k)
1
+
1
u(k)
(5-1
1_ 1
• ■ Pn
.2 *
x2(k + 1) =
+ b0u(k)
(5-1 i-.1
x„(k) Solución
La función de transferencia pulso del sistema se puede modificar como sigue:
Y(z) _ bQz n + b i z"-1 + ■■■+ bn U(z) z" + a¡z” ' + ■■■+ an — bo +
(bi - g ]b0)z"~1 + (b2 - a2bo)z"~2 + ••• + ((>„- a„ba) (z - p,)(z - p 2) ■■■(z - p„)
(5-11
En vista de que todos los polos de la función de transferencia pulso Y(z)/U(z) son distintos, Y(z)IL \z puede expandir a la forma siguiente:
y (* ) =
U(z)
fco + _ £ l _ + _ £ 2 _ + . . . + . c„ z - p¡ z - p 2 z ~p„
donde
(5-i
Y(z) U(z) (z ~ p,)
Ci = lim Z -* P i
La ecuación (5-112) se puede escribir en la forma Y (z) = bgU(z) +
C2
Ci
z
■U(z) - p1 '
Z
- p2
1/(2) +
+ - £=— U(z) z - p„
(5-117
Las variables de estado se definen como sigue: 1
* .(* ) =
Z
■U(z) - P\
X 2( z ) = ^ 1 — U{z) z - p2 XÁz ) =
1 Z - p„
(5-1:
U(z)
La ecuación (5-114) se puede volver a escribir como
zX,(z) = p, X,(z ) + U(z) z X2(z) = p 2X 2(z) + U(z)
z X „ ( z ) = p „ X „ ( z ) + U( z)
www.FreeLibros.me
(5-113
Capítulo 5
341
Problemas de ejemplo y soluciones
Asimismo la ecuación (5-113) se puede escribir como
Y(z) = b0U(z) + CiXi(z) + c2X 2(z) + ••■ + c„X„(z)
(5-116)
Las transformadas inversas; de las ecuaciones (5-115) y (5-116) se convierten en x, (k + 1) = pix¡(k) + u(k)
x2{k + 1) = p 2x2(k) + u(k)
(5-117)
x„(k + 1) = p nxn{k) + u(k) y ( k ) = Cix^k) + c2x2{k) + ■•• + c„x„(k) + b0u(k)
(5-118)
Al volver a escribir la ecuación de estado y la ecuación de salida en forma de ecuaciones matriciales. se obtienen las ecuaciones (5-109) y (5-110). Problema A-5-4 (Método de programación de expansión en fracciones parciales) transferencia pulso definido por
Considere el sistema con función de
Y(z) = b0z n + ¿ . z " '1 + ■■■ + bn U(z) z" + ai z " '1 + ■■■+ a„ Suponga que el sistema incluye varios polos del orden m en z = p, y que todos los demás polos son distintos. Demuestre que este sistema puede representarse por la siguiente ecuación de estado y por la siguiente ecuación de salida: Xy(k +
1
1) "
x2(k + 1)
0
xm(k + 1)
0
0
xm+l{k + 1)
0
0
x„(k + 1)
0 0
■• 1 ••
0
0 0
0' 0
0
• • Pi
0
0
0
■■
Pm+y
0
0
0
0
0 • • 0
0
p
o' 0
■
x2(k) +
1
xm+i(At)
1
x„(k) _
1
u(k)
(5-119)
Xy ( k )
y(k) = [c, c2
Cn
x2{k)
+ b0u(k )
(5-120)
x„(k) Solución
Dado que la función de transferencia pulso del sistema se puede escribir en la forma
Y(z) U(z)
baz" + b i z"~' + •■• + b„-¡ z + b„ (z - py)m(z - pm+,)(z - p m+2) •••(z - p n) — bn +
(bi - al bo)z”~1 + (b2 - a2bg)zn~2 + •■■+ (b„ - a„b0) (z ~ Pi)m(z ~ Pm*y)---{z ~ p„)
= ba +
CI (z - P¡r
(z -
p ■)"
z-p i (5-1 21)
Z
Pm + 1
Z
p m +2
z
-
Pn
www.FreeLibros.me
342
Análisis en el espacio de estado
Capítulo 5
se obtiene
Y(z) = b0 U(z) + — C‘ - U(z) + ; (z -/A)
°2 , t/(2) +
(z - p i)
•••+ - * = - t/(z) z - /7l
+ Cm+1 V{z) + — ™+2 -U(z) + ■■■ + - C— U{z) z - p„+l z - pm+2 z - p„ Las primeras m variables de estado X,(z), X 2(z),
(5-122t
. . ., X„,(z) se definen mediante las ecuaciones
X M ~ 7 r r j r uu ~ (z - p ,)"- '
(5-123»
X m(z) = — — U(z) z ~ Pi y las n - m variables de estado restantes A„,+,(z), X m+2(z ),. . ., X„(z) se definen mediante las ecuaciones 2fm+1(z) = --- ---- U(z) 2
P m+1
X m+2(z) = --- ^--- t/(z) z - p m+2
2f„(z) = 7 ^
(5-124)
í/(z)
Observe que las m variables de estado definidas por la ecuación (5-123) están relacionadas una con la otra, mediante las ecuaciones siguientes: * .(z ) 1
X 2(z)
z - p¡
X 2{z) 2f3(z)
1 z - p,
2fm-.(z) X„(z )
1 z-p,
(5-125)
Al tomar las transformadas inversas z de toda la ecuación (5-125), la última ecuación de la ecuación (5123) y toda la ecuación (5-124), se obtiene
x,(A:
+1) = p,x¡{k ) + x2(k)
x2(k
+1) = p i x 2(k) + x3(k)
r™-i (k
xm(k
: +1) = p i x m-i(k) + xm{k) +1) = p \x m{k) + u(k)
www.FreeLibros.me
(5-126)
'ulo 5
343
Problemas de ejemplo y soluciones
Xm+t(k + 1) = p m+,xm+I(k) + u(k)
x n(k + 1) = p„x„{k) + u(k) La ecuación de salida dada por la ecuación (5-122) se puede volver a escribir como sigue: Y(z) = c,jr,Cz) + c2X 2(z ) + ■•• + cmX m{z) + cm+1X m+i{z) + cm+2X m+2(z) + ■■■+ c„X„(z ) + b0U(z) Al tomar la transformada inversa z de esta última ecuación, se obtiene
y(k) = c^x^k) + c2x2(k) + ■■■+ cmxm(k) + cm+, xm+,{k) + cm+2xm+2(k) + ••• + c„x„(k) + b0u(k )
(5-127)
Al volver a escribir las ecuaciones (5-126) y (5-127) en la forma estándar matricial, se obtienen las ecuaciones (5-119) y (5-120), respectivamente. Problema A-5-5 Utilizando el método de programación anidada (refiérase al problema A-5-2), obtenga la ecuación de estado y la ecuación de salida para el sistema definido por
Y(z) __ z "1 + 5z~2 U(z) 1 + 4z '1 + 3z-2 A continuación dibuje un diagrama de bloque para el sistema, que muestre todas las variables de estado. Solución
La función de transferencia pulso dada se puede escribir en la forma Y (z) = z ~\ U(z ) - 4Y(z) + z-‘[5í/(z) - 3Y(z)]}
Defina ■Jf,(z) = z~l[U(z) - 4Y(z) + X 2(z)]
X 2(z) = z ‘[5f/(z) - 3Y(z)] Y(z) = X,(z) Entonces se obtiene zA j(z) = -4 X,(z) + X 2(z) + U(z)
z X2(z ) = - 3 X t(z) + 5U(z) La ecuación de estado puede por tanto estar dada por
x t(k + 1) x2(k + 1)
-4 -3
1 0
xi (k) x2(k)
u(k)
\ la ecuación de salida se convierte en >(*) = [!
xi (k)
0] x2(k)
La figura 5-3 muestra el diagrama de bloques para el sistema definido por las ecuaciones en el espacio de estado. La salida de cada elemento de retraso constituye una variable de estado. f^iolema A-5-6 Obtenga una representación en el espacio de estado del sistema mostrado en la figura 5-4. El período de muestreo T es de 1 segundo.
www.FreeLibros.me
344
A n á l is i s e n e l e s p a c i o d e e s t a d o
Cae
-j
u{k)
Figura 5-3
Solución
Diagrama de bloques para el sistema considerado en el problema A-5-5.
Primero se obtendrá la transformada z de la función de transferencia de la trayectoria dirá 1- e
G (z ) = Z
s
1
1
s(s + 1)
s (s + 1)
0 .3679(z + 0.7181) (z - l) ( z - 0.3679)
l.uego se puede obtener fácilmente la función de transferencia pulso en lazo cerrado, Existen m formas para obtener ia representación en el espacio de estado para un sistema como éste, tal y corr» analizó en la sección 5-2. Pn este problema se mostrará otro método, basado en ia modificador 4 diagrama de bloques. G(z) se expande en fracciones parciales: G (z)
1 1
0.6321 z - 0.3679
z “‘ 1 - z “'
0 .6 3 2 1 z~ ‘ 1 - 0 .3 6 7 9 Z '1
La figura 5-5 muestra el diagrama de bloques para el sistema. Se escoje la salida del elemento de retn unitario como una variable de estado, como se muestra en la figura 5-5. Entonces se obtiene
www.FreeLibros.me
Ir r b u lo 5
34 5
P r o b l e m a s d e e je m p l o y s o lu c io n e s
Figura 5-5
Diagrama de bloques modificado para el sistema mostrado en la figura 5-4.
zXx(z) = X\ (z ) - [* ,(z ) - 0.6321Z2(z)] + U{z) z X 2(z) = 0.3679X 2(z) - [X ,(z ) - 0.63213G(z)] + U(z) y (z ) = AT,(z) - 0.6321Jf2(z) de las cuales se obtiene
x,(k + 1) = 0.6321x2(;fc) + u(k) x2(k + 1) = -Xx (k) + x2(k) + u(k) y(k) = Xl(k) - 0.6321x2(k) es decir Xv i (tz k -i+ x 2( k +
i 'i I 1) 1)
T 0 n 0.6321 n ¿ n i l l Xx ~ (r/,\l k) -1 1 x 2( k )
y(k) = [1 -0.6321]
l~11 u(k) 1
x t(k) x2(k)
P^iblema A-5-7 Obtenga la representación en el espacio de estado del siguiente sistema con función de transferencia pulso:
Y(z) U(z)
5 (z + l ) 2(z + 2)
L se el método de programación de expansión en fracciones parciales. También obtenga los valores iniciales de las variables de estado en términos de v(0), v (l) y>’(2). A continuación dibuje un diagrama de bloques para el sistema. Solución Yaque se necesitan los valores iniciales de las variables de estado en términos dey(0),y(l) y ;.r 2). se modificará ligeramente el método de programación de expansión en fracciones parciales presen tado en la sección 5-2. Se expanden Y(z)/U(z), z)\z)IU(z) y z2)'(z)/U(z) en fracciones parciales como
www.FreeLibros.me
346
A n á lis is e n e l e s p a c io d e e s t a d o
Y(z) U(z) zY(z) U(z)
5 (z + 1)2
Y(z) U(z)
-5
10
10
z +1
z +2
5
10
1 (z + l ) 2
-10
1 z +1
1 z +2 Ahora se definen las variables de estado mediante la ecuación siguiente:
L
z 2Y (z) U(z) J
5
15 20 + z +1 ' z +2
5 - 5
zY(z) U(z)
+■
z +1 ' z +2
(z + 1)2
z 2Y(z) U(z) Entonces se tiene
5
5 (z + 1)2
C a p it u le !
5
" W
-15
20
1
1
U(z )
(z + l ) 2
Xz(z) U(z )
Z + 1
1
X 3(z)
L«/(2)J
z
1 +2
Así, las variables de estado X¡(z), X2(z) y X}(z) están relacionadas con Y(z), zY(z) y z2Y(z) como sigue
5 -5 5 ~Xx (z)~ Y(z) ' zY(z) = -5 10 -10 Xi(z) z 2Y(z) 5 -15 20 X 3(z) De la ecuación (5-128) se obtiene (z + i ) 2jr,(z ) = u(z) (z + l ) * 2(z) = U(z)
(z + 2 )X 3( z ) = U(z) Si observamos que (z + l)Xi(z) = X 2(z) se obtiene
zXi(z) = - Z ,(z ) + X 2(z) z X 2(z) = - X 2{z) + U{z) z X 3(z) = - 2 X 3( z ) + U(z) La salida Y(z) está dada por la ecuación Y(z) = 5* , ( z ) - 5 X 2( z ) + 5 X 3(z )
www.FreeLibros.me
(5-129|
:>tulo 5
347
P r o b l e m a s d e e je m p l o y s o lu c io n e s
En consecuencia, se tienen las ecuaciones en el espacio de estado como sigue: X i(k
+ 1) = -x¡ (k) + x2(k)
x2(k + 1) = - x 2(k) + u(k) x3(k + 1) = -2 x3(k) + u(k) y( k ) = 5Xi(k) - 5x2(k) + 5jc3(A:) es decir
Xi(k + 1) '- 1 1 0' Xi (k) 0 x2(k) x2(k + 1) = 0 -1 x3(k + 1) 0 0 -2 x3(k)
+
'0 ' 1 u(k ) 1
x,(k) y(k) = [5 -5
5] x2(k)
x3{k) Los datos iniciales se obtienen mediante el uso de la ecuación (5-129), como sigue -1 ' 5 - 5 5' r 7 (0 )i [■*.(0)1 *2(0) = -5 10 -10 7(1) 5 -15 20 *3(0) 7(2) 2 i5 U0 y(0) 5 2 3 i 5 5 5 7(1) 1 2 1 7(2) 5 5 5 El diagrama de bloques para este sistema se muestra en la figura 5-6. Problema A-5-8 Obtenga una representación en el espacio de estado del siguiente sistema con función de transferencia pulso, tal que la matriz de estado sea diagonal: y (z ) = z3 + 8z2 + 17z + 8 (z + l)(z + 2)(z + 3)
U(z)
5' a continuación obtenga el estado inicial x(0) en términos de y(O), v(l), y(2) y u(0), «(1) u(2). Solución Primero se dividen los numeradores de los lados derechos de Y(:)/U (:), : ) '( : ) / U (:) y ~ }'(:)/ L'(z) entre los denominadores respectivos y se expanden los términos restantes en fracciones parciales, como sigue:
Figura 5-6
Diagrama de bloques para el sistema considerado en el problema A-5-7.
www.FreeLibros.me
34 8
A n á lis is e n e l e s p a c io d e e s t a d o
U{z)
2+ 1
2+ 2
Cap
z+ 3
zY(z) 1 4 3 —2 + 2 + U(z) Z + l 2+ 2 2+ 3 z 2Y(z) 1 = z2 + 2z - 6 + U(z) 2 + 1 2+ 2 2+ 3 Rescribiendo, se tiene
Y(z) - U(z) _ U(z) zY(z) - zU(z) - 21/(2)
1
2+ 1
1 2+1
1/( 2 )
z 2Y(z) - z 2U(z) - 221/(2) + 61/(2) 1/( 2 )
+ ^ 2+ 2+ 2
4 2+ 2
1 2+1
1
2+ 3
3 2+3
8 2+ 2
9 2+ 3
es decir
Y(z) - 1/(2 )
-1
1/(2)
zY(z) - zU(z) - 21/(2)
1
1/(2) 22Y(2) - 22í/(2) - 22l/(2) + 61/(2)
L
-1
J
2
1
-4
-3
8
9
1 2 +1
1 2+ 2 1 _2 + 3_
Las variables de estado X¡(z), X2(z) y X 3(z) se definen de la siguiente manera:
Xi l z) 1 1/(2)
1 2 +1
^2(Z) M(2)
z +2
1
(5
*3(2)
1
L ^ )J
_2 + 3,
Entonces se tiene r
- 1/(2 ) 1 '- 1 - 21/(2) - 21/(2) = 1 22Y(2) - 22í/(2) - 221/(2) + 61/(2) -1 y (z )
2 Y (z )
2 -4 8
Observe que la ecuación (5-130) se puede escribir en la forma
zX,(z) = - X x{z) + 1/(2 ) z X2(z) = -2X 2(z) + 1/(2 ) 2X 3( 2 ) = - 3X 3( 2 ) + 1/(2 ) de la que se obtiene
Xi (k + 1) = - x , (le) + u{k) x2{k + 1) = - 2 x 2(k) + u(k) x2(k + 1) = - 3 x 3(k) + u(k )
www.FreeLibros.me
r -3 9
X 2(2) ^3(Z)
(5
_ - o í t u lo 5
349
P r o b l e m a s d e e je m p lo y s o lu c io n e s
La salida )'(-) está dada por
Y(z) = - X , ( z ) + 2X 2(z) + X 3(z) + U(z) es decir
y(k) = —x-i (k) + 2x2(k) + x3(k) + u(k) En notación matricial. las ecuaciones en el espacio de estado se convierten en
Xi(k + 1) '- 1 0 0' xi(k) x2(k + 1) = 0 -2 0 x2(k) x3(k + 1) 0 0 -3 x3(k) x l(k) y(k) = [- 1 2 1] x2(k) x3(k)
"1"
+ 1 u(k) 1
+ « (* )
Los datos iniciales se obtienen a partir de la ecuación (5-131) como sigue: *,(0) •*2(0) *3(0)
=
=
'- 1 2 1 -4 - 1 8 -3u
1 -3 9
J(0 ) - «(0) y ( l ) - «(1) - 2u(0) y(2) - u{2) - 2w(l) + 6u(0)
-52 -Al 2 -32 -2 -A2 1 1
3
2
y( 0) - «(0) y ( l ) - «(1) - 2«(0) i y{2) - u(2) - 2u (l) + 6m(0) 2
La figura 5-7 muestra el diagrama de bloques para el sistema presente.
X, {k)
- € H
u{k)
x2(tc)
W*)
■ € H
•€H Figura 5-7
x3(Ar)
Diagrama de bloques para el sistema considerado en el problema A-5-8.
www.FreeLibros.me
350
A n á lis is e n e l e s p a c io d e e s t a d o
Problema A-5-9 Sea A una matriz de n x n y sea su ecuación característica IAI - A| = A" + fli A " '1 + • • • + «„_! A +
C a p ít u l o
|
= 0
Demuestre que la matriz A satisface su ecuación característica, o que A ” + ai A " 1 + ••• + a„_i A + a„ I = 0
(Este es el teorema Cayley— Hamilton.) Solución
Primero se observa que adj(AI - A ) es un polinomio en A de grado n - 1. Esto es adj (A I - A ) = B i A"-1 + B 2A " '2 + ••• + B „ , A + B „
donde B, = I Observe también que (A I - A ) adj (A I - A ) = [adj (A I - A )](A I - A ) = [AI - A|I
Por tanto, se obtiene [AI — A|I = IA " + ai IA " ' + ••■+ a„-i IA + a „ I = (A I - A )(B i A"” 1 + B 2A"^2 + ••• + B „_ ,A + B „ ) = (B , A” ' 1 + B 2A"~2 + ••• + B „_ ! A + B „ ) ( A I - A )
De esta ecuación se ve que A y B,(z = 1 ,2 ,...,« ) conmutan. Por tanto, el producto de (AI - A ) por adj(AI - A ) se convierte en cero si cualquiera de éstos es cero. Si A se escribe en lugar de A en esta última ecuación, entonces claramente AI - A se convierte en cero. Por tanto, A" + ai A " ' + ••• + a„~i A + a„ I = O
Lo que prueba el teorema Cayley— Hamilton. Problema A-5-10
En referencia al problema A-5-9, se ha demostrado que cada matriz A de n * n satisface su propia ecuación característica. No obstante, la ecuación característica no es la ecuación escalar de grado mínimo que A puede satisfacer. El polinomio de grado mínimo que tiene A como raíz se conoce como polinomio mínimo. Es decir, el polinomio mínimo de una matriz A de n x n se define como el polinomio de grado mínimo:
m
tal que
El polinomio mínimo juega un papel importante en el cálculo de los polinomios de una matriz de n * n. Supongamos que d(A), un polinomio en A, es el máximo común divisor de todos los elementos de adj(AI - A). Demuestre que si el coeficiente del término de mayor grado en A de d(k) se escoge como 1 entonces el polinomio mínimo (j>(A) está dado por
4>{X)
|AI - A|
d{k)
www.FreeLibros.me
: 5
351
P r o b le m a s d e e je m p l o y s o lu c io n e s
tsolución
Por la suposición, el máximo común de la matriz adj(AI - A) es d(A). Por tanto adj (A I - A ) =
conde el máximo común divisor de los n2 elementos (que son funciones de A) de B(A) es la unidad. En ■:sta de que (A I - A ) adj (A I - A ) = ¡AI - A|I
obtiene d (A )(A I - A )B (A ) = |AI - A|I
(5-132)
c; lo cual se encuentra que JAI - A| es divisible entre d(A). Si |AI — A| = d(A)i/r(A)
(5-133)
ñntonces el coeficiente del término de mayor grado en A de ifi(X) es la unidad. De las ecuaciones (5-132) 5-133) se tiene (A I - A )B (A ) = i/r(A)I
-or tanto.
iKA) = o jrserve que i//(A) se puede escribir como sigue t« A ) = g (A )0 (A ) + a (A )
c: nde a( A) es de menor grado que (A). Dado que tj/(A) =Oy d>(A) =O, se debe tener que a(A) =0. Dado _.e ó(A) es el polinomio mínimo, a(A) debe ser idénticamente cero, esdecir «A(A) = g(A)
I -serve que, debido a que <(>(A) = O, se puede escribir <¿>(A)I = (A I - A )C (A )
-or tanto. (A)I = g (A )(A I - A )C (A )
se obtiene B (A ) = g (A )C (A )
observe que el máximo común divisor de los n2 elementos de B(A) es la unidad. Por tanto g ( A) = 1 l e aqui que.
tAI - A|
d ( A)
Hay que señalar que el polinomio mínimo 4>(A) de una matriz Aden x n se puede determinar por : procedimiento siguiente: 1. Forme la adj(AI - A) y escriba los elementos de la adj(AI - A) como polinomios fáctorizados en A.
www.FreeLibros.me
352
A n á l is i s e n e l e s p a c i o d e e s t a d o
C a p ít J O
2. Determine d(A) como el máximo común divisor de todos los elementos de adj(AI - A). Selecoa el coeficiente del término de mayor grado en A de d( A) como 1. Si no existe divisor coma ¿(A )= l. 3. El polinomio mínimo (A) entonces está dado como |AI - A| dividido entre ef(A). Problema A-5-11 Si una matriz Aden * n tiene n valores propios distintos, entonces el polinomio mínimo de A es idénái al polinomio característico. Asimismo, si los diversos valores propios de A están enlazados en una cad na de Jordán, el polinomio mínimo y el polinomio característico son idénticos. Si, sin embargo. « diversos valores propios de A no están enlazados en una cadena de Jordán, el polinomio mínimo es 4 grado menor que el polinomio característico. Utilizando como ejemplo las matrices A y B que siguen, verifique los enunciados anteriores i relación con el polinomio mínimo, cuando se relacionan varios valores propios. '2 0 0' B = 0 2 0 0 3 1
1 --O
‘2 i 4 A = 0 2 0 3 1 Solución
Primero considere la matriz A. El polinomio característico está dado por
IAI - A| =
-4 0 A-1
A- 2 -1 0 A- 2 0 -3
(A - 2)2(A - 1)
Así, los valores propios de A son 2, 2 y 1. Se puede demostrar que la forma canónica Jordán de A es 2
1 0'
0
2 0
0
0 1
y los valores propios múltiples están enlazados en la cadena Jordán como se muestra. (Para obterwl forma canónica Jordán de A, refiérase al apéndice A.) Para determinar el polinomio mínimo, primero se obtiene adj(Al - A). Éste está dado por adj (AI - A) =
(A - 2)(A - 1) 0 0
(A + 11) (A - 2)(A - 1) 3(A - 2)
4(A - 2) 0 (A - 2)2
Observe que no existe un divisor común de todos los elementos de adj(AI - A). Por tanto, d( Al Entonces, el polinomio mínimo <£(A) es idéntico al polinomio característico, es decir
=
(A) = |AI - A| = (A - 2)2(A - 1) = A3 — 5A2 + 8A - 4 Un cálculo sencillo prueba que 5A2 + 8A - 41 = 0 pero 3A + 21 + 0 Por tanto, se ha demostrado que el polinomio mínimo y el polinomio característico de esta matriz A ¡ los mismos.
www.FreeLibros.me
. o 5
353
P r o b l e m a s d e e je m p l o y s o lu c io n e s
A continuación, considere la matriz B. El polinomio característico está dado por |AI — B| =
A- 2 0 0 0 A- 2 0 = (A - 2)2(A - 1) 0 -3 A - 1
7n cálculo simple revela que la matriz B tiene tres vectores propios, y que la forma canónica Jordán de B está dada por 2 0 0
0 0' 2 0 0 1
Por tanto, los valores propios múltiples no están enlazados. Para obtener el polinomio mínimo, primero >e calcula adj(AI - B): adj (AI - B ) =
(A - 2)(A - 1) 0 0
0 (A - 2)(A - 1) 3(A - 2)
0 0 (A - 2)2
te lo cual es evidente que
d( A) = A ir tanto.
4>{A) =
d{ A)
A- 2
ra verificar, se calcula 4 0 0 2 0 0 1 0 0 0 0 0
.1)
(5-134)
r Je o,. a;, . . . . amson los coeficientes del polinomio mínimo = Am + a, A” ' 1 +
J" ttm- 1A "E (X n
-ego. obtenga la inversa de la matriz A siguiente: ,1 2 A = ' 3 -1 1 0 '■olución
-2 -3
El polinomio mínimo c/>(A) de una matriz no singular A . se puede escribir como sigue:
www.FreeLibros.me
354
A n á lis is e n e l e s p a c io d e e s ta d o
C a p ít o o
4>(A) = Am + fli Am ' + •••+ am_ i A + amI - 0 donde amA 0. Por tanto, ■(Am + fli Am ' + •••+ am~2A2 + am-i A)
I
Premultiplicando por A ‘, se obtiene 1
(A m 1 + ai Am
+ ••• + am_2A + am_i I)
que es la ecuación (5-134). Para una matriz dada A, se puede dar adj(AI - A) como sigue: ( A2 + 4A + 3 2A + 6 3A + 7 A2 + 2A - 3 A+1 2
adj (A I - A)
-4 -2A + 2 A2 - 7
Claramente, no existe un divisor común d(k) de todos los elementos de adj(AI - A). Por tanto d{A) = 1. 8 consecuencia, el polinomio mínimo
d( A)
= lAI - Al
Así, el polinomio mínimo
at = 3,
a2 = -7,
a3 = -17
La inversa de A se puede obtener entonces a partir de la ecuación (5-134) como sigue: 1 1 A = - - ( A 2 + ai A + a21) = — (A2 + 3A - 71)
a3
17
7 0 -2 7 -2 2
6 _
17 3 17
Cf '1 0 0' -2 -7 0 1 0 -3 0 0 1
-4 2 -7
6 3 2
17
-4 '1 2 8 + 3 3 -1 9 1 0
_
4 “ 17 2 17 7 17
2 _ 17 Problema A-5-13 Demuestre que la inversa de zl - G puede estar dada por la ecuación (z l - G)
= adj (z l - G) Izl - G|
I z ^ 1 + Hiz"~2 + H 2z" |zl - G|
www.FreeLibros.me
+ H„_
(5-133
iftu lo 5
355
P r o b l e m a s d e e je m p l o y s o l u c io n e s
donde H , = G + a, I H 2 = G H , + a21
H„_i — GH„-2 + a „ - i l H„ = GH„_! + a„I = 0
y a,, a2, . . ., a„ son los coeficientes que aparecen en el polinomio característico dado por |zl - G| = zn + «i z"~' + a2z"~2 + ■■■+ a„ Demuestre también que
di = - trG a2 = - 1 trG H i
a„ = - - trGH„-! n Para simplificar la deducción, suponga que n = 3. (Se puede fácilmente extender la deducción al caso de cualquier entero positivo n.) Solución
Observe que
(z l - G )(Iz 2 + H ,z + H 2) = z3I - z2G + z 2H, - zGH, + zH 2 - G H 2 = z3I - z2G + z 2(G + a ,I) - zG(G + a ,I) + z[G(G + a j í ) + o2I] - G [G (G + at I ) + a21]
= z3l + a¡ z2l + a2z l + a3l - G3 Qx G2
a2G
(5-136)
d31
El teorema Cayley— Hamilton (vea el problema A-5-9) indica que una matriz G de n x n satisface su propia ecuación característica. Dado que n = 3 en el caso presente, la ecuación característica es |zl - G| = z3 + a, z2 + a2z + n3 = 0 y G satisface la ecuación siguiente: G 3 + d\ G2 + <Í2G + a31 = 0 Por tanto, la ecuación (5-136) se simplifica a ( z l - G ) ( I z 2 + H ,z + H 2) = (z 3 +
a, z 2 + a2z + a3)l =
En consecuencia, I =
(z l - G )(Iz 2 + Hi z + H2) |zl - G|
es decir
que es la ecuación (5-135) en el caso de n = 3.
www.FreeLibros.me
|zl - G |I
356
Análisis en el espacio de estado
C a p iM i
A continuación se demostrará que
«i = - trG a2 = - 1 tr GHi a3 = —i tr GH2 Se transformará G en una matriz diagonal si G involucra n vectores propios linealmente independie* (donde n = 3 en el caso presente) o en una matriz en la forma canónica Jordán si G incluye menos di vectores propios linealmente independiente. Es decir, P 1G P = D = matriz en forma diagonal o bien
S"1 GS = J = matriz en forma canónica diagonal donde las matrices P y S son matrices de transformación no singulares. Como el cálculo que sigue se aplica independientemente de si la matriz G pueda ser transforma en una matriz diagonal o en una matriz en la forma canónica Jordán, se utilizará la notación
T'GT = D donde D representa ya sea una matriz diagonal o una matriz en la forma canónica Jordán, según sea caso. En lo siguiente primero se demostrará que
trG = trD trGHi = trDHi trGH2 = tr DH2 donde
H, = D + «,I H2 = DH, + a2I Entonces se mostrará que
ai = -trD a2 = - \ trDHi a3 =
trDH2
Observe que desde
trAB = trBA se tiene
trT D T 1 = tr (TD)(T~') = tr(T_1)(TD) = trD Observe asimismo que
tr(A + B) = trA + trB Y ahora se tiene
trG = trTDT-1 = trD trGHi = trG(G + a,I) = trG2 + tra1G
www.FreeLibros.me
- p ít u lo 5
357
P r o b l e m a s d e e je m p l o y s o lu c io n e s
= trTD2T_1 + traiT D T 1 = trD2 + tral D = tr(D2 + «iD) = trDHi tr GH2 = tr G(GHi + a2l) = trG[G(G + flil) + a21] = tr (G3 + ai G2 + a2G) = trTD3! 1 + traiTD2T-1 + tra2TDT 1 = trD3 + traiD2 + tra2D = tr(D3 + a, D2 + u2D) = trDH2 Se escribe T ‘ GT = D =
Pi
*
0 0
p2
*
0
p3
0
donde un asterisco significa “ya sea 0 o 1” . Entonces |zl - D| = z3 - {pi + p 2 + p 3)z 2 + (p ,p 2 + p2p3 + p3pi)z - p i p 2p 3 z3 + «i z2 + a2z + a3 donde «i = ~ (p i + P2 + p3)
Ü2 ~ PlP2 + PlP3 + P3Pl o3 = ~ p i p2p 3 Observe que trD = pi + p2 + p 3 = -«i trDHi = trD(D + úql) = trD 2 + tr«iD
= p\ + pl + pl - (p i + p2 + p3)(p i + P 2 + p3) = -2 (p ip 2 + p2p3 + p3p0 = -2 a2 trD H 2 = trD (D H , +
a21)
= tr (D 3 + n ,D 2 + a2D )
= trD 3 + trajD 2 + tra2D = ( p¡ + p l + pl) - (p, + p2 + p3)(p ? + pl + pl)
+ (PiPz + p2p3 + p3p i)(p t + Pz + p3) = 3pip2p 3 = —3a3 Por tanto, se ha demostrado que «i = -trD = - trG
a2 = - \ trÓHi * - j trG H i a3 =
¿trDH a = ■j tr GH2
Problema A-5-14 Considere el siguiente sistema oscilador:
Y(s) U(s)
www.FreeLibros.me
358
A n á lis is e n e l e s p a c io d e e s t a d o
C a p it a l
Obtenga la representación en el espacio de estado en tiempo continuo del sistema. A continuación disciií el sistema y obtenga la representación en el espacio de estado en tiempo discreto. También obtena función de transferencia pulso del sistema discretizado. Solución
Para la función de transferencia dada tenemos
y +
1. xj = —y (O Entonces, se obtiene la representación en el espacio de estado de tiempo continuo siguiente: i,
0
— U)
X2
(0
x,
0
X 2_
+
"o " OI
y = [1 0] La representación en el espacio de estado en tiempo discreto del sistema se obtiene como sigue.! observar que A =
0
(o w 0
B
se tiene
G = eAT = ÍT 'IC sI - A)-1] = ¿ T 1
=
ir
s
—w
OI
s
eos oúT sen coT -sen o>T eos wT
1
I
1 1 - eos o j T sen o j T
eos 0)X sencol 0 -sen aX coscoA. dX 1 (0
Por tanto, la representación en el espacio de estado en tiempo discreto del sistema oscilatorio se convierte* \,((/c + 1)7)" x2((k + 1)7)
eos wT - sen O(oT J1
y(kT) = [1 0]
sen tu7 teos u s i o»7 ü i
x¡(kT) x2(kT) A 2 \ t y~ 1 )
1 — eos (oT u(kT) senW(oT ^ClI l
^ ÍL rT \ X! (kT)
x2(kT)
La función de transferencia pulso del sistema discretizado se puede obtener a partir de la ecuacá (5-60): F ( z ) = C (z l - G ) ~ 'H + D
www.FreeLibros.me
C a p ít u lo
5
359
P r o b le m a s d e e je m p l o y s o lu c io n e s
Si se observa que D es cero, se tiene 2 — cos oír
F(z) = [1 0]
sen uiT
-i
—sentur z - coswT
1 [1 z - 2z costuT + 1
0]
1 - cos o)T sen u T
2 — cos coT
senruT
—sena>T
z — cos 10T
1 — cos <¡)T sentuT
(1 - eos coT)(z + 1) z2 — 22 eos cuT + 1 Por tanto, I V )
=
= (1 - C O S t u D d + 2 - | ) 2 ~ ‘
U(z)
1 - 2
2
1 COS t u r +
2 2
Observe que la función de transferencia pulso obtenida de esta forma es la misma que la obtenida al tomar la transformada z del sistema antecedido por un retenedor de orden cero. Esto es
Y(z) U(z)
1- e
Z
= (1 - z - ’) Z 1 - 2
1 COS
CüT
1 - 22"' cosú>T + z~2 2 ')z 1 1 - 22 1COS tur + z~2
(1 - COS t u r ) ( l +
_
Por tanto, se obtiene la misma expresión para la función de transferencia pulso. La razón de lo anterior es que la discretización en el espacio de estado proporciona un equivalente del retenedor de orden cero del sistema en tiempo continuo. Problema A-5-15 Considere el sistema mostrado en la figura 5-8a). Este sistema implica polos complejos. Es estable pero no es asintóticamente estable en el sentido de Liapunov. La figura 5-8b) muestra una versión discretizada
Lis)
V(s)
i2 s2+4 (a)
UM
/
Sr
UU)
1- e-n s
F(f)
s2 s2+4 hT
Yfz)
(b) Figura 5-8 a) Sistema en tiempo continuo del problema A-5-15; b) versión discretizada del sistema.
www.FreeLibros.me
A n á l is i s e n e l e s p a c i o d e e s t a d o
C a p rt
del sistema en tiempo continuo. El sistema discretizado también es estable pero no es asintóticaa» estable. Suponiendo una entrada escalón unitario, demuestre que el sistema discretizado puede rrx«) oscilaciones ocultas cuando el período de muestreo T adopta cierto valor. Solución
La respuesta del sistema en tiempo continuo que se muestra en la figura 5-8a) es
Y(s) =
’
1
s s2 + 4
s +4s
Por tanto.
y(t) = eos 21 [Observe que el valor promedio de la salida>>(/) es cero y no la unidad.] La respuestay (t) en functca aparece en la figura 5-9a).
t
y(kT) 1
0
2n
3 tr
4ír
kT
-1 (b)
10 Figura 5-9 a) Respuesta en escalón unitarioy'(Z) del sistema en tiempo continuo mostrado en la figura 5-8a)\ b) gráfica dey(kT) en función de kT del sistema discretizado que se presenta en la figura 5-86) cuando T - j ir segundos; c) gráfica dey(kT) en función de kT del sistema discretizado cuando T= v segundos. (F.n el diagrama se muestran las oscilaciones ocultas.)
www.FreeLibros.me
Capítulo 5
Problemas de ejemplo y soluciones
361
La función de transferencia pulso del sistema discretizado mostrado en la figura 5-186) es
Y(z) U(z)
s2 + 4
= (1 - z ~' )Z
s2 + 4
1 - z 1eos 2T
= (1 - z-'h ’1 - 2z 1cos2r + z 2 Por tanto, la respuesta al escalón unitario se obtiene como sigue: Y (r\
( )
(1 ~ Z - ‘ ) ( l ~ I ' 1 C O S 2 D
1 - 2Z-1 cos2T + z '2
1
1 - z '1
1 - z~‘ eos2T 1 — 2z_l eos2T + z-2 La respuesta y(kT) se hace oscilatoria si T= mr segundos (n = 1, 2, 3 ,...). Por ejemplo, la respuesta del sistema discretizado cuando T= | ir segundos se convierte en:
Y(z) =
1 - = 1 - z' 2 + z“4 - z' 6 + 1+ z
Por tanto,
y(0) = 1 y(T) = 0 y(2T) = -1 y(3T) = 0 y{4 T) = 1 Una gráfica de y{kT) en función de kT cuando T= j- tt segundos aparece en la figura 5-96). Claramente, la respuesta es oscilatoria. Si el período de muestreo T fuera de t t segundos, es decir T = t t , entonces
Y(z) =
(1 - z-]) ( l - z-1)___ 1_________ 1 1 - z' 1 - z~
= 1+z La respuesta y(kT) para k = 0, 1, 2, . .. es constante e igual a uno. La gráfica dey(kT) en función de kT cuando T - t t se muestra en la figura 5-9c). Observe que si T= -tt segundos (de hecho, si T= «tt segundos, donde n = 1, 2, 3 ,...) la secuencia de respuesta al escalón unitario se conserva en la unidad. Dicha respuesta puede damos la impresión de qucy(t) es constante. La respuesta real no es constante ya que oscila entre 1y -1. Por tanto, la salida del sistema discretizado cuando T= t t segundos (o cuando T=mr segundos, donde n = 1, 2, 3 ,...,) muestra oscilaciones ocultas. Observe que dichas oscilaciones ocultas (inestabilidad oculta) sólo ocurren para ciertos valores del período de muestreo T. Si se varía el valor de T, estas oscilaciones ocultas (inestabilidad oculta) aparecerán en la salida como oscilaciones explícitas. Problema A-5-16 Aunque el sistema con doble integrador es dinámicamente simple, representa una clase de sistema im portante. Un ejemplo de sistema con doble integrador es el sistema de control de altitud de un satélite, que se puede describir como JO = u + v
www.FreeLibros.me
362
A n á l is i s e n e l e s p a c i o d e e s t a d o
C a p ít u lo
5
donde J es el momento de inercia, 6 es el ángulo de altitud, u es el par de control, y v es el par de perturbación. Considere el sistema con doble integrador en ausencia de entrada de perturbación. Se define JO= y. Entonces la ecuación del sistema se convierte en
y =k Obtenga una representación en el espacio de estado en tiempo continuo del sistema. A continuación obtenga un equivalente en tiempo discreto. También obtenga la función de transferencia pulso para d sistema en tiempo discreto. Solución
Defina *i = y
x2 = y Entonces la ecuación de estado en tiempo continuo y la ecuación de salida se convierten en o
o
I
X2
f" *— Hi
O
Xl
Xl
+
’ o" 1
_X 2_
u
y = [1 0] El equivalente en tiempo discreto de estos sistemas puede estar dado por
\((k + l)T) = Gx{kT) + Hu(kT) y{kT) = C x ^ r) Las matrices G y H se obtienen de las ecuaciones (5-73) y (5-74). Al observar que A =
l" , 0 0
"o
B=
Y
i
se tiene
e.* r
fl
T
io
i. - T 2 -
H = ^Jg eAXd \ )B
-Ul:
A 1
V = 1
2 T
Por tanto, la ecuación de estado en tiempo discreto y la ecuación de salida se convierten en
- j2xi((k + 1)T) x2((k + 1)T)
=
1 T 'xi(kT) 0 1 x2(kT)
y(kT) = [1 0]
+
2 u(kT) T
xi(kT) x2(kT)
La función de transferencia pulso del sistema en tiempo discreto se obtiene a partir de la ecuación (5-60) como sigue: y (z ) = F(z) = C(zl - G) H + D í/(z)
www.FreeLibros.me
C a p ít u l o 5
363
P r o b l e m a s d e e je m p l o y s o lu c io n e s
- T 2 -
[1
"2 - 1 0] 0
-T "
2 T
2-1
T \ z + 1)
+0
+ z -1) 2(1 - z” 1)2
T2
2(z - l ) 2 ~
Problema A-5-17 Demuestre que la siguiente forma cuadrática es definida positiva: V (x ) =
Solución
10X2 +
4*2 + * 3 + 2*1*2 _ 2*2*3 _ 4*1*3
La forma cuadrática F(x) se puede escribir como sigue:
F(x) = Xr Px =
[*1
*2
*3]
' 10 1 -2
1 4 -1
-2
-1 1
■*2 *3
Al aplicar el criterio de Sylvester, se obtiene
10 > 0 ,
10 1 -2
10 1 >0, 1 4
1 -2 4 -1 > 0 -1 1
En vista de que todos los menores principales sucesivos de la matriz P son positivos, F(x) es definida positiva. Problema A-5-18 Considere el sistema definido por:
x = f (x, t) Suponga que f(0, i) = 0,
para todos t
Suponga que existe una función escalar V(x, i) que tiene primeras derivadas parciales continuas. Si F(x,
t) satisface las condiciones: 1. F(x, t) es definida positiva. Esto es, F(0, í) = 0 y F(x, t) > a(||x||) > 0 para toda x =£ 0 y para toda t, donde a es una función escalar no decreciente continua tal que a(0) = 0. 2. La derivada total V (x, i) es negativa para toda x ^ 0 y para toda t, es decir V (x, t) < —-y(||x||) < 0 para toda x i= 0 y toda t, donde y es una función escalar no decreciente continua tal que y(0) = 0. 3. Existe una función escalar no decreciente continua f3tal que ¡3(0) = 0 y para toda t, F(x, t) < /3(|¡x||). 4. a(||x||) se aproxima al infinito conforme ||x|| aumenta en forma indefinida, es decir
a x
cuando ||x|l
Entonces el origen del sistema, x =0, es uniforme y asintóticamente estable global. (Éste es el teorema de estabilidad principal de Liapunov.) Pruebe este teorema. www.FreeLibros.me
364
Análisis en el espacio de estado
Solución
Cap ítui»
Para probar la estabilidad asintótica uniforme global, se necesita verificar lo siguiente:
1. El origen es uniformemente estable. 2. Cualquier solución está acotada en forma uniforme. 3. Todas las soluciones convergen al origen cuando t —> uniformemente en /„ y ||x0||<8, donde fijo, pero arbitrariamente grande. Es decir, dados dos números reales 5 > 0 y //> 0,existe i número real T{/¿, 5) tal que llxoll S 5 lo que implica que II«Mí; x0, í0)ll ^
Para toda t >t 0+ T{n, S)
donde «Mí; x0, í0) es la solución de la ecuación diferencial dada. En vista de que ¡3es continuo y ¡3(0) = 0, se puede escoger una S(e) > 0 tal que ¡3(8) < a(e) para cualqni e > 0. La figura 5-10 muestra las curvas a(IWI) /3(||x||) y V(x, t). Al observar que
V(4>(í; x0, í0), t) ~ V(x0, í0) = í J'o
x0, í0), r) dr < 0,
t > í0
si ||x0|| < 5, siendo í0arbitrario, se tiene a(e) > /3(8) > V(x0,ío) a
x0, ío), í) ^ a(||
para todos t > t0. Dado que a es no decreciente y positivo, esto implica que ; x0, ío)ll < e,
for t > t0, ||x0|| s 8
Por tanto, se ha demostrado que para cada número real e > 0 existe un número real 8 > 0 tal que ||xj S implica que ||
Figura 5-10
Curvas a(||x||), /3(||x||) y K(x, i)
www.FreeLibros.me
ie 't u lo 5
365
P r o b l e m a s d e e je m p l o y s o l u c io n e s
cualquier 0 < < ||x0¡| y se encuentra una v(¡u) > 0 tal que ¡3(v) < Se denota 6) > 0 el mínimo de la función continua no decreciente y(||x||) en el conjunto compacto v(p) < ||x|| < e(S). Se define
T/ « P(8) „ n T(H,S) = e (p.,5) > 0 Suponga que ||<¿>(r; xu, í0)|| < v sobre el intervalo de tiempo í0< t < t, = l0+ T. Entonces se tiene 0 < a (v ) s V(
como es un valor
||x2|| = IM>(í2; x 0, ío)|| = v
Por tanto. a(||
(5-137)
donde Q es una matriz de n * n definida positiva hermítica (o simétrica real). Pruebe que si la matriz G es estable, entonces una matriz P que satisface la ecuación (5-137) es única y es definida positiva. Pruebe que la matriz P puede estar dada por P = 2 (G*)*QG* Pruebe también que a pesar de que el lado derecho de esta última ecuación es una serie infinita la matriz es finita. Por último, pruebe que si se satisface la ecuación (5-137) mediante matrices definidas positivas P y Q, entonces la matriz G es una matriz estable. Suponga que todos los valores propios de G son distintos y todos los vectores propios de G son linealmente independientes. Solución
Suponga que existen dos matrices P, y P2que satisfacen la ecuación (5-137). Entonces G*P, G - P, = -Q
(5-138)
G *P2G - P 2 = -Q
(5-139)
y
Al sustraer la ecuación (5-139) de la ecuación (5-138). se obtiene
G*PG - P = 0
www.FreeLibros.me
(5-140)
366
A n á lis is e n e l e s p a c io d e e s ta d o
C a p it u le 5
donde
P = P, - P2 Observe que si P A 0, entonces existe un vector propio x, de la matriz G tal que
Px, =A0 Se define el valor propio asociado con la vector propio x, como A,. Entonces
Gx, = A,x, Por tanto, de la ecuación (5-140), se obtiene
G*PGx, - Px, = G*PA,x, - Px/ = (A, G* - I)Px, = 0
(5-141*!
La ecuación (5-141) implica que A'1es un valor propio de G*. Dado que |A,| < 1, se tiene que |A;1[ > 1 Esto contradice la suposición de que G es una matriz estable. Por tanto, P debe ser una matriz cero, o e necesario que P, = P 2 Por tanto, se ha probado la unicidad de la matriz P, que es la solución a la ecuación (5-137). Para probar que una matriz P, que satisface la ecuación (5-137), puede estar dada por P = ¿ (G*)*QG* *=0 se puede volver a escribir la ecuación (5-142) como sigue:
(5-1-1
P = (G*)°QG° + ¿ (G*)*QG* = Q + G* ¿ (G*)‘ QG* *=i
L*-o
= Q + G*PG Por tanto, se satisface la ecuación (5-137). Dado que la matriz Q es una matriz positiva definida, de 1 ecuación (5-142) la matriz P también es positiva definida. Ahora se probará que, aunque la matriz P dada por la ecuación (5-142) es la suma de una < infinita, se trata de una matriz finita. En razón de las suposiciones hechas en el enunciado del proble los valores propios A, son distintos y los vectores propios de G son linealmente independientes. Para i valor propio A, asociado con el vector propio x„ se tiene Gx¿ = A,x, Al usar esta relación, se puede simplificar x* £ (G * )* Q G *
x,. Primero se nota que
x,*(G*)2QG2x, = (x* G*)(G*QG)(Gx,) = A, x* G*QGA, x, = |A,|2(xf G*)Q(Gx,) = |A,|2(A, x*)Q(A, x,) = |A,-|2|A,|2x* Qx,Entonces, al usar ese tipo de simplificación, se tiene x,
2 (G*)*QG* x, = x* Qx, + x* G*QGx, + xf (G*)2QG2x¡ + xf(G*)3QG3x; +
= x* Qx/ + A, A, x*Qx, + |A,|2|A,|2x* Qx, + |A,-|4|A,|2x* Qx,+ ••• = x* Qx,(l + |A,|2 + |A,|4 + |A,|6 + •••) x* Qx,
1 i - iA,r
www.FreeLibros.me
:c ’ j l o 5
367
P r o b le m a s d e e je m p l o y s o lu c io n e s
Esto prueba que £ (G*)* QG* es una matriz finita. Finalmente, se probará que si la ecuación (5-137) es satisfecha por las matrices definidas positivas P y Q, entonces la matriz G es una matriz estable. Se define el vector propio asociado con un valor propio A, de G como x¡. Entonces Gx, = A,x, Premultiplicando ambos lados de la ecuación (5-137) por x” y postmultiplicando ambos lados por x„ se obtiene
o bien (|A,|2 - l)x * Px, = -x f Qx, En vista de que tanto x‘ Px, y x'Qx, son definidas positivas, se tiene |A,|2 - 1 < 0 o bien |A,| < 1 Por tanto, se ha probado que la matriz G es una matriz estable. Las pruebas y deducciones presentadas aquí se pueden extender al caso en el que la matriz G incluye valores propios múltiples y vectores propios múltiples. Problema A-5-20 Considere el sistema
x(k + 1) = H(x(Ar))x(Ar) Suponga que existen constantes positivas c,, c2, . . ., c„ tales que (1)
para toda x
( 2)
para toda x
o bien
Demuestre que en cualquiera de estos casos H(x)x es una contracción para toda x y por tanto el estado de equilibrio del sistema es asintóticamente estable global. Solución
En el caso 1, la norma se define mediante IIx|j = max{c,|x,|}
Entonces
www.FreeLibros.me
368
A n á lis is e n e l e s p a c io d e e s t a d o
s max
C a p ít u lo
5
2 J |*Í>(X)| U-i w
lo que verifica que H(x)x es una contracción. En el caso 2, la norma se define mediante 11*11 = 2 el*,I Entonces l|H(x)x|| = 2 c, 2 hii(x)Xj i-1 /-i s 2 f 2 t= l W
IM
x )l
•el*,|
y - 1
< max
*2 CI*/ | < 2 C;I*/I /-l >-1
i
que muestra que H(x)x es una contracción. Ahora considere una función escalar V(x) = ||x||. Claramente, F(x) = ||x|| es positiva definida >
AV(x(k)) = V(x(k + 1)) - V(x(k)) = ||H(x(*))x(*)|| - l|x(Ar)S| < 0 y
A E(0) = 0 Así, AF(x) es definida negativa. Por tanto, para el sistema considerado F(x) = ||x|| es una función < Liapunov y, en razón del teorema 5-5, el origen del sistema es asintóticamente estable global. Problema A-5-21 Pruebe que si todas las soluciones de
x(k + 1) = G x(k)
(5-H
donde x es un vector n y G es una matriz constante de n x n, tiende a cero conforme k se acerca al infin entonces todas las soluciones del sistema
x(k + 1) = G x(k) + Hu(&)
(5-14
donde H es una matriz constante de n x r, están acotados, considerando que el vector de entrada u(k). ¡ es un vector r, también está acotado. Solución
Dado que u(k) está acotado, existirá una constante positiva c tal que ||u(Ar)H < c,
* = 0 ,1 ,2 ,...
La solución de la ecuación (5-144) está dada por
k x(k) = G*x(0) + 2 G*-' H u(; - 1) y - 1
www.FreeLibros.me
5
369
P r o b l e m a s d e e je m p l o y s o l u c io n e s
Por tanto, k
k
llx(*)H < ||G|n|x(0)|| + c 2 HGH*-'||H|| s IIGfl|x(0)|| + lim c 2 ||G|r'||H|| /=i
*■— /-i
En vista de que el origen del sistema homogéneo dado por la ecuación (5-143) es asintóticamente estable, existen constantes positivas a y b (0 < b < 1) tales que 0 < IIGII* < abk intonces k
1
II 2 abk~>= a— 5— lim 2 IIGII*-' < lim l 1 —b "y-i por tanto, ||x(*)|| < tf||x(0)|| + c||H||«
1- b
Así se ha probado que ||x(A)|| está acotado.
Vn&iem» A-5-22 Considere el sistema definido por las ecuaciones
Xi (k + 1) = 2xi(k) + 0.5x2(,k) — 5 x2(k + 1) = 0.8x2(A:) + 2 Determine la estabilidad del estado de equilibrio. Solución
Se define el estado de equilibrio en la forma
x¡(k) = Xie,
x2(k) = X2,
Entonces este estado de equilibrio puede ser determinado a partir de las dos ecuaciones simultáneas siguientes: Xie
= 2xi,, + 0.5x2* - 5
X2* = 0.8x2, + 2 es decir Xi, =0,
X2, = 10
El estado de equilibrio es, por lo tanto, (0, 10). Consideremos ahora un nuevo sistema de coordenadas con el origen en el estado de equilibrio. Se definen X i(k )
= x,(fc)
x2(k) = x2(k) - 10 Entonces las ecuaciones del sistema se convierten en xt(fc + 1) = 2 íi(k) + 0.5[x2(A) + 10] - 5
x2(k + 1) + 10 = 0.8[x2(A) + 10] + 2 es decir
x t{k + 1) x2(k + 1)
0.5* x,(k) 0 0.8 x2(k)
'2
www.FreeLibros.me
370
A n á lis is e n e l e s p a c io d e e s t a d o
C a p ít u t o
Para determinar la estabilidad del origen del sistema en el nuevo sistema de coordenadas, se aplicaI ecuación de estabilidad de Liapunov dada por la ecuación (5-90): "2
0.5
0 0.8
Pn Pn "2 0.5 p, 2 P22 0 0.8
Pn Pn P12 P22
9 0 0
0.35
donde se escoge Q como una matriz definida positiva con elementos que simplifiquen el cálcd involucrado. Al resolver esta última ecuación en función de la matriz P, se obtiene " -3 5
p 11 Pn p 12 p 22
5" 10
Al aplicar el criterio de Sylvester para la definición positiva, se encuentra que la matriz P no es definí positiva. Por tanto, el origen (estado de equilibrio) no es estable. La inestabilidad del estado de equilibrio puede, naturalmente, determinarse mediante el métoóM la transformada z. Primero se elimina jc2 de la ecuación de estado. Entonces, se tiene
x,(k + 2) - 2M,(k + 1 ) + 1.6x,{k) = 0 La ecuación característica para el sistema en el plano z es z 2 - 2.8z + 1.6 = 0 es decir (z - 2)(z - 0.8) = 0 Por tanto, z = 2,
z = 0.8
Dado que el polo z = 2 está localizado fuera del círculo unitario en el plano z, el origen (estad» equilibrio) es inestable.
PRO BLEM A S Problema B-5-1
Obtenga una representación en el espacio de estado en la forma canónica controlable del siguiente m ma con función de transferencia pulso. Y (z)
U(z)
z~‘ + 2z~2 1 + 4z~’ + 3z“ 2
Problema B-5-2
Obtenga una representación en el espacio de estado en la forma canónica observable del sistema* función de transferencia pulso siguiente.
Y(z) Í7(z)
_____________________ 1 + 6 z-1 + l l z ~ 2 + 6z~
Problema B-5-3
Obtenga una representación en el espacio de estado en la forma canónica diagonal del sistema c g b I ción de transferencia pulso siguiente. Y ( z ) = 1 + 6 z -1 + 8z ~ 2
U(z)
1 + 4 z _I + 3z~2
www.FreeLibros.me
C a p ít u lo 5
371
P r o b le m a s
Problema B-5-4 Obtenga una representación en el espacio de estado del sistema descrito por la ecuación
y(k + 2) + y(k + 1) + 0.16y(fc) = u(k + 1) + 2u(k) Problema B-5-5 Obtenga la ecuación de estado y la ecuación de salida correspondiente al sistema mostrado en la figura 5-11.
Figura 5-11
Diagrama de bloques de un sistema de control.
Problema B-5-6 Obtenga la ecuación de estado y la ecuación de salida del sistema mostrado en la figura 5-12. Problema B-5-7 Obtenga una representación en el espacio de estado del sistema mostrado en la figura 5-13. Problema B-5-8 La figura 5-14 muestra un diagrama de bloques de un sistema en tiempo discreto de varias entradas y varias salidas. Obtenga las ecuaciones en el espacio de estado del sistema considerando x,(k), x-,(k) y Xi(k) tal y como se muestran en el diagrama como variables de estado. A continuación defina las nuevas variables de estado tales que la matriz de estado se convierta en una matriz diagonal. Problema B-5-9 Obtenga la ecuación de estado y la ecuación de salida para el sistema que se muestra en la figura 5-15. Problema B-5-10 Obtenga una representación en el espacio de estado del sistema de control en tiempo discreto que se muestra en la figura 5-16.
www.FreeLibros.me
372
A n á lis is e n e l e s p a c io d e e s t a d o
Figura 5-12
Figura 5-13
C a p it
Diagrama de bloques de un sistema de control.
Diagrama de bloques para el sistema de control del problema B-5-7.
Problema B-5-11 Obtenga una representación en el espacio de estado del sistema siguiente en la forma canónica dia&
Y(z) = z -' + 2z - 2 U(z) 1 + 0.7z '1 + 0.12z“ 2 Problema B-5-12 Obtenga una representación en el espacio de estado del sistema con función de transferencia puls guíente tal que la matriz de estado sea una matriz diagonal:
Y(z) U(z)
1 ____________ _ (z + l)(z + 2)(z + 3)
Asimismo obtenga las variables de estado iniciales X|(0), x2(0) y x3(0) en términos d ey(0),y(l) \
www.FreeLibros.me
Ic p f t u lo 5
373
P r o b le m a s
Figura 5-14
Diagrama de bloques del sistema en tiempo discreto de varias entradas y varias salidas del problema B-5-8.
u(k)
Figura 5-15
Diagrama de bloques de un sistema de control.
www.FreeLibros.me
374
A n á lis is e n e l e s p a c io d e e s ta d o
C a p ^ jt l
Problema B-5-13 Una representación en el espacio de estado dei sistema escalar de ecuaciones en diferencias
y(k + n) + a¡(k)y(k + n - 1) + ••• + a„{k)y(k) = b0(k)u(k + n) + bi(k)u(k + n - 1) + ••■+ b„(k)u(k) donde k = 0, 1 ,2 ,..., puede estar dada por
Xx(k + 1) x2(k + 1)
0 0
1 0
0 0
0 0
xx(k) x2(k)
x„-x (k + 1) x„(k + 1)
0
0
0
1
x„-x{k)
_~a„{k) -a„-x(k) ••• ~a2{k) -ax{k)_ _ * „(* ) .
-y
hx(k) h2(k) u(k) hn-l(k) h„(k)
y(k) = *!(& ) + b0(k - n)u(k) donde i = 1, 2,. . ., n y j = 0, 1.. Determine h^k), h2( k ) , .. ., hn(k) en términos de a,(k) y de También determine los valores iniciales de las variables de estado X|(0), jc2(0), . . ., x„(0) en términ la secuencia de entrada «(0), u(n -1) y la secuencia de salida v(0),_y(l),. . . ,y (n - 11 .
Problema B-5-14 Si el polinomio mínimo de una matriz G den * n involucra sólo raíces distintas, entonces la inversa^ - G puede estar dada por la siguiente expresión: (z l - G )-1 = 2
*=\Z - zk
t:
donde m es el grado del polinomio mínimo de G y Xt son las matrices de n * n que se deten mediante g/(G) = g,(zi)X, + g,(z2)X 2 + ■•• + g,(zm)Xm donde g,(G) = (G - zk iy~',
g,{z) = (z ~ zk)’-'
dondej = 1, 2,. . . , m y zk.es cualquiera de las raíces del polinomio mínimo de G. Utilizando la ecuación (5-145), se obtiene (zl - G )_l para la siguiente matriz G de 2 x 2:
G =
0
0
www.FreeLibros.me
1
-2
C a p ít u l o 5
375
P r o b le m a s
Problema B-5-15 Obtenga la función de transferencia pulso del sistema definido por ¡as ecuaciones
x(k + 1) = Gx(k) + H u(k) y(k) = Cx(k) + Du(k) donde
-a, G =
1 0
C — \b\
- a2 0 1
1 H = 0 0
~«3
0 0
ü\bo\b2
a2bo'.b2
a2bo\,
D = b0
Problema B-5-16 Encuentre la función de transferencia pulso del sistema definido por
x(k + 1) = G x(k) + Hw(/t) y{k) = C x{k) + Du(k) donde
-fll G =
1 0
~a2 0 1 -03
C = [1
H =
0 0
0 0],
V
h2 hi
D = b0
Problema B-5-17 Obtenga la representación en el espacio de estado para el sistema definido en la siguiente matriz de transferencia pulso: r
' K( z) Y2(z )
i 1 - z~l
1 + z '1 ] 1- z 1
r í/>(2)i
1 + z’ 1 i 1 + 0.6z_1 1 + O.óz'1
U2(z)
Problema B-5-18 Considere la ecuación de estado en tiempo discreto X , ( k + 1) x 2( k + 1 )
0 -0.24
1 -1
x¡ (k) x2(k)
Obtenga la matriz de transición de estado 'P(ifc). Problema B-5-19 Considere el sistema definido por
x(k + 1) = G x(k) + Hu(fc) y(k) = C x(k) + Du(fc) donde la matriz G es una matriz estable. Obtenga los valores en régimen permanente de x(k) y y(k) cuando u(k) es un vector constante. Problema B-5-20 Considere el sistema definido por
www.FreeLibros.me
376
A n á lis is e n e l e s p a c io d e e s t a d o
x(k
+ 1) = G x (& )
donde G es una matriz estable. Demuestre que para una matriz Q definida positiva (o semidefinida positiva) 7 = 2 x*(k)Qx(k) k=0 puede darse por 7 = x*(0)Px(0) donde P = Q + G'PG. Problema B-5-21 Determine una función de Liapunov V(x) para el sistema siguiente:
x, (k + 1) x2(k + 1)
1 0.5
-1.2" x, (k) 0 x2(k)
Problema B-5-22 Determine la estabilidad del origen del sistema siguiente en tiempo discreto: X i ( k + 1) x 2( k + 1) x ,(k
1 =
-3
+ 1)
1
3 -2 0
0 -3 0
x ,{k ) x 2{ k )
*3 ( k )
Problema B-5-23 Determine la estabilidad del origen del sistema siguiente en tiempo discreto:
~x¡((k + 1)7’)" x 2((k + 1)T)
eos T -sen T
sen T eos T
Xi(kT) x2(kT)
Problema B-5-24 Considere el sistema definido por las ecuaciones
x,(k + 1) = x,(k) + 0.2x2(k) + 0.4 x2(k + 1) = 0.5X¡(k) - 0.5 Determine la estabilidad del estado de equilibrio.
www.FreeLibros.me
C a p it u le
6 Ubicación de polos y diseño de observadores
INTRODUCCIÓN En la primera parte de este capítulo se presentarán dos conceptos fundamentales de los sistemas de control: controlabilidad y observabilidad. La controlabilidad se ocupa del problema de poder dirigir un sistema de un estado inicial dado, a un estado arbitrario. Un sistema es controlable si puede, mediante un vector de control no acotado, transferir dicho sistema de cualquier estado inicial a cualquier otro estado, en un número finito de periodos de muestreo. (Por lo tanto, el concepto de controlabilidad trata de la existencia de un vector de control que puede causar que el estado del sistema llegue a algún estado arbitrario.) La observabilidad se ocupa del problema de determinar el estado de un sistema dinámico a partir de observaciones de los vectores de salida y de control en un número finito de períodos de muestreo. Un sistema es observable si, con el sistema en el estado x(0), se puede determinar el estado a partir de la observación de los vectores de salida y de control a lo largo de un número finito de periodos de muestreo. Los conceptos de controlabilidad y observabilidad fueron introducidos por R. E. Kalman. Tienen un papel importante en el control óptimo de sistemas multivariables. De hecho, las condicio nes de controlabilidad y observabilidad pueden hacer posible la existencia de una solución completa a un problema de control óptimo. En la segunda parte del capítulo analizaremos el método de diseño de ubicación de polos y los observadores de estados. Observe que el concepto de controlabilidad es la base para solucionar el problema de ubicación de polos y el concepto de observabilidad juega un papel importante para el diseño de los observadores de estados. El método de diseño basado en la ubicación de polos junto con los observadores de estados, es uno de los métodos de diseño fundamentales para los ingenieros de control. Si el sistema es de estado completamente controlable, entonces es posible seleccionar los
www.FreeLibros.me
377
378
U b ic a c ió n
de
p o lo s
y
d is e ñ o
de
o b se rva d o re s
C a p ít u lo
6
polos en lazo cerrado deseados en el plano z (o las raíces de la ecuación característica) y se podra diseñar el sistema que proporcione estos polos en lazo cerrado. E l método de diseño de ubicar los polos en lazo cerrado en localizaciones deseadas en el plano z, se conoce como técnica de diseño de ubicación de polos ; es decir, en dicha técnica se realímentan todas las variables de estado, de tal forma que todos los polos del sistema en lazo cerrado quedan ubicados en las localizaciones desea das. En los sistemas reales de control, sin embargo, quizá no se puedan medir todas las variables de estado, en cuyo caso, no todas las variables de estado estarán disponibles para su realimentación. Para poner en práctica un diseño basado en la realimentación del estado, será necesario estimar las variables de estado no medióles. Esta estimación puede ser efectuada mediante el uso de observado res de estados, mismos que se analizarán en detalle en este capítulo. El proceso de diseño de ubicación de polos de sistemas de control puede dividirse en dos fases. ¡ En la primera, diseñaremos el sistema suponiendo que todas las variables de estado están dispon»-! bles para realimentarse. En la segunda, se diseñará el observador de estados, que estimará todas las variables de estado (o sólo las no medibles directamente), requeridas para realimentar, a fin de com-j pletar el diseño. ] Observe que en el método de diseño anterior, los parámetros de diseño son las localizaciones! de los polos en lazo cerrado deseados y el período de muestreo T. (Este período T determina efecñ-j vamente el tiempo de asentamiento para la respuesta.) I En el análisis de este capítulo supondremos que las perturbaciones son impulsos que se pre-J sentan en forma aleatoria. Su efecto es modificar el estado de sistema. Por lo tanto, una perturbacioJ puede ser representada como un estado inicial. Se supone además que el espaciamiento entre pernw baciones adyacentes es lo suficientemente amplio, para que cualquier respuesta a dicha perturbackJ se haya amortiguado antes de que la siguiente se presente, por lo que el sistema siempre estará lisa! para la siguiente instancia. I Aunque la preocupación de este capítulo se centrará principalmente en el problema de regutal ción, también se analizarán problemas de control. El problema es reducir el vector de error h a s * cero con suficiente velocidad. Tanto en el problema de regulación como en el de control, la form u laei* de la ubicación de polos del diseño se reduce a la determinación de la matriz de ganancia dfl realimentación del estado deseada. El procedimiento para la determinación de dicha matriz del e s a l do es primero elegir localizaciones adecuadas para todos los polos en lazo cerrado, y a con tinu aci* determinar aquella matriz de ganancia de realimentación del estado que dé como resultado e s l* polos en lazo cerrado especificados, de forma que los errores causados por perturbaciones o entrad* de comando puedan ser reducidos a cero con suficiente velocidad. En el estado final del proceso * diseño la realimentación del estado se lleva a cabo mediante el uso de variables de estado e stim ad * mas que con variables de estado reales, mismas que probablemente no están disponibles para * medición directa. Si algunas de las variables de estado son medibles, entonces se pueden u tili^ J esas variables de estado disponibles y utilizar variables de estado estimadas en vez de a q u eB * verdaderamente no medibles. ■ En la última parte de este capítulo se tratará un problema de diseño de seguimiento, que u t i i * el control integral junto con la técnica de ubicación de polos y el observador de estados. Observe < |* en el problema de regulación, se desea transferir al origen el vector de error no cero (debid»H perturbación). En el problema de seguimiento, se necesita que la salida siga a la entrada de com aiW * Note que el sistema de seguimiento debe seguir la entrada de comando y al mismo tiempo r e s o l* cualquier problema de regulación. Como consecuencia, en el diseño del sistema de seguim iento* puede empezar con el diseño de un sistema de regulación y, a continuación, modificar dicho sism^H y convertirlo en uno de seguimiento. ■
www.FreeLibros.me
e c c ió n ó - 2
C o n t r o la b ilid a d
379
Resumen del capítulo. La sección 6-1 presentó una introducción al material que se va a estudiar en este capítulo. La sección 6-2 analiza la controlabilidad de los sistemas de control lineales e invariantes en el tiempo. La sección 6-3 trata la observabilidad de dichos sistemas. La sección 6-4 -evisa transformaciones útiles en el análisis y diseño en el espacio de estados, que se usarán en las acciones restantes de este capítulo. El método básico de diseño en el espacio de estados se presenta en las secciones 6-5 y 6-6. La sección 6-5 presenta el método de ubicación de polos, que es la r'imera fase del diseño. En este método se supone que todas las variables de estado pueden medirse ;■están disponibles para real ¡mentarse. La sección 6-6 analiza la segunda fase del diseño, el diseño :e los observadores de estados, que estiman las variables de estado que realmente no son medibles. _a estimación se basa en las mediciones de las señales de salida y de control. Las variables de estado estimadas pueden ser utilizadas para la realimentación del estado, basado en el diseño de ubicación ce polos. Por último, la sección 6-7 se ocupa de los sistemas de seguimiento y analiza el diseño de estos sistemas; la sección concluye con un ejemplo de diseño.
CO N TRO LA BILID AD Se dice que un sistema de control es de estado completamente controlable, si es posible transferir el sistema de un estado inicial arbitrario a cualquier estado deseado (también un estado arbitrario), en -n período finito. Es decir, un sistema de control es controlable si todas las variables de estado rueden ser controladas en un período finito, mediante alguna señal de control no restringida. Si cualquiera de las variables de estado es independiente de la señal de control, entonces resulta impo sible controlar esa variable de estado y, por lo tanto, el sistema es no controlable. Puede no existir solución a un problema de control óptimo, si el sistema se considera no controlable. A pesar de que la mayor parte de los sistemas físicos son controlables, los modelos matemáticos correspondientes quizás no tengan la propiedad de controlabilidad. Por lo tanto, es necesario saber la condición bajo la cual el sistema es controlable.Veremos másadelante, en la sección 6-5, que el concepto de controlabilidad juega unpapelimportante en la ubicaciónarbitraria de polos en los sistemas de control. Ahora se deducirá esta condición.
Controlabilidad completa del estado para un sistema de control en tiempo discreto lineal e invariante en el tiempo. Considere el sistema de control en tiempo discreto definido por x{(k + 1)T) = Gx (kT) + H u ( k T )
(6-1)
donde
x(kT) = vector estado (de dimensión n) en el A-ésimo instante de muestreo u(kT) = señal de control en el *-ésimo instante de muestreo G = matriz de n * n H = matriz de n x 1
T = periodo de muestreo Suponemos que u(kT) es constante para kT
www.FreeLibros.me
380
U b i c a c i ó n d e p o lo s y d is e ñ o d e o b s e r v a d o r e s
C a p 1*
por intervalos u(kT) definida a lo largo de un número finito de períodos de muestreo de forma que. partir de cualquier estado inicial, el estado x(kT) pueda ser transferido al estado deseado x. períodos de muestreo como máximo. (A l analizar la controlabilidad, el estado deseado x f especificarse como el origen, o x¡ = 0. Vea el problema A-6-1. Aquí, sin embargo, suponemos que es un estado arbitrario en el espacio de n dimensiones, que incluye el origen.) Utilizando la definición que se acaba de dar, a continuación se deducirá la condición pan controlabilidad completa del estado. En vista de que la solución a la ecuación (6-1) es x(rtjT) = G ” x(0) + 2 G " j=0
‘ H u(jT)
= G "x (0 ) + G "- 'H u (0 ) + G "-2H w (r ) + •■• 4- H u((n - 1)T) obtenemos
x( nT) - G" x(0) = [ H : G H : • • • G n l H]
u((n - 1 ))T ) u((n - 2)T) u{O)
Dado que H es una matriz de n * 1, encontramos que cada una de las matrices H, G H ,. . . G" una matriz de n x 1 o un vector columna. Si el rango de la matriz siguiente es n, es decir rango [ H : G H :•••': G " 1H ] = n entonces los n vectores H , G H , matriz
. . . ,
G" “ 1 H pueden abarcar todo el espacio de n dimensiones,
[H :G H .:
:G"
H]
comúnmente se conoce como matriz de controlabilidad. (Observe que todos los estados que p ser alcanzados desde el origen, están abarcados por las columnas de la matriz de controlabif Por lo tanto, si el rango de tal matriz es n, entonces, para un estado arbitrario x(nT) = x f, existirá secuencia de señales de control no acotadas «(0), u(t), . . ., u[(n - 1)7] que satisfaga la ecu (6-2). Por lo tanto, la condición de que el rango de la matriz de controlabilidad sea n da una c* ción suficiente para la controlabilidad completa del estado. Para probar que la ecuación (6-3) es también una condición necesaria para la controlabf completa del estado, se supone que rango [H i G H i
i G ” " 1H ] < n
Entonces, utilizando el teorema de Cayley-Hamilton, puede demostrarse que, para una i arbi G ' H puede expresarse como una combinación lineal de H, G H , . . . , G "~ 1 H. En consecu tenemos para cualquier i rango [ H : G H :. •• ;G ,_1H ] < n y por lo tanto los vectores H, G H , . . . , G '“ 1H no pueden abarcar completamente el espacio dimensiones; y por lo tanto, para algunas xf, no es posible tener x(/7) = x¡ para todas las i. Ent es necesaria la condición dada por la ecuación (6-3). De esta manera, se encuentra que la con de rango dada por la ecuación (6-3) es necesaria y suficiente para la controlabilidad compl estado.
www.FreeLibros.me
S e c c ió n 6 - 2
381
C o n t r o la b ilid a d
Si el sistema definido por la ecuación (6-1) es completamente controlable de estado, enton ces es posible transferir cualquier estado inicial a cualquier estado arbitrario, en a lo más n períodos de muestreo. Observe, sin embargo, que esto es cierto si y sólo si la magnitud de u(kT) es no aco tada. Si dicha magnitud es acotada, pudiera tomar más de n períodos de muestreo. (Vea el problema A-6-2.)
Controlabilidad completa del estado en el caso en que u(kT) es un vector.
Si el sistema está
definido por
\ ( { k + 1)T) = G x ( k T ) + H u {kT) donde x(kT) es un vector de dimensión n, u(kT) es un vector r, G es una matriz de n x n, y H es una matriz de n * r, entonces se puede probar que la condición para la controlabilidad completa del estado es que la matriz de n * nr [H ; G H i
; G " 1H ]
sea de rango n, es decir rango [H i G H i ■••i G "_1 H ] = n
Determinación de la secuencia de control para llevar el estado inicial a un estado deseado.
Si
la matriz [h : g
h
;
:g "
h
]
es del rango n y u(kT) es un escalar, entonces es posible encontrar n ecuaciones escalares linealmente independientes, a partir de las cuales sepuede determinar en forma única una secuenciade señales de control no acotadas u(kT){k = 0, 1, 2 , 1 ) tal que cualquier estado inicial x(0) se transfiera al estado deseado en n períodos de muestreo. Vea la ecuación (6-2). Observe también que si la señal de control no es un escalar sino un vector, entonces la secuen cia de n(kT) no es única. De esta manera existe más de una secuencia para el vector de control a(kT) para llevar el estado inicial x(0) a un estado deseado, en no más de n períodos de muestreo.
Forma alterna de la condición para Ia controlabilidad completa del estado
Considere el
sistema definido por
x((k + 1)T) = Gx (kT ) + Hu (kT)
(6-4)
donde
x(kT) = vector estado (de dimensión ri) en el A-ésimo instante de muestreo u(kT) = señal de control en el A-ésimo instante de muestreo G = matriz de n x n H = matriz den x r
T = período de muestreo Si los vectores característicos de G son distintos, entonces se puede encontrar una matriz de transfor mación P tal que
www.FreeLibros.me
3 82
U b i c a c i ó n d e p o lo s y d is e ñ o d e o b s e r v a d o r e s
C a p í'
A, P
GP =
.0
A
Note que si los valores característicos de G son distintos, entonces los vectores característicos también lo son. Sin embargo, lo opuesto no es cierto. (Por ejemplo, una matriz simétrica real de n con valores característicos múltiples tiene n vectores característicos distintos.) Observe tam que la /-ésíma columna de la matriz P es un vector característico de G asociado con el /-ésimo v característico A, (/ = 1 ,2 ,..., n). Se define
\(h:T) = Px(kT) A l sustituir la ecuación (6-5) en la ecuación (6-4), se obtiene
x((k + 1)7) = P
G P x(kT)) + P-'H u (A :7 )
Defínase /u P
H = F =
fv
fu Í22
fu ■ ■•• h
u
ú
••• ú .
Por lo tanto, la ecuación (6-6) puede escribirse como sigue: ( ( * + 1 )7 ) = A ,f,(7 7 ) + f u Ui(kT) + /i2 u2(k T) + ■■■ + f lrur(kT)
x 2{{k + 1 )7 ) = \ 2x 2(kT) + /21Ul(kT) + f 22u2(k T) + ■■■ + f 2r ur(kT)
x n((k + 1 )7 ) - Anx n(kT) + f nlui(kT) + f n2u2(k T) + ••■+ f nrur{ k T ) Si los elementos de cualquiera de los renglones en la matriz de F n * r son todos cero, ente variable de estado correspondiente no puede controlarse mediante cualquiera de los u,(kTt tanto, la condición para la controlabilidad completa del estado es que si los vectores caracte de G son distintos, entonces el sistema es de estado completamente controlable, si y sólo s i; de los renglones de P~' H tienen elementos cero. Es importante señalar que para aplicar esa ción de la controlabilidad completa del estado, se debe poner la matriz P 1G P de la ecuac; en la forma diagonal. Si la matriz G en la ecuación (6-4) no tiene vectores característicos distintos, en* imposible su diagonalización. En tal caso, podemos transformar G a una forma canónica de si,p orejsm p ío,G tiene valores característicos A,, A,, Ah A4, A„, A6, . . ., A „y posee n - 3 característicos distintos, entonces la forma canónica de Jordán de G es
www.FreeLibros.me
C o n t r o la b ilid a d
383
1
0
Ai 0
1 O i i
>
S e c c ió n 6 - 2
o 1 1 ;
0 '
A, _¡ ¡
a4
í 0
1 a4
0
Aó
i
O
0
Y
Las submatrices de 3 x 3 y de 2 x 2 sobre la diagonal principal se conocen como bloques de Jordán. Suponga que es posible encontrar una matriz de transformación S de modo que
S 'G S = J Si definimos un nuevo vector de estado x mediante x (kT ) = SxíArr)
(6-7)
así. al sustituir la ecuación (6-7) en la ecuación (6-4) resulta
x((Jfc + 1)70 = S '* G S x ( ¿ r ) + S “‘ H u (k T ) ( 6-8 )
= 3\{kT ) + S~l H u (k T )
Las condiciones para la controlabilidad completa del estado del sistema de la ecuación (6-8) pueden entonces enunciarse como sigue: el sistema es de estado completamente controlable, si y sólo si: 1) dos bloques de Jordán en la matriz J de la ecuación (6-8) no estén asociados con valores caracterís ticos iguales; 2) los elementos de cualquier renglón de S 1H, que corresponden alúltimo renglón de cada uno de los bloquesdeJordán no sean todos cero, y 3) los elementos de cada renglón de S "1H, que correspondan a valores característicos distintos, no sean todos cero.
Comentarios. En las condiciones precedentes de la controlabilidad del estado, se ha dicho que en la ecuación (6-8) no deberían estar asociados dos bloques de Jordán de la matriz J con valores característicos iguales. Este punto se desarrolla como sigue. Considere el sistema siguiente, donde los dos bloques de Jordán están asociados con los mis mos valores característicos A,: ■Xi (k + 1) x 2(k + 1) = x 3(k + 1)
Ai L Q _ . o ' xi (k) Ó ! A, T x 2(k) 0 ! o A, x 3(k)
+
Y i u(k) i
Aunque todas las variables de estado están afectadas por u(k). este sistema es no controlable, ya que el rango de la matriz de controlabilidad
[H iG H ':G 2H ]=
1 1 1
A, A, + 1 A,
Ai Aj + 2A( l2 M
es 2. Por lo tanto, al aplicar el criterio anterior correspondiente a la controlabilidad de estado, ningu no de los dos bloques de Jordán de J deberá estar asociado con los mismos valores característicos.
www.FreeLibros.me
384
U b i c a c i ó n d e p o lo s y d is e ñ o d e o b s e r v a d o r e s
C a p ít u i
Ejemplo 6-1 Los sistemas siguientes son de estado completamente controlables: 1.
Xl(k + 1) x2{k + 1) Xi(k x2(k x3(k x4(k xÁk
-1 _ 0
+ 1) + 1) + 1) = + 1) + 1)_
-2 0 0
0 -2
x l(k) x2(k )
1 0 -2 1 0 -2
> (*)] 0
xi{k) x2(k) xÁk) -5 1 x4(k) 0 -5 .X5(k)_
0
0 0 3 0 2
1 0 0 0 1
Ui(k) ui(k )
Los siguientes sistemas no son de estado completamente controlables: 1.
X i ( k + 1)
-1
x 2( k + 1)
0
+ 1)
-2 0 0
X i(k
x 2( k + 1)
2.
x 3( k + 1)
=
x 4( k + 1) x 5( k + 1)
0
0 r*i(/c) -2
-j- 2 0 :«(*)]
x2(k)
1 0 0 1 -2 1 ! 0 -2 i 1 T-5" o -5
xi (k) x2(k) xÁk) x4(k) xÁk)
u2(k )
Condiciones para la controlabilidad completa del estado en el plano z. La condición la controlabilidad completa del estado puede enunciarse en términos de funciones de transfer pulso. Una condición necesaria y suficiente para la controlabilidad completa del estado es que a> presente cancelación en la función de transferencia pulso. Si esto ocurre, el sistema no puede controlado en la dirección del modo cancelado. (Vea el problema A-6-4.) Ejemplo 6-2 Considere la siguiente función de transferencia pulso:
z + 0.2 (z + 0.8)(z + 0.2) Es claro que ocurren cancelaciones en los factores (z + 0.2) tanto en el numerador como en el denc Y(z) U(z)
dor. Por lo tanto, se pierde un grado de libertad. En razón de esta cancelación, este sistema no es de _ completamente controlable. Por supuesto, se puede obtener la misma conclusión escribiendo esta función de transí: pulso en la forma de ecuaciones de estado. Una posible representación de espacio de estados pan sistema es 0 -0.16
x¡(k + 1) x2(k + 1) y(k) = [i
o]
l' -1
xÁk ) xÁk)
1 u(k) -0.8
x, (k) xz(k)
Dado que [H : GH]
1
-0.8
-
0.8
0.64
el rango de [H • GH] es 1. Llegamos por lo tanto a la misma conclusión: el sistema no es de completamente controlable.
www.FreeLibros.me
ie c c ió n 6 -2
C o n t r o la b ilid a d
385
Controlabilidad completa de la salida. En el diseño práctico de un sistema de control, se puede preferir controlar la salida en vez del estado del sistema. La controlabilidad completa del estado no es necesaria ni suficiente para controlar la salida de un sistema. Por esta razón es necesario definir por separado la controlabilidad completa de la salida. Considere el sistema definido por las ecuaciones x( (k + 1)7 ) = G x ( k T ) + H u { kT ) y (k T) = Cx (k T)
(6-9) (6-10)
donde
x(kT) - vector estado (de dimensión n) en el A>ésimo instante de muestreo u(kT) = señal de control (escalar) en el ¿-ésimoinstante demuestreo y(kT) = vector de salida (de dimensión m) en el¿-ésimo instante de muestreo G = matriz de n * n H = matriz de n x 1 C = matriz de m x n El sistema definido por las ecuaciones (6-9) y (6-10) se dice que es de salida completamente contro lable, o simplemente de salida controlable, si es posible tener una señal de control no restringida u(kT), definida a lo largo de unnúmero finito de períodos de muestreo 0
x(nT) = G "x (0 ) + 2 G "-' -1 H w (/7 ) M tenemos que y {nT) = C x (« 7 )
n-1 = C G " x(0) + 2 C G "-'-1H u O T ) i=o es decir, n -1
y (« r ) - C G ” x(0) = E C G ',-'~I H u (;T ) ;=o
= CGn' 1 H«(0) + CG"'2H « (r ) + • • • + CHw((rc - 1)7) u((n - 1 )7 ) = [c h ;c g h ;
: c g " *h ]
« ((* - 2 )7 )
u(0) ! SCI !
www.FreeLibros.me
386
U b i c a c i ó n d e p o lo s y d is e ñ o d e o b s e r v a d o r e s
Ca|
Observe que y (« 7 )- C G " x(0) = y¡~ C G " x(0) representa un punto arbitrario en el espacio de salidas de m dimensiones. Por lo tanto, igual que en el caso de la controlabilidad completa del estado, una condición necesaria y suficiente para que el sistema sea de salida completamente contro lable, es que los vectores G H , C G H , . . . , C G "’ 1H abarquen el espacio de salidas de dimensión k, es decir que rango [CH i CGH i ■• • i CG" ’ 1 H] = m De este análisis se puede ver que en el sistema definido por las ecuaciones (6-9) y (6-10). controlabilidad completa del estado implica controlabilidad completa de la salida, si y sólo si los * renglones de C son linealmente independientes. I Ahora considere el sistema definido por las ecuaciones i
\ { { k + 1)T) = Gx(kT) + Hu (kT) y (kT) = Cx(kT) + Du (kT) donde
x(kT) = vector de estado (de dimensión n) en el ¿-ésimo instante de muestreo u(kT) = vector de control (de dimensión r) en el Pésimo instante de muestreo y(kT) = Vector de salida (de dimensión m) en el ¿-ésimo instante de muestreo G = matriz de n x n H = matriz de n x r C = matriz d e m x n D = matriz d e m x f La condición para la controlabilidad completa de la salida correspondiente a este sistema deducirse como sigue. Dado que la salida y(«7 ) puede ser dada por la ecuación
y (nT) = Cx(nT) + Du(nT) n- 1
= CG" x(0) + S CG"'; 1 Hu(;T) + Du (nT) se obtiene
y (nT) - CG" x(0) = 2 CG"’^'H u (;T ) + Du(nT) = CG"’ 1 Hu(0) + CG"’ 2Hu(T) + • • • + CHu((n - l ) r ) + D u (« r )
u (nT) l H 1 u((n - 1)T) = [D : C H : CGH : • • ■: CG"-1 H] u(0) Una condición necesaria y suficiente para que el sistema definido por las ecuaciones (6-12) >i sea de salida completamente controlable, es que la matriz d e m x ( « + l >
[D • CH • CG H : • • •: CG" 1 H]
www.FreeLibros.me
;c ió n 6 -2
C o n t r o la b ilid a d
387
?ca de rango m: rango [D i C H i C G H i •••i C G
1H ] = m
(6-14)
Hay que señalar que la presencia de la matriz D en la ecuación de salida del sistema siempre ayuda i establecer la controlabilidad completa de la salida.
Controlabilidad de un sistema de control en tiempo continuo lineal e invariante en el tiempo. A continuación se enunciará brevemente las condiciones para la controlabilidad completa del estado y la controlabilidad de la salida de los sistemas de control en tiempo continuo lineales e m anantes con el tiempo. Considere el sistema definido por
x = Ax + Bu y = Cx + Du donde x = vector de estado (de dimensión n)
u = vector de control (de dimensión r) y = vector de salida (de dimensión ni) A = matriz de n x n
B = matriz de n * r C = matriz de m
n
D = matriz de m * r
Controlabilidad completa del estado. Una condición necesaria y suficiente para la controlabilidad completa del estado para este sistema, puede deducirse en forma similar a como se hizo en el caso de un sistema en tiempo discreto. Aquí presentaremos sólo el resultado. La condición para la controlabilidad completa del estado es que la matriz de n x nr
sea de rango n, o que contenga n vectores columna linealmente independientes. (Esta matriz por lo regular se conoce como matriz de controlabilidad para el sistema en tiempo continuo.) La condición para controlabilidad completa del estado también se puede enunciar en términos de las funciones de transferencia o de las matrices de transferencia. Una condición necesaria y sufi ciente para la controlabilidad completa del estado es que no ocurra cancelación en la función de transferencia o en la matriz de transferencia. Si ocurre cancelación, el sistema no puede ser contro lado en la dirección del modo cancelado.
Controlabilidad de la salida. Como en el caso del sistema de control en tiempo discreto, la controlabilidad completa del estado no es necesaria ni suficiente para controlar la salida de un siste ma de control en tiempo continuo lineal e invariante en el tiempo. Se puede demostrar que la condi ción para la controlabilidad completa de la salida es que el rango de la matriz de m x (/? + l)r [ d : c b i c a b : c a 2b :
¡ c a " - 1 b]
sea m.
www.FreeLibros.me
388
U b i c a c i ó n d e p o lo s y d is e ñ o d e o b s e r v a d o r e s
6-3 OBSERVABILIDAD En esta sección, analizaremos la observabilidad de los sistemas de control en tiempo disen e invariante con el tiempo. Considere el sistema de control en tiempo discreto sin excitación por x((Jfc + 1)7’) = Gx (kT)
y {kT) = C x( kT) donde
x(kT) = vector de estado (de dimensión rí) en el ¿-ésimo instante de muestreo y{kT) = vector de salida (de dimensión m) en el Pésimo instante de muestreo G = matriz de n x n C = matriz dem x n El sistema se dice ser completamente observable si cualquier estado inicial x(0) puede det a partir de la observación de y(kT) sobre un número finito de períodos de muestreo. El si lo tanto, es completamente observable, si cualquier transición del estado de manera even~ a todos los elementos del vector de salida. El concepto de observabilidad es útil para resolver el problema de la reconstrucción bles de estado no medibles. Se verá más adelante que los sistemas de control con realime~ estado, diseñados mediante el método de ubicación de polos, necesitan realimentación de de estado ponderadas. En la práctica, sin embargo, en los sistemas de control con realimc estado se encuentra la dificultad de que algunas de las variables de estado no son accesib' medición directa. Entonces requiere estimar las variables de estado no medibles, a fin de señales de control de realimentación. En la sección 6-6 veremos que el concepto de ob~ tiene un papel dominante en el diseño de los observadores de estados. La razón por la que se considera el sistema sin excitación es la siguiente. Si el sistem» descrito por las ecuaciones
x((k + 1)T) = G x (k T ) + Hu( kT) y (k T) = Cx (k T) + D u(A :r) entonces *-i
x ( k T ) = G*x(0) + X G*~'-‘ HuOT) i=o y y(kT) es k
-1
y ( k T) = CG* x(0) + 2 C G ^'-’ HuOT) + Du(lfcr) i=o Dado que las matrices G, H, C y D son conocidas, y u(kT) también lo es, el segundo y nos del segundo miembro de esta última ecuación son cantidades conocidas. Por lo restarse del valor observado de y(kT). Entonces, para la investigación de una condición suficiente para la observabilidad completa, basta considerad el sistema descrito por las (6-15) y (6-16).
www.FreeLibros.me
S e c c ió n ó - 3
O b s e r v a b ilid a d
389
Una vez que a partir de la observación de la salida se pueda determinar x(0), también podrá determinarse x(A7), ya que ;/(0), u(T), . . . , u ((k - 1)7) son conocidas.
Observabilidad completa de los sistemas en tiempo discreto. Considere el sistema definido por las ecuaciones (6-15) y (6-16). El sistema es completamente observable si, dada la salida y{kT) sobre un número finito de períodos de muestreo, es posible determinar el vector estado inicial x(0). Ahora, deduciremos la condición para la observabilidad completa del sistema en tiempo dis creto descrito por las ecuaciones (6-15) y (6-16). En vista de que la solución x(kT) de la ecuación (615) es x( k T) = G *x(0) se obtiene
y ( k T ) = C G *x(0) La observabilidad completa significa que, dado y(0), y(7), y(2T), . . . , es posible determinar x,(0), x2(0), . . . , x„(0). Para determinar n incógnitas, necesitamos únicamente n valores de y{kT). Por lo tanto, podemos utilizar los primeros n valores de y(L7), o y(0), y (7 ),. . ., y ((n - 1)7) que permiten determinar x,(0), x2(0), . . . , x,,(0). En el caso de un sistema completamente observable, dados y(0 ) = Cx(0) y (T) = CGx(O)
y((n - 1)T) = C G ” ' 1x(0) se debe ser capaz de determinar x,(0), x2(0), . . . , x„(0). Al observar que y(kT) es un vector de dimensión m, las n ecuaciones simultáneas anteriores dan como resultado nm ecuaciones, todas ellas incluyendo x,(0), x2(0 ), . . . , x„(0). A fin de obtener un solo conjunto de soluciones x,(0), x2(0 ), . . . , x„(0) a partir de estas nm ecuaciones, se debe escribir exactamente de entre ellas n ecuaciones linea les independientes. Esto requiere que la matriz nm x n C CG CG" 1 sea de rango n. Notando que el rango de una matriz y de su transpuesta conjugada es el mismo, es posible enunciar la condición correspondiente a la observabilidad completa como sigue. Una condición necesaria y suficiente para que el sistema definido por las ecuaciones (6-15) y (6-16) sea completa mente observable es que el rango de la matriz de n * nm [C * •G *C * : •■•: (G * )"-1 C *]
(6-17)
sea n. La matriz dada por la ecuación (6-17) se conoce comúnmente como matriz de observabilidad. [Note que en la ecuación (6-17) los asteriscos indican transpuestas conjugadas. Si las matrices C y G
www.FreeLibros.me
390
Ubicación de polos y diseño de observadores
Caprti
son reales, entonces la notación de transposición conjugada como G *C * puede ser cambiada! notación de transposición, como G rC r.]
Forma alterna de la condición para la observabilidad completa.
Considere el sistema <
nido por las ecuaciones (6-15) y (6-16) que aquí se repite:
x( (k + 1 )T ) = G x( k T )
(6-1
y ( k T) = C x(k T)
(6-1
Suponga que los valores característicos de G son distintos, y que una matriz de transformacii transforma a G a una matriz diagonal, de tal forma que P 1G P es una matriz diagonal. Se define J
x( k T) = P x (fcr) Entonces las ecuaciones (6-18) y (6-19) se pueden escribir como sigue:
x( (k + 1 )7 ) = P _1G Px (& 7 ) y ( k T) = CPx(kT) Por lo tanto, y (nT) = C P (P _1 G P )" x(0) es decir, 'x ? y (nT) = C P
x(0) = C P
K.
'A í i ^ O ) ' a2 " í 2(0) . a ; í „ ( o).
donde A,, A2, . . . , A„ son n valores característicos distintos de G. E l sistema es completi observable, si y sólo si ninguna de las columnas en la matriz C P d e m x « está formada de eler cero. Esto es debido a que si la z'-ésima columna de C P está formada de elementos cero, entonces^ variable de estado x,(0) no aparecerá en la ecuación de salida y, por lo tanto, no podrá ser dete nada a partir de la observación de y(kT). Por lo tanto, x(0), que está relacionada con x(0) med la matriz no singular P, no podrá ser determinada. Si la matriz G implica valores característicos múltiples y no puede ser transformada a i matriz diagonal, entonces si se utiliza una matriz de transformación adecuada S podemos i mar G a la forma canónica de Jordán: S'GS =
J
donde J está en la forma canónica de Jordán. Definamos
x ( k T ) = S x ( kT ) Entonces las ecuaciones (6-18) y (6-19) se pueden escribir como sigue:
x( (k + 1 )7 ) = S~l GS x (k T ) = Jx ( kT ) y ( k T ) = C S x ( kT ) Por lo tanto, y (n T ) = CS(S"‘GS)"x(0)
www.FreeLibros.me
Sección
6-3
O b servab ilid ad
391
El sistema es completamente observable, si y sólo si 1) dos bloques de Jordán en J no están asocia dos con el mismo valor característico; 2) ninguna de las columnas de CS que corresponda al primer renglón del bloque de Jordán está formada de elementos cero, y 3) ninguna columna de CS que corresponda a valores característicos distintos está formada de elementos cero. Para aclarar la condición 2, en el ejemplo 6-3 que se muestra a continuación, se han señalado con líneas punteadas las columnas de CS que corresponden al primer renglón de cada bloque Jordán. Ejemplo 6-3 Los sistemas siguientes son completamente observables: 1.
2.
o
* .((* + 1)T)
-1
x2((k + i ) D
0
* .((* + 1)7’) x2((k + 1)7") xÁ(k + 1)7) *4((fc + 1 )7) xs((k + 1)7)
2 1 0 2 0 0
=
*i (kT) x2{kT)
-2 o 1 2
0
y(*7) = [l 0
! !i i1 T-3
5]
x,(kT) Xz(kT)
* i(* 7 )
x2(kT) x3(kT) 1 *4(kT) -3_ x$(kT) i 0 Xi(kT)
yÁkT) yÁkT)
r i—• 1 1 ¡n ¡0¡ 1 1 c1 _1
x2(kT) i r°¡ 111'1 0 x3(kT) 1 i_i x4(kT) x5(kT)
Los sistemas siguientes no son completamente observables: 1.
Xl((k + 1 )7) x2((k + 1)7)
-1
xi((k x2((k x3((* xt((k
2
+ + + +
1)7) 1 )7) 1)7) 1)7)
* 5((* + 1)T)_
0
0
-2
x¡(kT) xi(kT)
1 0 ! 0 2 1¡ 0 0 2! r -3 0 ¡ o
0
y (*T ) = [0
x,(kT)
1] x2(kT)
xi{kT)
x 2(kT) x 3( kT) 1 Xi{kT) -3 _x5(kT)_ r Xi(kT)
y Á k T ) ' y Á k T )
rfi
i
x2(kT)
11l 1 1 ¡0¡ l ' x3(kT) 101 0 L ¡o! i_ 1 1 U-l J x4(kT) x5{kT)_
Condición para la observabilidad completa en el plano z. La condición para la observabilidad completa también puede enunciarse en términos de Junciones de transferencia pulso. Una condición necesaria y suficiente para la observabilidad completa es que no ocurra ninguna cancelación de polos ceros en la función de transferencia pulso. Si ocurre cancelación, el modo cancelado no podrá observarse en la salida. Ejemplo 6-4 Demuestre que el sistema siguiente es no completamente observable:
www.FreeLibros.me
392
U b i c a c i ó n d e p o l o s y d is e ñ o d e o b s e r v a d o r e s
C a p it u lo 6
x((k + 1)7’) = Gx(kT) + H u{kT) y(kT) = C x(kT) donde
G =
0 0 -6
1 0 0 1 -11 -6
0 H = 0 1
C = [4
5
1]
Es claro que la señal de control u(kT) no afecta la observabilidad completa del sistema. Para examinar la observabilidad completa, podemos simplemente definir u(kT) = 0. Para este sistema, tenemos -6 -7 -1
[C* : G*C* : (G *)2C*] =
6 5 -1
Note que 4 -6 5 -7 1 -1
=0
Por lo tanto, el rango de la matriz [C* : G*C* : (G *)2C*] es menor de 3. El sistema no es completamen te observable. De hecho, en este sistema ocurre cancelación de polos ceros en la función de transferencia pulse del sistema. La función de transferencia pulso entre X ^ z) y U(z) es * .(* )
1
U(z)
(z + l)(z + 2)(z + 3)
y la función de transferencia pulso entre Y(z) y X t(z) es
Y(z) * ,(z )
= (z + l)(z + 4)
Por lo tanto, la función de transferencia pulso entre la salida Y{z) y la entrada U(z) es Y(z)
(z + l)(z + 4)
U{z) (z + l)(z + 2)(z + 3) Es claro que se cancelan los factores (z + 1) en el numerador y en el denominador. Esto significa que existen estados iniciales diferentes de cero x(0) que no pueden ser determinados a partir de la medido* d cy(k T ).
Comentarios. La función de transferencia pulso no tiene cancelación, si y sólo si, el siste es de estado completamente controlable y completamente observable. (Vea el problema A-6-4.) E_ significa que una función de transferencia cancelada no lleva consigo toda la información que carao teriza al sistema dinámico. Principio de dualidad. A continuación se examinará la relación entre controlabilidad observabilidad. Considere el sistemaS, definido por las ecuaciones \ {{k + l ) T ) = G x( k T) + H u (A :r) y(kT)
=
Cx(kT)
www.FreeLibros.me
(6__ (6.:1
le c c ió n 6 -3
O b s e r v a b ilid a d
393
conde
x(kT) = vector de estado (de dimensión n) en el ¿-ésimo instante de muestreo u(kT) = vector de control (de dimensión r) en el £-ésimo instante de muestreo y (kT) = vector de salida (de dimensión ni) en el A-ésimo instante de muestreo G = matriz de n * n H = matriz de n * r C = matriz de m x n ;■su contraparte dual, que llamaremos sistema S2, definida por las ecuaciones
x((k + 1 )7 ) = G*x(kT) + C*ü(kT) y ( k T) = H *x(A :r)
( 6- 22) (6-23)
conde
x(kT) = vector de estado (de dimensión n) en el A-ésimo instante de muestreo ú(kT) = vector de control (de dimensión r) enel i-ésimo instante de muestreo y(kT) = vector de salida (de dimensión ni) en el A-ésimo instante de muestreo G*
= transpuesta conjugada de G
H*
= transpuesta conjugada de H
C*
= transpuesta conjugada de C
Ahora se examinará una analogía entre controlabilidad y observabilidad. Esta analogía se conoce como principio de dualidad, y es debida a Kalman. El principio de dualidad dice que el sistema S, definido por las ecuaciones (6-20) y (6-21) es de estado completamente controlable (observable), si y sólo si el sistema S2definido por las ecuaciones 6-22) y (6-23) es de estado completamente observable (controlable). Para verificar este principio, escribamos las condiciones necesarias y suficientes para la controlabilidad completa y la observabilidad completa del estado, correspondientes a los sistemas S , y S2, respectivamente. : \R A
1.
E L S IS T E M A X , i
Una condición necesaria y suficiente para la controlabilidad completa del estado es que rango |H
2.
G H i ••• i G " “ 1H| = n
Una condición necesaria y suficiente para la observabilidad completa es que rango [C * i G *C * i ••• i ( G * ) " ' 1C*] = n
-ARA EL SISTEMA .S-,: 1.
Una condición necesaria y suficiente para la controlabilidad completa del estado es que rango [C * i G * C *
(G * )"~ 1C*| = n
www.FreeLibros.me
394
U b i c a c i ó n d e p o lo s y d is e ñ o d e o b s e r v a d o r e s
C ae*
2. Una condición necesaria y suficiente para la observabilidad completa es que rango [H : G H i ••• •G " ’ 1H] = n Si se comparan estas condiciones, es evidente la verdad del principio de dualidad. Vemos que el sistema S,, siendo de estado completamente controlable, equivaleal siste completamente observable. Y el sistema Sj, siendo completamenteobservable, esequival sistema S2de estado completamente controlable. Mediante la utilización de este principio, la observ° de un sistema dado puede verificarse al probar la controlabilidad del estado de su dual.
Observabilidad completa de ios sistemas de control en tiempo continuo lineales e inva con el tiempo. Por último, enunciaremos brevemente la condición de observabilidad co correspondiente al sistema de control en tiempo continuo lineal e invariante en el tiempo. El si se dice completamente observable, si todos los estados iniciales x(0) pueden determinarse a p la observación de y(7) durante un intervalo de tiempo finito. Similar al caso del sistema de con tiempo discreto, necesitamos considerar sólo un sistema sin excitación. Considere el sistema do por las ecuaciones x = Ax y = Cx donde x = vector de estado (de dimensión n) y = vector de salida (de dimensión m) A = matriz de n x n C = matriz de m x n Igual que en el caso de sistema de control en tiempo discreto, se puede decir que la condición observabilidad completa es que el rango de la matriz de n x nm
sea n. (Esta matriz de n * nm se conoce comúnmente como matriz de observabilidad del sist tiempo continuo.)
E fecto de la discretización de un sistem a de control de tiem po continuo so controlabilidad y la observabilidad. Cuando se discretiza un sistema de control en tiempo nuo con polos complejos, la introducción del muestreo puede dificultar la controlabilidad observabilidad del sistema discretizado resultante. Es decir, puede ocurrir cancelación de ros al pasar del caso en tiempo continuo al caso en tiempo discreto. Por lo tanto, el sistema disc puede perder controlabilidad y observabilidad. Puede demostrarse que un sistema que sea de estado completamente controlable y co mente observable, en ausencia de muestreo, permanece en tales condiciones después de la in ción del muestreo, si sólo si para cada valor característico de la ecuación característica sistema de control en tiempo continuo, la relación R e A, = R e A;
www.FreeLibros.me
S e c c ió n 6 - 3
O b s e r v a b ilid a d
395
implica que Im (A, - Ay) =k
2ni
(6-25)
donde 7 es el período de muestreo y n = ±1, ±2, . . . . Se hace notar que, a menos que el sistema contenga polos complejos, no ocurrirá cancelación de polos ceros al pasar de tiempo continuo al caso de tiempo discreto. Ejemplo 6-5 Considere el siguiente sistema de control en tiempo continuo: 0 1 -1 0
(6-26)
y = [1 0]
(6-27)
Este sistema es de estado completamente controlable y completamente observable, ya que el rango de la matriz de controlabilidad 0 1 1 0
[B i AB] = is 2 and the rank of the observability matrix [C* i A*C*] =
1 0 0 1
también es 2. Observe que los valores característicos de la matriz de estado son Ai = j,
A2 = —j
El sistema de control en tiempo discreto obtenido al discretizar el sistema de control en tiempo continuo definido por las ecuaciones (6-26) y (6-27) puede darse como sigue: '* ,((* + 1)7) x2((k + 1)7)
eos 7 sen 7 -sen T eos 7
y{kT) = [1 0]
x^kT) 1 - eos 7 + u(kT) sen 7 M k T ).
Xi(kT) x2(kT )
(6-28) (6-29)
donde T es el período de muestreo Demostraremos que el sistema discretiz.ado dado por las ecuaciones (6-28) y (6-29) es de estado completamente controlable y completamente observable, si y sólo si Im (Ai - A2) = 1 + 1 4-
2n ■ fi
es decir. 7 * rnr,
n = 1,2,3,...
Para el sistema de control en tiempo discreto obtenido al discretizar el sistema de control en tiempo continuo, tenemos la siguiente matriz de controlabilidad [H : GH]
1 - eos 7 sen 7
eos 7 + 1 — 2 eos27 -sen 7' + 2 eos 7 sen 7
Observe que el rango de [H ] GH) es 2 si y sólo si T> mr (donde n = 1. 2. 3. ... ). También el rango de la matriz de observabilidad
www.FreeLibros.me
396
Ubicación de polos y diseño de observadores
[C * : G*C*] =
Caf
1 eos T 0 sen T
es 2 si y sólo si T>nir (donde « = 1 ,2 ,3 ,...). Del análisis anterior, podemos concluir que el sistema discretizado es de estado completamente controlable y completamente observable si y sólo si T> nir, donde n= 1, 2, 3, . .. . Observe que siempre es posible evitar la pérdida de controlabilidad y de observabilidad escogiera do un período de muestreo T distinto a nir.
6-4 TRANSFORMACIONES ÚTILES EN EL ANÁLISIS Y DISEÑO EN EL ESPACIO DE ESTADOS En esta sección primero se verán técnicas para transformar ecuaciones en el espacio de estados ea formas canónicas. A continuación se revisará la propiedad de invariancia de las condiciones de rango para la matriz de controlabilidad y la de observabilidad.
Cómo transformar en form as canónicas las ecuaciones en el espacio de estados.
Considere
la ecuación de estado en tiempo discreto y la ecuación de salida
x(k + 1) = Gx(k) + Hu (k ) y ( k ) = C x(k) + D u ( k ) Ahora se estudiarán técnicas para transformar las ecuaciones en el espacio de estados definidas parí las ecuaciones (6-30) y (6-31) en las tres formas canónicas siguientes: i 1. Forma canónica controlable 2. Forma canónica observable 3. Forma canónica diagonal o de Jordán (Observe que la forma canónica diagonal es un caso especial de la forma canónica de Jordán.) Sel supone que el sistema definido por las ecuaciones (6-30) y (6-31) es de estado completamente coe-j trolable y completamente observable. I
Forma canónica controlable. El sistema definido por las ecuaciones (6-30) y (6-31) se pue-j de transformar a una forma canónica controlable, mediante la matriz de transformación I (6-32!
T = MW donde m
= [h ; g
;
h
; G " 1h ]
(6-33|
y
^n-l an-2 ‘ ’ Oí 1 a„_2 an-3 ••• 1 0 W =
a,
1
• • ■ 0 0
1
0
•••
www.FreeLibros.me
0
0
(6-3-
Sección ó-4
Transformaciones útiles en el análisis y diseño en el espacio de estados
397
Los elementos a, mostrados en la matriz w son coeficientes de la ecuación característica |zl - G| = z" + al z n~l + ••■+ a „_, 2 4- an = 0 Puede demostrarse que
T
GT = (MW)“'G(MW) = W ’M ' G M W 0 0
1 o
0 1
0
0 @n—\
0 @n-2
0 o (6-35)
T
-a i
(6-36)
H
(Para los detalles de la deducción de las dos ecuaciones anteriores, vea los problemas A-6-5 y A-66 .)
Ahora definamos
x(k) = Tx(/r) donde la matriz de transformación T está dada por la ecuación (6-32). Entonces las ecuaciones (630) y (6-31) se convierten en
x(* + 1) = T-1 GTx(A:) + T" 1 Hu(Ar) = Gx(it) + H u(k) y ( k ) = CT x( k) + Du{ k) = Cx{k) + Du{k) donde G = T "1G T, H = T 1H, C = C T, y D = D, es decir 1)
x¡ (k
+
x 2( k
+ 1)
0 0
l
0
■
0
1
■
0
0
0
0 0
'o' 0
x 1( k )
"
x 2( k )
_ x n- ¡ ( k
_ x n( k
+
+
1) _
u(k)
+
1) .
-a
n
— a n-\
1 2
■
~
a l.
0
X n - l(k ) _ x „{k )
1_
_
(6-37) •íi(^)
y ( k ) = [b„ - anb0':bn-i - a„_i60: •••: bi - a{b 0]
x 2(k)
+ Du(k)
J»(k) (6-38) Aquí las bk son los coeficientes que aparecen en el numerador de la función de transferencia pulso siguiente:
www.FreeLibros.me
398
Ubicación de polos y diseño de observadores
Capítulo A
C (zl - G)_1H + D = C { z l - G)_1H + D _ b0z n + b xz "~1 + • • • + bn~\z + b„ z n + axz n~1 + • • • + a„-xz + an
(6 -3 *
Observe que D = D = b0. El sistema dado por las ecuaciones (6-37) y (6-38) está en una f o m canónica controlable. Forma canónica observable. El sistema definido por las ecuaciones (6-30) y (6-31) puedh ser transformado a una forma canónica observable, mediante la matriz de transformación *\-i Q = (WN*)
donde
N = [C* : G*C* : • • •: (G*)"' 1 C*] y W está dado por la ecuación (6-34). Puede demostrarse que 0 1 0
0 0 1
... ... ...
o o o
~an &n- 1 ~&n-2
.0
0
...
i
-a i
Q ’ GQ = G =
r Q ’H = H =
b„ - (¡nb() K - , ~ Qn- 1 bQ
.
bx - axbp
[0 0 . . . o 1 ] donde las bk son los coeficientes que aparecen en el numerador de la función de transferencia^ pulso, dada por la ecuación (6-39). (Para detalles de la deducción de las ecuaciones anteriores, i los problemas A-6-8 y A-6-9.) Entonces, al definir x (* ) = Qx(k)
Las ecuaciones (6-30) y (6-31) se convierten en x(k + 1) = Gx(/c) + H u(k) y ( k ) = Cx(A:) + Du(k) es decir, xi (k + 1 ) x2(k + 1 ) Xn-l{k + 1 ) . x„ (k + 1 ) _
_
0 0 • • o 1 0 • ■0
—an
xi (k) x2(k)
bn - a„ bp bn-i an—i bp +
0 0 • • 0 0 0 • • 1
- a 2 x„-i(k) - a x _ . Xn(k) .
www.FreeLibros.me
u{k) b2 —a2bp bx ü\ bp
Sección 6-4
Transformaciones útiles en el análisis y diseño en el espacio de estados
399
*1 (k) Uk)
y { k ) = [0
0
••• 0
1]
:
+ Du(k)
(6-42)
X n -l(k )
x n(k) El sistema definido por las ecuaciones (6-41) y (6-42) está en una forma canónica observable.
Forma canónica diagonal o de Jordán. Si los valores característicos p, de la matriz G son distintos, entonces los vectores característicos correspondientes , £„ también son distintos. Defina la matriz de transformación P como sigue:
Er Then
P~'GP =
Pi 0
0 Pl
• • • •
.0
0
• • Pn.
p< Thus, if we define
0 ' 0
x( k) = Px(A:) se tieene que las ecuaciones (6-30) y (6-31) pueden estar dadas por las ecuaciones
x( k + 1) = Gx(fc) + Hu{k)
(6-43)
y ( k ) = Cx(k) + D u ( k )
(6-44)
donde G = P _I G P, H = P '1H, C = C P y D = D. Por lo tanto, las ecuaciones (6-43) y (6-44) pueden ser escritas como
x, (k + 1) x 2(k + 1)
Pi 0 =
0 Pl
x„(k + 1)
0
0
ífii
Pl
0 0
■•• ■••
xi(k) x 2( k )
+
ai a2
u{k)
(6-45)
••• Pn. , x n( k )
■ • Pn)
xi{k) x 2( k )
+ Du(k)
(6-46)
*n(k ). donde las a, y las /3, son constantes, tales que a,¡3, es el residuo en el polo z=p¡\ es decir, tal que a,a, aparecerán en el numerador del término l/(z - p¡) cuando se expande la función de transferencia de pulso en fracciones parciales como sigue: C (z l - G )
H + D = C (z l - G ) = « i Pl Z ~ Pi
H +D
+ <*202 + . Z - pi
www.FreeLibros.me
+ - a" ^ n + D
z - Pn
(6 -4 7 )
400
U b i c a c i ó n d e p o lo s y d is e ñ o d e o b s e r v a d o r e s
C a p ít iA
En muchos casos escogemos a, = a 2= ••■= an = 1. [Observe que la condición necesaria y sufici para que el sistema sea de estado completamente controlable es que a¡ > 0 (/ = m, m + 1 ,..., rí). \ la condición correspondiente para que sea completamente observable, es que /3, > 0 (;' = \ , m ~ \.
+ 2,
n).]
Si existen varios valores característicos p , de la matriz G, entonces escogemos la matriz transformación S definida como sigue:
S = f o i : TU: • ■•: iln] donde las rj, son vectores característicos (que corresponden a valores característicos distinti vectores característicos generalizados (que corresponden a valores característicos múltiples). < mayor detalle sobre vectores característicos generalizados, vea el apéndice A .) Entonces S ' G S = matriz en la forma canónica de Jordán Ahora si definimos
x(k) = S x(k) entonces se pueden dar las ecuaciones (6-30) y (6-31) como sigue:
x(k + 1) = G x( k) + H u (k ) y ( k ) = Cx(k) + D ú ( k )
' *i ( k + 1) ' x 2( k + 1)
’ Pi
1 Pi
0 1
=
0
y (k )
1 Xm( k )
P\
x m+l( k + 1)
x n{ k + 1)
0'
. •
x m( k + 1)
0
x m+i ( k )
&m+1
0
Pn.
. x n{ k) _
a„
x¡ (k) x 2(k) [P \
fr
u(k)
+
Pm+1 0
=
1 0 O •• 1
1
donde G = S"' G S, H = S 1 H, C = C S y D = D. Si, por ejemplo, la matriz G incluye un característico p, múltiple de orden m y otros valores característicos p„,. h p„,-2, ••■, P„ siendo i ellos distintos y diferentes de p x y, además, si el rango de p, I - G es n - 1 (lo que implica q polinomio mínimo es idéntico al polinomio característico), entonces las ecuaciones en el espac estados en la forma canónica de Jordán serán:
fin ]
+ Du(k)
J n (k )_
donde las a, y las yS, son constantes, que aparecen en la función de transferencia de pulso de sistema: www.FreeLibros.me
S e c c ió n ó - 4
401
T r a n s f o r m a c i o n e s ú t ile s e n e l a n á l i s i s y d is e ñ o e n e l e s p a c i o d e e s t a d o s
C (zl - G) ' 1 H + D = C ( z l - G ) ‘H + D
z ~ Pl
a„ = 1. [Observe que la condición necesaria y suficiente para que el sistema sea de estado completamente controlable, es que a, > 0 (i = m, m + 1, y para que sea completamente observable, es que f3¡ > 0 (i = 1, m + 1, m + 2 ,. . . , «).] Observe que si el rango de p x I - G es n - s (siendo 2 < s < n), es decir, si el polinomio mínimo es de un grado 5 - 1 menor que el del polinomio característico, entonces S '1G S tendrá una forma canónica de Jordán distinta. (Para detalles, véase el apéndice A .) Propiedad de invariancia de las condiciones de rango para la matriz de controlabilidad y para ¡a matriz de observabilidad. Considere sistemas relacionados por transformaciones de simi litud. Definamos la matriz de controlabilidad como M: m
= [h : g
;
h
: g "-1h ]
Sea P (una matriz arbitraria n x n no singular) una matriz de transformación de similitud y
P G P = G,
P H = H
Entonces
P 'G2P = P 'GPP ‘GP = GG = G2 P ' G3P = P 'GPP 'GPP-'GP = G3
p i G " >p =
Q
»-i
Por lo tanto, p 1m = p
[h ; g
= [p ‘ h : p
h
:
: g b_1 h ]
g h
= [p -1 h : p 1g = [h
g h
:
:
p p
;g "
: p ‘ g ” *h ] 1h : • h
; p 1G n_1 p p -1 h j
] =
m
Dado que la matriz P es no singular,
rankM = rankM Similarmente, en el caso de la matriz de observabilidad se define
N = [C* G*C*
(G* ) " ' 1 C*]
Si P es una matriz de n x n no singular arbitraria y escribimos
P ' G P = G,
CP = C
www.FreeLibros.me
402
U b i c a c i ó n d e p o lo s y d is e ñ o d e o b s e r v a d o r e s
C a p ít u lo ó
Entonces p *n
= p *[c * ; g * c * i ■• •: ( g *)"~' c * ] = [P*C* : p*G*C* • • • • • p*(G *)"“l C*] = [ c * : ( p _l g p )* c * : • • •; (p~' G "-1 p )* c * ] =
[c * : g * c * ; ■••; ( g * ) " " 1c*]
=
ñ
Por lo tanto. rango N = rango Ñ
6-5 DISEÑO VÍA UBICACIÓN DE POLOS En esta sección se presentará un método de diseño comúnmente conocido como técnica de ubica ción de polos o de asignación de polos. Supondremos que todas las variables de estado son medibles y disponibles para la realimentación. Se podrá demostrar que si el sistema considerado es de estado completamente controlable, entonces los polos del sistema en lazo cerrado pueden ubicarse en cual quier localización deseada, mediante una realimentación del estado a través de una matriz de ganan cia de realimentación del estado apropiada. La presente técnica de diseño empieza con una determinación de los polos en lazo cerrado desea dos, basados en los requisitos de respuesta transitoria y/o respuesta en frecuencia como velocidadfactor de amortiguamiento relativo o ancho de banda. Una vez hechas estas consideraciones, suponga que decidimos que los polos en lazo cerrado deseados deben estar en z = //,, z = p 2, . . . , z = p n. (En la selección del período de muestreo, debe tenerse cuidado de que el sistema deseado no requiera señales de control excesivamente grandes. De lo contrario, ocurrirán fenómenos de saturación en el sistema. Si éste entra en saturación, se volverá no lineal, por lo que tal método de diseño ya no será aplicable, en vista de que solamente lo es para sistemas lineales e invariantes en el tiempo.) Enton ces, al seleccionar una matriz de ganancia apropiada para la realimentación del estado, es posible obligar al sistema a tener los polos en lazo cerrado en las posiciones deseadas, siempre y cuando d sistema original sea de estado completamente controlable. A continuación, se tratará el caso en que la señal de control es un escalar y se probará que una condición necesaria y suficiente para que los polos puedan ser ubicados en localizaciones cuales quiera arbitrarias en el plano z, es que el sistema sea de estado completamente controlable. Después analizaremos algunos métodos para determinar la matriz de ganancia de realimentación de estado requerida.
Condición necesaria y suficiente para la ubicación arbitraria de los polos. Considere d sistema de control en lazo abierto que se muestra en la figura 6-la). La ecuación de estado es x( k + 1) = Gx(k) 4- H u (k ) donde
\{k) = vector de estado (de dimensión n) en el A-ésimoinstante de muestreo u(k) = señal de control (escalar) en elA-ésimo instante de muestreo G
= matriz de n x n
H
= matriz de n * 1
www.FreeLibros.me
( 6-
S e c c ió n 6 - 5
D i s e ñ o v í a u b i c a c i ó n d e p o lo s
403
(a)
(b) Figura 6-1 (a) Sistema de control en lazo abierto; (b) sistema de control en lazo cerrado con u(k) = - K \{k).
Suponemos que la magnitud de la señal de control u{k) no está acotada. Si la señal de control u(k) fuera u ( k ) = —K x ( k ) donde K es la matriz de ganancia de realimentación del estado (una matriz de 1 x n), entonces el sistema se convierte en un sistema de control en lazo cerrado, como el que se muestra en la figura 61b ) , y su ecuación de estado
x(k + 1) = (G - HK)x(it)
(6-51)
Observe que la matriz K se escoge de tal forma que los valores característicos de G - HK sean los polos en lazo cerrado deseados: /q, pt2, . . . , ¡uN. Probaremos ahora que una condición necesaria y suficiente para la ubicación arbitraria de los polos, es que el sistema sea de estado completamente controlable. Primero se deducirá la condición necesaria. Empezaremos por demostrar que si el sistema no es de estado completamente controlable, entonces existen valores característicos de G - HK que no pueden ser controlados por realimentación del estado.
www.FreeLibros.me
404
U b i c a c i ó n d e p o lo s y d is e ñ o d e o b s e r v a d o r e s
C a p ít u c I
Suponga que el sistema de la ecuación (6-50) no es de estado completamente controlable. Entonces el rango de la matriz de controlabilidad es menor que n, es decir, rango [H •G H •••••G " 1H ] = q < n
(6-52
Esto significa que en la matriz de controlabilidad hay q vectores columna linealmente independie tes. Definamos estos q vectores columna linealmente independientes como f,, f2, . . ., f . Asimisnn escojamos n - q vectores n adicionales v +„ v +2, . . ., v,„ tales que P = [fi if2: •••: f , :v?+1 iv ,+2: • • •: v„] tiene rango n. Utilizando la matriz P como la matriz de transformación, definamos
P
GP = G,
P ‘H = H
Entonces
GP = PG es decir,
[G fj; • ■•: G f ,; g v í+1 : • • •: gv„] =
¡■■•ir, : ví+1; • • •; v„]g
(6-53
Y también,
H = PH = [f, i f2:
(6-54
I f „ : v ,+i ; • • ■: vn]H
En vista de que tenemos q vectores columna linealmente independientes f,, f2, . . . , fr/, poden utilizar el teorema Cayley-Hamilton para expresar las matrices G f ,, G f 2, . . . , G f , en términos é estos q vectores. Es decir,
Gfi = gil fl + g2l f2 + '' ’ + g,i fq G f2 — gl2fl + g22f2 + • • • +
gl« fl + g2, f2 +
G f
g q 2 f
• ■• +
gqq f q
Por lo tanto, la ecuación (6-53) puede escribirse como sigue:
[G fi; • • •: G f ,; Gv,+, ; • • •; gv „]
= [f i: ' ' ': fq : V
i
g il
gl2
g lq
g l?+ l
g l?+ 2
g21
g il
g2q
g lq + l
g 2 q +2
gqi
gq2
gqq
gqq+ l
gqq* 2
0
0
0
g q + 1q+1
tf q + lq * 2
0
0
0
gn<7+l
Q n q +2
g g*
gm
- 1
: • • : v „J nj
Para simplificar la notación, definamosS g ii
gl2
g lq
g 2l
g22
g2q
gqí
gqq.
.g q i
www.FreeLibros.me
=
c '11
gq--*
g *■*
S e c c ió n 6 - 5
405
D i s e ñ o v í a u b i c a c i ó n d e p o lo s
£ 19+ 1
£ 1 ,7 + 2
£ 2 ,7 + 1
£ 2 ,7+ 2
'
£2n
. 8 q q +1
£<7 ? + 2
8 qn _
£ l/i
0
o
• O
o
o
• O
£ 9 + 19+ 1
£ 9+ 19+ 2
* ’ *
£ 9 + 1/1
£9+29+1
£9+29+2
’ * *
£9+2//
£«9+1
£ //9+ 2
= G,
—
G 21 —
—
G i
(n
~
í )
x
q matriz cero
Entonces, la ecuación (6-53) puede escribirse como sigue:
[G f i: • • ■: G f9 : Gví+1: • • •: Gv„] = [fj
: ví+1:
iv n] G il ( G i l O ! G 22
Por lo tanto,
G =
G l _ l _ |_ G l 2
(6-55)
o : g 22
A continuación, refiriéndonos a la ecuación (6-54), (6-56)
H = [fi: f2: • • • i f , : ví+i :••••; v„]H
Volviendo a la ecuación (6-52), observe que el vector H puede escribirse en términos de q vectores columna linealmente independientes f,, f2, .. ., f(/. Por lo tanto,
H = hn f¡ + h2i f2 + • ■• + hql f q En consecuencia, la ecuación (6-56) se puede escribir como sigue:
hn k 2. h x, f, + /t2, f2 + ••• + hqXf q = [ f , : f2 : •••: f , : v?+]: •••: v„] hq1 " Ó "
Por lo tanto,
H
Ó .
donde,
H,
'hn h2x l h q l.
www.FreeLibros.me
(6-57)
406
U b i c a c i ó n d e p o lo s y d is e ñ o d e o b s e r v a d o r e s
C a p ít u lo
i
Ahora considere la ecuación del sistema en lazo cerrado dada en la ecuación (6-51). La ecuación característica es |zl - G + H K | = 0 Defínase K = KP y divídase la matriz K para obtener (6-58i
K = [K n : K 12]
Si multiplicamos las ecuaciones anteriores, en orden por a„ a,,_„ . . . , a g(donde a 0= 1), respectivamente, y se suman los resultados, se suman K = K P 1 = [ k „ ; k 12]p 1 Entonces, la ecuación característica para el sistema en lazo cerrado será: |zl - G + H K| = IP " 1! |zl - G + H K| |P| = Izl - P -1 G P + P 'H K P l = |zl - G + H K Sustituyendo las ecuaciones (6-55), (6-57) y (6-58) en esta última, obtenemos
0 1
•2:lo
[ Gn i G izl + ¡ G 22_ o
0 o 11„
G + HK =
Gn + Hui Ki Kn
i1
H„ [k „ : k 12] "0 h
„
k
,
zl
K „| \z I n ~ q
(6-5
La ecuación (6-59) muestra que la matriz K = P 1tiene control sobre los q valores característicos G u - H u K n, pero no sobre los n - q valores característicos de G 22. Es decir, existen n - q valo característicos de G - H K que no dependen de la matriz K. Por lo tanto, hemos demostrado que controlabilidad completa del estado es una condición necesaria para el control de todos los valocaracterísticos (localizaciones de polos en lazo cerrado) de la matriz G - H K . Ahora se deducirá una condición suficiente. Probaremos que si el sistema es de estado c pletamente controlable, existe una matriz K que hará los valores característicos de G - H K como desean, o ubicará los polos en lazo cerrado en las posiciones deseadas. Los valores característicos deseados de G - H K son //,, /u2, . . . ,/u„\cualesquiera valo característicos complejos deben presentarse como pares conjugados. Si observamos quela ecuac' característica del sistema original dado por la ecuación (6-50) es Izl
G| = z" + a ,z "_1 + a2z n~2 +
+ an-\Z + an = 0
puede definirse una matriz de transformación T como sigue: T = MW donde
M = [H : GH : ■• • i G " 1H]
www.FreeLibros.me
(6-
s e c c ió n 6 - 5
407
D is e ñ o v í a u b i c a c i ó n d e p o lo s
que es de rango n, y donde
&n-l @n-2 ^n-2 @n-3
ax
•
1
•
1
0
•
0
0
•
0
0
W =
(6-61) fll
1
1
0
•
Luego, de las ecuaciones (6-35) y (6-36), se tiene
1
O
1 --
1 0
O
0 0
•••
0
0 ••• ~ a „~2 ■' ■
1
T 1G T = G =
0
0
an
a n~i
~aK
V 0
ll
ll as i
0
_1_ II
00 3 1
A continuación se define (6-62)
•• Si]
Entonces 'o' 0 HK
[8„
• •
"o 0
0 0
• •• • ••
o' 0
0
0
• ••
0
S n - i
■••
«I.
«,] =
0 _1_
A
La ecuación característica ¡zl - G + HK| se convierte en |zl - G + H K l = |zl - G + H K) 1
0
0
1
... ...
0 0
0 0 0 0
... ...
0 0
0
0 0
0
0
0
1
1_
. —a„
~a„-i
= z
1
-
z
0
-1 z
0
0
a n + ¿L
an-1 + Sn-l
0 0
0 0
••• ■••
0 0
0
0
••• ••
5,
+
~ aK
A
Sn-l
0
0 0 -1 ••• z + ci\ + Si
= zn + («1 + 8l)zn-1 + ••• + (a„-t + 8„- i)z + an + 8n www.FreeLibros.me
0
(6-63)
40 8
U b i c a c i ó n d e p o lo s y d is e ñ o d e o b s e r v a d o r e s
C a p it u l e 5
La ecuación característica, con los valores característicos deseados, está dada por (z - M i)0 - M2)••■ (> - /L,) = z" + «) z "''1 + a 2zn
+ ••■+ a„_! z + a„ = 0
(6-64|
Igualando los coeficientes de potencias iguales de z correspondientes a las ecuaciones (6-631 y (6-64), obtenemos ai — fli +
Oti = C¡2 +
&2
Por lo tanto, de la ecuación (6-62),
K = KT 1 = [5„
■•■ Sj] T - 1
= [a„ - a„ : a„. i - a „_ i: •••:
i
- fli]T_1
donde las a , y las a, son coeficientes conocidos, y T es una matriz conocida. De modo que 1 determinado la matriz de ganancia de realimentación K requerida, en función de coeficientes cidos y de una matriz conocida del sistema. Esto prueba la condición de suficiencia; es decii sistema definido por la ecuación (6-50) es de estado completamente controlable, entonces si' será posible determinar la matriz de ganancia de realimentación del estado K, requerida p ubicación arbitraria de los polos. Por lo tanto, hemos demostrado que una condición neces suficiente para la ubicación arbitraria de los polos es que el sistema sea de estado completa controlable.
Fórmula de Ackermann. La expresión dada en la ecuación (6-65) no es la única utiliz; la determinación de la matriz de ganancia de realimentación del estado K. Existen otras expre disponibles. A continuación presentaremos una de ellas, comúnmente conocida como fórm\ Ackermann. Considere el sistema definido por la ecuación (6-50). Se supone que el sistema es de i completamente controlable. Mediante el uso de la realimentación del estado u(k) = - K x(k), se ubicar los polos en lazo cerrado enz = 1ul,z = /i2, . . . ,z = / v Es decir, deseamos que la eci característica sea
G = G - HK En vista de que el teorema de Cayley-Hamilton indica que G satisface su propia ecuación cara tica, tenemos que
G" + « iÓ " - 1 + a2G"~2 + ■• • + a„_i G + a nl = Utilizaremos esta última ecuación para deducir la fórmula de Ackermann.
www.FreeLibros.me
= 0
s e c c ió n 6 - 5
D i s e ñ o v í a u b i c a c i ó n d e p o lo s
409
Considere ahora las siguientes identidades: I = I G = G - HK G 2 = (G - H K )2 = G 2 - G H K - H K G G 3 = (G - H K )3 = G 3 - G 2H K - G H K G - H K G 2
G " = (G - H K )" = G " - G " J H K - •
- H K G " '1
Si multiplicamos las ecuaciones anteriores, en orden por a„ a n _ mente, y se suma los resultados, la misma a n
I + +
« n- i
G +
2 G 2 + • ■•
+ G"
=
a n
+ G "- a„_! H K - «„_2G H K -
I +
a „ -¡
a „ -2
G
a0(donde aü = 1), respectiva
+ a „ _ 2G 2
HKG
G"
H K -----
- HKG" 1 puede escribirse como
4>(G) =
= (G) - [h .: g
h
:---:g " ' ‘ h ]
H K G " 1 - G " '1H K
a „_ )K + a n_2K G + •••+ K G " '1 a „~2 K + a „-3K G + ■••+ K G " '2
(6-66) K
Observe que
an-i K + a „-2 K G + ••• + K G " a „_2K + a„-3K G + ••• + K G n—2 (6-67)
K Como el sistema es de estado completamente controlable, la matriz de controlabilidad [ H : G H i •■■i G " '1H ] tiene rango n, y su inversa existe. Por tanto, la ecuación (6-67) puede modificarse a la forma an-! K + ov.2K G + ••• + K G " '1'
a „-2 K + a„_3K G + ■•• + K G " '2
= [ H : G H : •■■•G " '1H ] '1
K
Premultiplicando ambos miembros de esta última ecuación por [0
www.FreeLibros.me
0 ■• • 0
1], obtenemos
410
U b i c a c i ó n d e p o l o s y d is e ñ o d e o b s e r v a d o r e s
[0
0
•••
0
1]
C a p í tu te ¡
a „_ iK + a n 2 KG + + K G "-1 a „- 2K + a „_3K G + ••• + K G "“ 2 K
=
[0
0
que se puede simplificar a K = [0
0
o
1][H •G H : ••■: G "_1 H]~*
(6-
La ecuación (6-68) proporciona la matriz de ganancia de realimentación del estado K requerida,; esta expresión en particular para la matriz K , la que comúnmente se conoce como fórmula Ackermann. [Vea el problema A-6-12 para la deducción de la ecuación (6-68), cuando n = 3.]
Comentarios. La matriz de ganancia de realimentación del estado K es determinada de i ñera que el error (causado por perturbaciones) se reducirá a cero con suficiente velocidad. Obs que para un sistema dado, la matriz K no es única, sino que depende de las localizaciones en cerrado deseadas (que determinan la velocidad de respuesta) que se haya seleccionado. La seleccid de los polos en lazo cerrado deseados o de la ecuación característica deseada es un punto medio < la velocidad de la respuesta del vector de error y la sensibilidad a perturbaciones y a ruido en I medición. Es decir, si aumentamos la velocidad de la respuesta de error, entonces, por lo gene aumentan los efectos adversos de las perturbaciones y de ruido en la medición. En la determinacü de la matriz de ganancia de realimentación del estado K para un sistema dado, es conveniente ex nar varias matrices K basadas en varias ecuaciones características deseadas, y seleccionar aqu que ofrezca un mejor desempeño general del sistema. Una vez seleccionada la ecuación característica deseada, existen varias formas de deter la matriz de ganancia de realimentación del estado K , correspondiente al sistema definido por 1 ecuación (6-50), que se supone de estado completamente controlable. A continuación se listan i tro de ellas. 1. Como
se
mostró en el análisis anterior, la matriz K se puede obtener de laecuación 0 K
[a„
an . ocn- 1
ít/i-i. * * *. oíj
= [a„ - a„ : an-i - a„-1: ■■■: a¡ - a ^ M W )-1 donde las
(
a, sonlos coeficientes de la ecuación característica del sistemaoriginal |zl - G| = z" + üíZ " ' 1 + ■■• + an- i z + a„ = 0
y las a, son los coeficientes de la ecuación característica deseada, correspondiente al sis de control con realimentación del estado; es decir, n- 1
|zl - G + H K| = z" + a, z'
+
+ a„~i z + a„ = 0
La matriz T está dada por T = MW donde M y W corresponden a las ecuaciones (6-60) y (6-61), respectivamente.
www.FreeLibros.me
M
S e c c ió n 6 - 5
D is e ñ o v í a u b i c a c i ó n d e p o lo s
Si la ecuación de estado del sistema ya está en la forma canónica controlable, la determinación de la matriz de ganancia de realimentación del estado K se puede simplificar, dado que la matriz de transformación T se convierte en la matriz identidad. En este caso, la matriz deseada K se obtiene sustituyendo T = M W = I en la ecuación (6-69). 2. La matriz de ganancia de realimentación del estado K deseada puede obtenerse mediante la fórmula de Ackermann:
K = [0
0
•••
0
1][H ':G H ;---:G ',- 1 H ]-1 (G)
(6-71)
donde
G + anI
Si los valores característicos que se desean //,, ¡u2, . . ., n„ son distintos, entonces la matriz de ganancia de realimentación del estado K requerida puede ser:
K = [1
1
•••
lJ ílii& .— 'ifc , ] - 1
(6-72)
donde los vectores £„ £2, . . . , £„ satisfacen la ecuación
g, = (G - M J - 'H , Observe que las ecuación
i = 1, 2, . . . ,n
son vectores característicos de la matriz G - H K , es decir, ¿¡, satisface la
(G - H K ) f c = M¡&,
i = l,2 ,...,n
Para una respuesta sin oscilación, ¡ut = ¿i2 = ■■■= puede simplificarse como sigue:
K = [l
0
= 0. La ecuación (6-72), en este caso,
0][gi i fe
fe,]"1
(6-73)
donde
£, = G
H,
£2 = G 2H,
...,
£„ = G " H
[Para conocer los detalles de la deducción de las ecuaciones (6-72) y (6-73), vea los problemas A-6-12 y A-6-13.] 4. Si es bajo el orden n del sistema, sustituya K = [ki \ k2 • •••i ¿„] en la ecuación característica
\zl - G + HK| = 0 y a continuación haga coincidir los coeficientes de las potencias de z de esta ecuación caracte rística, con potencias iguales de z de la ecuación característica deseada
z n + a.\Zn~l + • • • + an-\Z + a n = 0 Un cálculo directo de la matriz K como éste puede resultar más simple en sistemas de bajo orden. Ejemplo 6-6
Considere el sistema x ( k + 1) = G x( k) + Hí/(k)
www.FreeLibros.me
412
U b i c a c i ó n d e p o lo s y d is e ñ o d e o b s e r v a d o r e s
C a p ít u lo 6
donde 0 -0.16
G =
1 -1
H
Observe que zl - G =
z —1 = z2 + z + 0.16 0.16 z + 1
Por lo tanto,
ai = 1,
a2 = 0.16
Determine una matriz de ganancia de realimentación del estado K adecuada, tal que el sistema tenga los polos en lazo cerrado en z = 0.5 + /0.5,
z = 0.5 - y’0.5
Primero examinemos el rango de la matriz de controlabilidad. El rango de 0
[H IG H ] =
1
1 -1
es 2. Por lo tanto, el sistema es de estado completamente controlable, y es posible la ubicación arbitraria de polos. La ecuación característica para el sistema deseado es |zl - G + HK; = (z - 0.5 - ;0.5)(z - 0.5 + ;0.5) = z2 - z + 0.5 = 0 de modo que, «i = —1,
a2 = 0.5
Demostraremos cuatro formas para determinar la matriz K.
Método 1. De la ecuación (6-69), la matriz de ganancia de realimentación del estado K está dada co sigue: K = [«2 — a2: ot\ —
1 1 1 0
O
1 1 __ __ !
1 0
1
ai 1
T = M W = [H i GH]
O
Observe que el sistema original ya está en la forma canónica controlable, por lo que la matriz de transía mación T se convierte en I: 0
1
Por lo tanto, K = [a2 — «2: «i — ai] = [0.5 — 0.16: —D — 1] = [0.34
Método 2.
-2]
Refiriéndonos a la fórmula de Ackermann dada por la.ecuación (6-71), tenemos K = [0
donde
G) = G2 - G + 0.51 =
< f> (
1 ][H :G H ]~ X G )
0.16 0.16
0.34 0.32
-1 0.84
-2 2.34
www.FreeLibros.me
0 -0.16
0.5 1 + 0 -1
0 0.5
S e c c ió n 6 - 5
413
D is e ñ o v í a u b i c a c i ó n d e p o lo s
En concecuencia, K = [0
1]
= [0.34
o i
-i
r -i
0.34 0.32
-2 2.34
-2]
Método 3. De la ecuación (6-72), la matriz de ganancia de realimentación del estado K deseada, se determina como sigue: K = [l
l][fe
fe]-1
donde
Í, = (G -
i = 1,2
Dado que ju¡ = 0.5 +y'0.5, fe = [G - (0.5 +/0.5)I]-, H
-0.5 - /0.5 -0.16
1 -1.5 - ;0.5
“ -1
y i
En forma similar, para /j2 = 0-5 -J0.5, fe = [G - (0.5 - ;0.5)I]-‘ H
-0.5 + ;0.5 -0.16
i 1.5 + yo.5
-1
y 1
En consecuencia, tenemos que
[fe
fe]"' =
-1 0.66 + /
-1 0.66 — /
-0.5 - /0.5 0.66 + j
-0.5 + /0.5 0.66 — j
0.7178(1 - ;) -1.4356 1 + ;0.66 1 + ;0.66 -0.7178(1 + ; ) 1.4356 -1 + iO.66 -1 + /0.66J Por lo tanto se determina que la matriz de ganancia de realimentación del estado K deseada es K = [l
l][fe
fe ]" 0.7178(1 - /) 1 + y0.66
=
^ -0.7178(1 + /) -1 + yO.66 [0.34
-1.4356 -] 1 + ; 0.66 1.4356 -1 + yO.66
-2]
www.FreeLibros.me
414
U b i c a c i ó n d e p o lo s y d is e ñ o d e o b s e r v a d o r e s
Método 4.
C a p ít -
Es de observarse que, para sistemas de bajo orden como éste, puede resultar más sene
sustituir K = [£,
k2]
en la ecuación característica, y escribir la ecuación en función de las k aún sin determinar. De este rae esta ecuación será igual a la ecuación característica deseada. El procedimiento es el que sigue: |zl - G + HK =
"z 0" 0 z
0 -0.16
l' "o" + [*. -1 1
i z 10.16 + ki
-1 z + 1 + k2
k 2]
— z2 + (1 + k2)z + 0.16 + k\ — 0 Ahora igualamos esta ecuación característica a la ecuación deseada (z - 0.5 - /0.5)(z - 0.5 + /0.5) = 0 de modo que z2 + (1 + k2)z + 0.16 + k\ = z2 - z + 0.5 Comparando los coeficientes con potencias iguales de z, obtenemos 1 + k 2 = -1,
0.16 + k x = 0.5
de donde
k , = 0.34,
k 2 = -2
Por lo tanto, la matriz de ganancia de realimentación del estado K deseada es K = [*,
k2] = [0.34 -2]
Observe que para sistemas de orden superior, los cálculos involucrados en este método pueden ser laboriosos. En tal caso será preferible usar otros métodos.
Respuesta con oscilaciones muertas.
Considere el sistema definido por
\ ( k + 1) = Gx(k) + H w (*) Con realimentación de estado u(k) = -Kx(£), la ecuación de estado se convierte en x (* + 1) = (G - H K )x (* ) Observe que la solución de esta última ecuación está dada por x(fc) = (G - H K )*x (0 )
(6-~
Si los valores característicos u„ de la matriz G - H K se presentan dentro del círculo unitario, e ces el sistema es asintóticamente estable. A continuación demostraremos que si seleccionamos todos los valores característicos G - H K como cero, es posible obtener la respuesta con oscilaciones muertas, es decir,
\(k) = 0,
para k > q , q < n
En el análisis de la respuesta con oscilaciones muertas, la matriz de potencia nula
www.FreeLibros.me
S e c c ió n 6 -5
D i s e ñ o v í a u b i c a c i ó n d e p o lo s
41 5 0 0
1 0
0 1
• • 0 • • 0
0 0
0 0
0 0
• • 1 • • 0
N =
juega un papel de importancia. Considere, por ejemplo, la matriz de 4 x 4 de potencia nula:
N =
0 0 0 0
1 0 0 0
0 1 0 0
0 0 1 0.
0 0 0 0
0 0 0 0
1 0 0 0
Observe que 2_
N:
0 0 0 0
0 0 0 0
1 0 0 1 0 0 0 0
'o 0 N3 = 0 0
N4
0 0 0 0
0 0 0 0
0 0 0 0
0 0 0 0
En forma similar, para una matriz N de potencia nula de n x n, N" = 0 Ahora considere el sistema de estado completamente controlable dado por
\ { k + 1) = Gx(A:) + H u ( k )
(6-75)
Hagamos que las localizaciones deseadas de los polos sean el origen, o bien, que los valores carac terísticos deseados sean cero: //, = /i 2 = ■•• = //„ = 0. Entonces podemos demostrar que la respuesta a cualquier estado inicial x(0) es con oscilaciones muertas. En vista de que la ecuación característica que tiene los valores característicos deseados puede darse por (z - juOO - |U2) •■•(z - p.„) = z" + « i z"-1 + ••• + a„-i z + a n = z" obtenemos a i = a2 = ■■• = a„ = 0 \ lamatriz
K dada por
la ecuación (6-65) puede simplificarse a:
K = [a„ - an i a„_, - a n-1•■•••a i = [- a „
ai]T~'
••■ - a i]T “ ‘
Utilizando la matriz de transformación T dada por la ecuación (6-32), definimos
x(k) = Tx(fc) Definimos también T ’ GT = G,
T ‘H = H
Entonces, la ecuación (6-75) se puede escribir como:
x( k + 1) = T '1GTx(Ar) + r ‘ H « (K ) = Gx(k) + H « ()t)
www.FreeLibros.me
(6-76)
416
Ubicación de polos y diseño de observadores
C a p ífü c
Si utilizamos la realimentación del estado u{k) = -Kx(k) = - k T x (k), entonces esta última ecuación ¡ convierte en
x(k + 1) = (G - H KT)x(/c) Por la ecuación (6-76), 'I G - HKT H[ ~an
an~
•
-fli]
0 ' 0
0 0
1 0
0 1
... ...
0
0
0
••■ 1 ••• -«!_
[
—a n
ttn-1 ~ a n
0 0 0
—a n
0 ' 0
1 0
0 1
... ...
0
0
1 ••• - a K
dn- 1 ~a„
0 0
1 0
0 1
• ■ o" • • 0
0 0
0 0
0 0
• • 1 • • 0
@n- 1
“ «i]
0 0
0 0
0 0
•
0 0
0
0
0
•
0
■
~ a n ~~an- 1 ~On- 2 ■ • - a
Así que G - H K T es una matriz de potencia nula, por lo que
(G - H K T)" = 0 En términos del estado original x(k), tenemos
x(n) = (G - H K )"x(0) = ( T G T 1 - T H K )"x(0) = [T(G - H K ^ T ^ f x C O ) = T (G - H K T)" T _1 x(0) = 0 De este modo hemos demostrado que si los valores característicos deseados son todos cero, ente cualquier estado inicial x(0) se puede llevar al origen en por lo menos n períodos de muestreo.; respuesta es con oscilaciones muertas, siempre y cuando la señal de control u(k) sea no acot
Comentarios acerca del control con oscilaciones muertas. E l concepto de la respuesta) oscilaciones muertas es único para los sistemas de control en tiempo discreto. En los siste control en tiempo continuo no existe la respuesta con oscilaciones muertas. En el control con < ciones muertas, cualquier vector de error distinto de cero será llevado a cero en no más de n \ de muestreo, si la magnitud del control escalar u(k) no está acotada. E l tiempo de asent, depende del período de muestreo, ya que la respuesta se asienta en, a lo más, n períodos de mu Si el período de muestreo T se escoge muy pequeño, el tiempo de asentamiento también será i pequeño, y esto implicará que la señal de control tenga una magnitud extremadamente grande, ser así, no sería posible llevar la respuesta de error a cero en un período corto. En el control con oscilaciones muertas, el período de muestreo es el único parámetro de i ño. Por lo tanto, si se desea una respuesta con oscilaciones muertas, el diseñador deberá escoge cuidado el período de muestreo, de forma que en la operación normal del sistema no se requ una magnitud de control extremadamente grande. Aprecie que no es físicamente posible au
www.FreeLibros.me
i
S e c c ió n 6 - 5
417
D is e ñ o v í a u b i c a c i ó n d e p o lo s
sin límite la magnitud de la señal de control. Si la magnitud es incrementada en forma suficiente, siempre tendrá lugar el fenómeno de saturación. Si la saturación ocurre en la magnitud de la señal de control, entonces la respuesta ya no podrá tener oscilaciones muertas. El tiempo de asentamiento será mayor que n períodos de muestreo. En el diseño real de los sistemas de control con oscilaciones muertas, el diseñador debe estar consciente del intercambio a efectuar entre la magnitud de la señal de control y la velocidad de respuesta. Ejemplo 6-7 Considere el sistema dado por 0 -0.16
l" -D(k) + ’o’ u{k) (6-77) -1 M k )_ 1 Determine la matriz de ganancia de realimentación del estado K, tal que cuando la señal de control esté dada por
x x(k + 1) x2(k + 1)
u{k) = -Kx(/c) el sistema en lazo cerrado (sistema de regulación) exhiba la respuesta con oscilaciones muertas a un estado inicial x(0). Suponga que la señal de control a(k) no está acotada. Refiriéndonos a la ecuación (6-76), para la respuesta con oscilaciones muertas, tenemos que K = [- « 2 - a ,]!-1
(6-78)
El sistema dado por la ecuación (6-77) ya tiene la forma canónica controlable. Por lo tanto, en la ecuación (6-78). T = I. La ecuación característica del sistema dado por la ecuación (6-77) es zl - G =
-1 = z + z + 0.16 = z + a, z + a2 z +1
z 0.16
Y por lo tanto.
a¡ = 1,
a2 = 0.16
En consecuencia, la ecuación (6-78) se convierte en K = [~a2 -a,] = [-0.16
-1]
Esto proporciona la matriz de ganancia de realimentación del estado deseada. Verifiquemos que la respuesta del sistema a un estado inicial arbitrario x(0) es en realidad la respuesta con oscilaciones muertas. En vista de que la ecuación de estado en lazo cerrado se convierte en x, (k + 1) 0 1 x {(k) [0.16 1] *1(k) x2(k + 1) -0.16 -1 x 2(k) x 2(k) 0 1 0 0
x, (k) x 2(k)
si el estado inicial está dado por
x,( 0) x 2(0) donde a y b son constantes arbitrarias. 0
1
‘* . ( 0 ) '
’o
1
_*2(1)_
0
0
jt2(0)
0
0
x,( 2)
"o
1
0
0
'*,(1)'
^ (2 )j
Y
1)
_*2(1)_
’o
1
0
0
www.FreeLibros.me
a b Y
0
Y 0
’ o" 0
41 8
U b i c a c i ó n d e p o lo s y d is e ñ o d e o b s e r v a d o r e s
C a p r jc
Entonces, el estado x(k) para k = 2, 3, 4, . . . se convierte en cero y la respuesta tiene en oscilaciones muertas.
Ubicación de polos cuando la señal de control es un vector. Hasta este momento he considerado el problema de la ubicación de polos cuando la seftal de control es un escalar. Si la ; de control es una cantidad vectorial (vector de dimensión r), se puede acelerar la respuesta, existe más libertad para escoger las señales de control u t(k), u2{k), . . . , ur(k) a fin de acelerar I respuesta. Por ejemplo, en el caso de un sistema de orden n con un control escalar, la respuesta < oscilaciones muertas se puede conseguir en a lo más n períodos de muestreo. En el caso del cc de vector u(¿), la respuesta con oscilaciones muertas puede conseguirse en menos de n períodos < muestreo. En el caso del control con un vector, sin embargo, se hace más compleja la determinación áef matriz de ganancia de realimentación del estado K . En el apéndice C presentaremos un caso de ¡ tipo. Sistema de control con entrada de referencia. Hasta ahora hemos considerado sistemas^ regulación. En el sistema regulador, la entrada de referencia queda fija durante un largo peric las perturbaciones externas crean estados distintos de cero. La ecuación característica para el sis determina la velocidad mediante la cual los estados no nulos se acercan al origen. A contini consideraremos el caso en el que el sistema tiene una entrada de referencia. Considere el sistema mostrado en la figura 6-2. La planta queda descrita por las sigu* ecuaciones de estado y de salida: x( k + 1) = Gx(A:) + H «(fc) y ( k ) = Cx(k) La señal de control u(k) está dada por
u (k ) = K 0r(k) - K x (£ ) Si eliminamos u{k) de la ecuación de estado, tenemos que
x ( k + 1) = (G - H K )x(k) + H K 0r(k) La ecuación característica para el sistema es
\zl - G + H K| = 0 Como se enunció antes, si el sistema es de estado completamente controlable, entonces puede. minarse la matriz de ganancia de realimentación K , a fin de que proporcione los polos en cerrado deseados.
Figura 6-2
Sistema de control con realimentación del estado.
www.FreeLibros.me
S e c c ió n
6-5
419
D i s e ñ o v í a u b i c a c i ó n d e p o lo s
Es importante señalar que la realimentación del estado puede modificar la ecuación caracterís tica correspondiente al sistema, pero que/al hacerlo, se modifica la ganancia en estado permanente del sistema completo. Por lo tanto, es necesario tener una ganancia ajustable K 0 en el sistema. Esta ganancia K0 debe ajustarse de tal forma que la respuesta escalón unitario del sistema en estado permanente sea la unidad, o que y( ^) = 1. A fin de aclarar los detalles, veamos el siguiente problema de ejemplo. Ejemplo 6-8
Considere el sistema definido por
x(k + 1) = Gx(fc) + Hu(Ar) y ( k ) = Cx(*) u(k) = K0r(k) - Kx(/c) donde G =
0 -0.16
1 -1
H =
C = [l
0]
Diseñe un sistema de control tal que los polos en lazo cerrado deseados de la ecuación característica estén en
Zj = 0.5 + yo.5,
z 2 = 0.5 - yo.5
Entonces el polinomio característico deseado está dado por |zl — G + HKj = (z - 0.5 - y0.5)(z - 0.5 + yo.5)
= z 2 - z + 0.5 La matriz de ganancia de realimentación del estado K puede ser determinada como K = [0.34
-2]
(Vea el ejemplo 6-6 para la determinación de la matriz K.) Utilizando esta matriz K, la ecuación de estado se convierte en
\(k + 1) = (G - HK)x(Jfc) + HK0r(k) = Gx(k) + Hr(k) donde G = G - H K, H = HK0 La constante de ganancia K0 puede determinarse en el espacio de estados o en el plano z, mediante la función de transferencia de pulso. En este ejemplo, utilizaremos este último método. La función de transferencia pulso Y(z)tR(z) para este sistema, es
G(z ) = C (zl - G )“ 'H donde
G = G - HK =
0 -0.16
1 -1
o’ [0.34 1
www.FreeLibros.me
-2 ] =
0
1
-0 .5
1
420
U b i c a c i ó n d e p o lo s y d is e ñ o d e o b s e r v a d o r e s
C a p ít u :
Por lo tanto. ’ z 0.5
-1 z - 1
-1
1 O 1
G (z) = [ 1 0]
. K°.
K0 z + 0.5 Así que
Y(z) R(z)
G(z ) =
K„ z 2 - z + 0.5
Para determinar la constante de ganancia K0, utilizamos la condición de que sea la unidad la salid estado permanente y M para la entrada escalón unitario, es decir, limy(fc) = lím (l - z~‘) Y(z ) z *1
= lim -
z^l
Kq
1
z
z —z
z
0.5 z - 1
= 2K0 = 1 En comsecuencia, hemos determinado Kn como
K0 = 0.5 La figura 6-3 muestra los diagramas de bloques del sistema diseñado. La respuesta escalón unitr este sistema puede obtenerse con facilidad mediante el uso de MATLAB. El programa 6-1 de MAi es uno de muestra para obtener la respuesta escalón unitario. La figura 6-4 muestra la curva de resc» resultante.
(a)
rik)
(b) Figura 6-3
(a) Diagrama de bloques de] sistema de control diseñado en el ejemplo 6-8; (b) diagrama de bk
simplificado.
www.FreeLibros.me
S e c c ió n 6 - 6
421
O b s e r v a d o r e s d e e sta d o
6-1 MATLAB PRO GRAM A num = [0
0
0.5];
den = [1
-1
0.5];
r = ones(1,41); v = (0 40 axis(v);
0
1.6];
k = 0:40; y = filter(num,den,r); p lo t(k ,y,'o ') grid title f Respuesta escalón unitario') x le b e l('k ') ylebel]' y (k )')
Respuesta escalón unitario — T-----' • —
1.6
"
1.4 o 5
1.2 O •• • O........... o. Q. Q. o. > 0 0 0 o
........... o
o 0 0 0
1
> 0000
o o •o o-
0 0 0 0-4
0 .6
-
o O
0.4 ............
-
0 . 2 ..........
I.......... i...................... i...................... i.........-
. ------1------1------¡------1------i----i------1
0¿_e 0
5
10
15
20
25
30
35
40
k Figura 6-4
Respuesta escalón unitario del sistema mostrado en la figura 6-36).
* 6 O BSERV A D O RES DE ESTADO En la sección 6-5 analizamos un método para el diseño de la ubicación de polos, que utiliza la realimentación de todas las variables de estado, con el fin de formar el vector de control deseado. En la práctica, sin embargo, no todas las variables de estado están disponibles para la medición directa. En muchos casos prácticos, sólo son medibles unas cuantas variables de estado de un sistema dado, mientras que las demás no lo son. Puede ser, por ejemplo, que sólo las variables de salida son
www.FreeLibros.me
422
U b i c a c i ó n d e p o lo s y d is e ñ o d e o b s e r v a d o r e s
------ ✓ N ---— —J^ S ------
Observador de estado
C a p ít u l o 6
íU ) . Figura 6-5 estados.
Diagrama esquemático del observador de
medibles. En este caso, será necesario estimar aquellas variables de estado que no puedan medirse directamente. Esa estimación suele llamarse observación. En un sistema práctico es necesario obser var o estimar las variables de estado no medibles a partir de las variables de salida y las de controL Un observador de estados, también conocido como estimador de estados, es un subsistí del sistema de control que lleva a cabo una estimación de las variables de estado, a partir de mediciones de las variables de salida y control. Aquí, el concepto de observabilidad analizado en sección 6-3 juega un papel importante. Como veremos más adelante, se pueden diseñar observ res de estados si, y sólo si, se satisface la condición de observabilidad. En los análisis siguientes de los observadores de estado, utilizaremos la notación x ( k ) designar el vector estado observado. En muchos casos, este vector x ( k) se utiliza en la realiment del estado para generar el vector de control óptimo. En la figura 6-5 se muestra un esquema de observador de estados. El observador de estado tendrá y(k) y u(k) como entradas, y x (k) como lida. A continuación analizaremos, primero, la condición necesaria y suficiente para la observas del estado, y después estudiaremos el observador de estados de orden completo. La observación estado de orden completo significa que observamos (estimamos) las n variables de estado, sin portar si algunas variables de estado están disponibles para la medición directa. A veces, o sólo necesitamos la observación de las variables de estado no medibles, pero no de aquellas di¡ mente medibles, esto resulta innecesario. La observación de sólo las variables de estado no medí se conoce como observación de estado de orden reducido, y se analizará más adelante en esta ción. La observación de las variables de estado no medibles, además de algunas (no todas) las v bles de estado medibles, se conoce como observación de estado de orden reducido.
Condición necesaria y suficiente para la observación del estado. La figura 6-6 muestra^ sistema de regulación con un observador de estados. Analizaremos una condición necesaria \ ciente, según la cual puede observarse (estimarse) el vector estado. De la figura 6-6 obtenemos I ecuaciones de estado y de salida como sigue: \ { k + 1) = Gx(A:) + Hu(fc) y (k) = Cx(k) donde
x(k) = vector de estado (de dimensión n ) u(£) = vector de control (de dimensión r) y(k) = vector de salida (de dimensión m) G = matriz no singular de n x n H = matriz d e n * r C = matriz de m * n
www.FreeLibros.me
(6-1 (6
S e c c ió n 6 - 6
423
O b s e rv a d o re s d e e sta d o
Figura 6-6
Sistema de regulación, con un observador de estados.
A fin de poder observar (estimar) las variables de estado, debemos ser capaces de obtener x(k + 1) en términos de y(k), y (k - 1 , y (k - n + 1), y u(£), u(£ - 1 , u(& - n + 1). De la ecuación (6-79),
G“’ x(& + 1) = x(k) 4- G“'Hu(A:) es decir,
x(k) = G 'x(& + 1) - G 'Hu(A:)
(6-81)
Desplazando k en 1, obtenemos
x(k - 1) = G"'x(A:) - G~‘ Hu(A: - 1) Sustituyendo la ecuación (6-81) en la ecuación (6-82) resulta
x{k - 1) = G - l[G~l x(k + 1) - G-1 Hu(/c)] - G ‘ Hu(& - 1) = G“2x(A: + 1) - G~2Hu(k) - G“‘Hu(A: - 1) En forma similar,
x(k - 2) = G“2x(A:) - G 2Hu(A: - 1) - G
Hu(£ - 2)
= G~3x(k + 1) - G“3Hu(A:) - G 2Hu(A: - 1) - G ‘ Hu(tt - 2)
x(k - n + 1) = G~nx(k 4- 1) - G_"HuOfc) - G " +1H ii(á: - 1) G- 1 pu(Jfc - n + 1) Sustituyendo la ecuación (6-81) en la ecuación (6-80), obtenemos
y(k) = Cx(k) = CG^‘ x(A: + 1) - CG 'Hu(fc)
www.FreeLibros.me
(6-82)
424
U b i c a c i ó n d e p o l o s y d is e ñ o d e o b s e r v a d o r e s
C a p ít u
Asimismo,
y( k - 1) = C \ ( k - 1) = C G '2x(fc + 1) - C G 2H u (A ) - C G
H u(£ - 1)
y (* - 2) = C \ ( k - 2) = CG~i x(k + 1) - C G 3Hu(A:) - C G 2H u (k - 1) — C G -1 Hu(/c - 2)
y(k — n + 1) = Cx( k - n + 1) = CG^xCA; + 1) - CG nHu(k) - C G "+1H u (k - 1 ) C G _1Hu(A: - n + 1) Si combinamos las n ecuaciones anteriores en una ecuación matricial, obtenemos
y(k) y( k - i )
=
y {k - n + 1)_
CG 1 CG 2
x(k + 1)
CG" CG
H
1
O
o bien CG 1 CG 2
u (k - 1)
--- 1 X
. u
C G " +1H
C G "H
u (k)
0 0
0
CG H C G 2H
u (k — n + 1)_
y(k) y(k - 1)
x(k + 1) =
c 1 1
o u1
y (k - n + 1)_
+
CG H C G 2H
0 C G 1H
C G "H
C G n+1H
0 0 CG
u(/c) u (k - 1) H
u (k - « + ! ) . (
Observe que el segundo miembro de la ecuación (6-83) es totalmente conocido. Por lo tanto, x(k puede determinarse si y sólo si
rango
CG ' CG 2 =n CG "
Dado que la matriz G es no singular, multiplicar por G " cada uno de los renglones del primer i bro de la ecuación (6-84) no cambia la condición de rango. Por lo tanto, la ecuación (6-84 equivalente a CG" 1 rango
CG " 2
www.FreeLibros.me
S e c c ió n 6 - 6
425
O b s e r v a d o r e s d e e sta d o
que también equivalen a rango [C * G *C * ••■ (G*)"-' C *] = n
(6-85)
Es claro que ésta es la condición de observabilidad completa del sistema definido por las ecuaciones (6-79) y (6-80). [Refiérase a la ecuación (6-17).] Esto significa que si se satisface la ecuación (6-85) (es decir, si el sistema es completamente observable), entonces se puede determinar x(k + 1) a partir dey(£), y ( k - \ ) , . . . , y ( k - n + l) y u(k), u ( k - 1 ) , . . . , u (*- n + 1). Por lo tanto, hemos demostrado que la condición necesaria y suficiente para la observación del estado es que el sistema sea comple tamente observable. Como caso especial, si y(k) es un escalar y la matriz C es una de 1 * «, entonces se puede obtener \(k + 1) premultiplicando ambos miembros de la ecuación (6-83) por el inverso de la matriz dada en la ecuación (6-84), como sigue: CG ' CG 2
y ( k )
y ( k - 1)
1 O 0 31 1
x(k + 1) =
-1
y {k - « + !)_
C G 1 CG 2
+
-1
CG H C G 2H
C G 'H
C G "H
C G " +1H
0
0 0
u(* ) u(* - 1)
.
■
1
1
1
1
BS
Ü
u
c 1
O
u
u(k - « + !)_ ( 6 - 86 )
La ecuación (6-86) proporciona el valor \(k + 1) cuando y{k) es un escalar. Como quedó demostrado en el análisis anterior, el estado \{k + 1) puede determinarse a partir de la ecuación (6-83), siempre que el sistema sea completamente observable. Por lo tanto, para un sistema de esta clase, el vector de estado puede determinarse en n períodos de muestreo como máxi mo. En presencia de perturbaciones externas y ruido en la medición, sin embargo, este método puede no ofrecer una determinación precisa del vector de estado. Por ello, para determinar el vector de estado, en presencia de perturbaciones y ruido en la medición, es necesario un enfoque distinto. Asimismo, si la matriz C no es una de 1 x n sino una de m * n (con m > 1), no puede definirse la inversa de la matriz de la ecuación (6-84), y la ecuación (6-86) no es aplicable. Con el fin de resolver estos casos, un método muy poderoso para la estimación del vector de estado es utilizar un modelo dinámico del sistema original, como sigue: Considere el sistema de control definido por las ecuaciones (6-79) y (6-80). Supongamos que el estado \(k) debe aproximarse al estado x ( k) del modelo dinámico:
í ( k + 1) = Gx(Jfc) + HuOfc) y (k) = C x( k)
(6-87) (6-88)
donde las matrices G, H y C son las mismas que las del sistema original. Asimismo, supongamos que el modelo dinámico está sujeto a la misma señal de control u(k) que el modelo original. Si las condiciones iniciales para el sistema real definido por las ecuaciones (6-79) y (6-80), y para el modelo dinámico definido por las ecuaciones (6-87) y (6-88), son las mismas, entonces el estado
www.FreeLibros.me
426
U b i c a c i ó n d e p o lo s y d is e ñ o d e o b s e r v a d o r e s
C a p ít u lo ó
x (k) y el estado x(k) serán iguales. Si las condiciones iniciales son distintas, entonces el estado x (k) y el estado x(k) serán distintos. No obstante, si la matriz G es una matriz estable, x ( k) se acercará a x(k), aun en el caso, que veremos, en que las condiciones iniciales sean diferentes. Si identificamos la diferencia entre x(k) y x (k) como e(¿), o definimos
t ( k ) = x(k) - x(k) entonces al sustraer la ecuación (6-87) de la ecuación (6-79), obtenemos
x( k + 1) - x( k + 1) = G[x(Jfc) - x (* )] es decir,
e(k + 1) = Ge(fc) Si la matriz G es estable, entonces e(k) se acercará a cero y x (k) a x(k). Sin embargo, el comporta miento del vector de error, que sólo depende de la matriz G, puede no ser aceptable. Asimismo, si la matriz G no es una matriz estable, entonces el error e(k) no se acercará a cero. Es, por lo tanto, deseable modificar el modelo dinámico definido por las ecuaciones (6-87) y (6-88). Debe mencionarse que a pesar de que el estado x(k) puede no ser medible, la salida y (k) si lo es E l modelo dinámico definido por las ecuaciones (6-87) y (6-88) no utiliza la salida medida y(k). E3 desempeño del modelo dinámico puede mejorar si se utiliza la diferencia entre la salida medida yi.ct y la salida estimada C x ( k) para vigilar o monitorear el estado x (£); es decir, si el modelo dinámic® de la ecuación (6-87) se modifica de la forma siguiente:
x( k + 1) = G x(k) + Hu(fc) + K e[y (£ ) - C x(& )] donde la matriz Ke sirve como matriz de ponderación. (Esto significa que la dinámica del observador de estados que se mostró en la figura 6-6 debe estar dada por esta última ecuación.) En presencia del discrepancias entre las matrices G y H utilizadas en el modelo y las del sistema real, la adición de tej diferencia entre la salida medida y la salida estimada ayudará a reducir las diferencias entre el mode-J lo dinámico y el modelo real. I A continuación analizaremos detalles del observador cuya dinámica está caracterizada pon matrices G y H, y por el término adicional de corrección, formado por la diferencia entre la s a liM medida y la salida estimada. I El orden del observador de estados que se a n a il zara aquí es el mismo que el correspondiente al sistema. Como ya se indicó, un observador á fl estados como éste se conoce como observador de estados de orden completo. I En el análisis siguiente supondremos que el estado real x(k) no puede medirse en forma d ir á * ta. Si el estado x(k) debe estimarse, es conveniente que el estado observado o el estado estim aifl x ( k ) sean tan cercanos al estado real x(k ) como sea posible. Aunque no es necesario, resulta co n x « niente que el observador de estados tenga las matrices G y H iguales a las del sistema original. I Es importante observar que en el análisis presente, el estado x(k ) no está disponible par» ■ medición directa y, en consecuencia, el estado observado x (k) no puede compararse con el e s u d
Observador de estados de orden completo.
www.FreeLibros.me
S e c c ió n 6 - 6
O b s e r v a d o r e s d e e sta d o
Figura 6-7
427
Sistema de control con realimentación del estado.
real x(k). Sin embargo, dado que la salida y (k) = C x (k) sí puede medirse, es posible comparar y (k) = C x ( k ) con y(k). Considere el sistema de control con realimentación del estado que se muestra en la figura 6-7. Las ecuaciones del sistema son
x(k + 1) = Gx(fc) + Hu( k ) y(k) = Cx(k)
(6-89) (6-90)
u(k) = - K x ( k ) donde
x(k) = vector de estado (de dimensión «) u(L) = vector de control (de dimensión r) y (k) = vector de salida (de dimensión m) G = matriz no singular d e « x / i H = matriz de n x r C = matriz de m x n K = matriz de ganancia de realimentación de estado (matriz d e/ttx r) Suponemos que el sistema es de estado completamente controlable y completamente observable, pero que x(k ) no está disponible para medición directa. La figura 6-8 muestra un observador de estados incorporado el sistema de la figura 6-7. E l estado observado x (k) se utiliza para formar el vector de control u(A), es decir u (¿ ) =-Kx(At)
(6.91)
De la figura 6-8, tenemos que
x(k + 1) = G x( k) + Hu(£) + K e[y(At) - y (^ )]
(6-92)
donde Kc es la matriz de ganancia de realimentación del observador (una matriz den x ni). Esta última ecuación puede modificarse y resultar x(k + 1) = (G - K« C)x(k)
+ Hu(k) +
www.FreeLibros.me
Key(k)
(6-93)
428
Figura 6-8
U b i c a c i ó n d e p o lo s y d is e ñ o d e o b s e r v a d o r e s
C a p it u le
Sistema de control con realimentación del estado observado.
El observador de estados dado por la ecuación (6-93) se llama observador de predicción, pues estimado \ ( k + 1) está un período de muestreo adelante de la medición y(k). Los valores carac' ticos de G - K, G suelen conocerse como polos del observador.
Dinámica del error de observador de estados de orden completo. x(k), entonces la ecuación (6-93) se convierte en
Observe que si
x(A: + 1) = Gx(k) + Hu(fc) que es idéntica a la ecuación de estado del sistema. Por lo tanto, si x (k) = \(k), la respuesta sistema de observador de estados es idéntica a la del sistema original. Para obtener la ecuación de error del observador, restemos la ecuación (6-93) de la ec (6-89):
x(k + 1) - x{k + 1) = (G - K e C)[x(/c) - x ( k )]
(
Ahora definamos la diferencia entre x(k) y x (k) como el error e(k):
e(k) = x(k) - x(k) La ecuación (6-94) se convierte, entonces, en
e(k + 1) = (G - K e C)e(k)
(
De la ecuación (6-95) vemos que el comportamiento dinámico de la señal de error queda det do por los valores característicos de G - K C. Si la matriz G - K .C es una matriz estable, el de error convergirá a cero para cualquier error inicial e(0). Es decir, x ( k) convergirá a x(k) i
www.FreeLibros.me
S e c c ió n 6 - 6
429
O b s e rv a d o re s d e e sta d o
dientemente de los valores de x(0) y x (0). Si los valores característicos de G - K t,C están localiza dos de forma tal que el comportamiento dinámico del vector de error es adecuadamente rápido, entonces cualquier error tenderá a cero con una velocidad adecuada. Una forma de obtener una respuesta rápida es utilizar una respuesta con oscilaciones muertas. Esto puede obtenerse si a todos los valores característicos de G - K ,C se les da un valor igual a cero
Comentarios. Dado que el sistema definido por las ecuaciones (6-89) y (6-90) se supone comple tamente observable, es posible una ubicación arbitraria de los valores característicos de G - K t.C. Para explicar esto más ampliamente, observe que son iguales los valores característicos de G - K (C y los de G * —C * K * . Mediante el principio de dualidad presentado en la sección (6-3), la condición para la observabilidad completa del sistema definido por las ecuaciones (6-89) y (6-90) es la misma que la condición para la controlabilidad completa del estado para el sistema x( k + 1) = G *x(k) + C*a(k)
(6-96)
En la sección 6-5 vimos que la ubicación arbitraria de los polos es posible para el sistema de la ecuación (6-96), siempre y cuando sea de estado completamente controlable, o el rango de la matriz [c * ; g * c * :- - - ;( g *)',-1c *] sea n. [Ésta es la condición para la observabilidad completa del sistema definido por las ecuaciones (6-89) y (6-90).] Para el sistema definido por la ecuación (6-96), mediante la selección de un conjun to de n valores característicos deseados de G * - C *K , puede determinarse la matriz de ganancia de realimentación del estado K. La matriz deseada, K c, tal que los valores característicos de G - K^C son los mismos que los de G * - C *K , está relacionada con la matriz K mediante la ecuación K t = K*.
Ejemplo 6-9 Considere el sistema
x(k + 1) = Gx(/c) + H u(k) y{k) = Cx(k) donde 0 -0.16 H = C = [0 1] 1 -1 Diseñe un observador de estado de orden completo, suponiendo que la configuración del sistema es idéntica a la mostrada en la figura 6-8. Los valores característicos deseados para la matriz de observador son G =
z = 0.5 + )0.5,
z = 0.5 - j0.5
y por lo tanto la ecuación característica que se requiere es (z - 0.5 —;0.5)(z - 0.5 + ;0.5) = z2
z + 0.5 = 0
Dado que la configuración del observador de estados está especificada como se muestra en la figura 6-8, el diseño del observador de estados se reduce a la determinación de una matriz de ganancia de realimentación de observador K, apropiada. Antes de continuar, examinemos la matriz de observabilidad. El rango de [c * : g *c *]=
j
www.FreeLibros.me
430
U b i c a c i ó n d e p o l o s y d is e ñ o d e o b s e r v a d o r e s
C a p í;
es 2. Por ello, el sistema es completamente observable y es posible determinar la matriz de gananc realimentación del observador deseada. Refiriéndonos a la ecuación (6-95), e(* + 1) = (G - K , C)e(k) donde
e(k) = x(k) - x(k) la ecuación característica del observador se convierte en |zl - G + K„C | = 0 Identifiquemos la matriz de ganancia de realimentación del observador K e como sigue: K. tntonces, la ecuación característica se convierte en o’ 1
1
SO O 1
"l 0
O
z
-1
ki
+
[0
1]
A
z —1
0.16 + ki =0 z + 1 + k2
que se reduce a z2 + (1
k ^ z + ki + 0.16 = 0
Dado que la ecuación característica deseada es z2 - z + 0.5 = 0 al comparar la ecuación (6-97) con esta última, obtenemos
k t = 0.34,
k2 = - 2
es decir. Kt =
0.34 -2
Observe que existe una relación dual entre la ecuación de estado del sistema considerado en el 6-6 y la del sistema presente. La matriz de ganancia de realimentación del estado K obtenía ejemplo 6-6 es K = [0.34 - 2], La matriz de ganancia de realimentación del observador K eobter. se relaciona con la matriz K mediante la relación Ke = K*.
Diseño de los observadores de predicción. Hasta ahora hemos discutido los ob: res de predicción de orden completo. Se trata de observadores de predicción porque el x ( k + 1) está un período de muestreo delante de la medición y(k). Resolvimos un prob ejemplo sencillo, suponiendo una matriz Ke que determinaba que la ecuación característica zl K ,C = 0 tuviera valores característicos prescritos. A continuación analizaremos un método general para determinar la matriz de ganancia de realimentación del observador K t„ Considere el sistema definido por x( k + 1) = G x(& ) + Hu(A:) y ( k ) = C x(k)
www.FreeLibros.me
I
S e c c ió n ó - ó
O b s e rv a d o re s d e e sta d o
431
donde
x(k) = vector de estado (de dimensión n) u(A) = vector de control (de dimensión r) y(k) = señal de salida (escalar) G = matriz no singular de n * n H = matriz de n * r C = matriz de 1 x « El sistema se supone de estado completamente controlable y completamente observable. Por lo tanto, la inversa de [C * :G * C * :- - - :(G * )'," 1C *] existe. Asimismo, suponemos que la ley de control a utilizar es u (k) = - K x( k) donde x ( k ) es el estado observado y K es una matriz de n x r. Supongamos, además, que la configu ración del sistema es la misma que la mostrada en la figura 6-8. La dinámica del observador de estados está dada por la ecuación
x(k + 1) = G x( k) + H u(/:) + K e[y(A:) - y(/0 ] ( 6- 100) = (G - K, C)í(Jfc) + Hu(Kc) + Kt Cx(k) Primero definimos
Q = (WN*)"1
( 6- 101)
N = [C* : G*C* : • • •! (G* ) n_1 C*]
( 6 - 102)
donde
1 a n-2 @n-3
• ■■ ■ • •
«1 1
1 0
0 0
0 0
(6-103)
W = «I 1
1 0
■■ • ••
donde a¡, a2, . . . ,
\zl - G| = z n + diz"
+
+ a„_ i z + a„ = 0
A continuación, definamos
(6-104) donde ¿(k) es un vector de dimensión n. Utilizando la ecuación (6-104), las ecuaciones (6-98) y (6-99) podrán modificarse a la forma
www.FreeLibros.me
432
U b i c a c i ó n d e p o lo s y d is e ñ o d e o b s e r v a d o r e s
£ (*+ 1) = Q“' G Q £ (*) + Q 1Hu ( i)
C a p ít u lo 6
(6-105) (6-106)
X ¿ ) = CQ£(A) donde 0 1
Q 'G Q =
0 0
o o
~an @n-1
_0 0
1
-ax
C Q = [0
0
0
(6-107)
1]
(6-108)
[Refiérase al problema A-6-9 para la deducción de las ecuaciones (6-107) y (6-108).] Ahora, se define x(*)
(6-109)
= Q |(*)
Sustituyendo la ecuación (6-109) en la ecuación (6-100), tenemos que
| ( k + 1) = Q ~ '(G - K „C )Q |(fc ) + Q
H u (k) + Q ’ K eC Q & * )
( 6 -1 1 0 1
Sustrayendo la ecuación (6-110) de la ecuación (6-105), obtenemos ! ( * + 1) - |(Ar + 1) = (Q ' G Q - Q - ' K e C Q M k ) - | (* )]
( 6 - 111)
Definamos e(*) =
m
- t(fc)
Entonces, la ecuación (6-111) se convierte en e (* + 1) = Q -1(G - K eC)QeOfc)
(6-1121
Es necesario que la dinámica de error sea estable y que e(k) llegue a cero con velocidad suficiente. El procedimiento para la determinación de la matriz K, será, primero, seleccionar los polos de observa dor deseados (los valores característicos de G - K (,C) y, a continuación, determinar la matriz K, de manera que se dé los polos deseados. Si requerimos que t(k) llegue a cero tan pronto como sea posible, entonces se necesita que la respuesta del error tenga oscilaciones muertas, por lo que debe mos seleccionar todos los valores característicos de G - K, C como cero. Observe que a n -l
an-l
< * n -2 0 /1 -3
c
• Al ’ ■ 1
l" 0
• 0 • 0 •
0 C G " 2 k n-i 0_ C G " ' . k "
CG
ki k2
Q ‘K e
donde
flj
1
1
0
k¡ k2
www.FreeLibros.me
.
S e c c ió n ó -ó
O b s e rv a d o re s d e e sta d o
433
Dado que Q 1K (, es un vector de dimensión «, podemos escribir
5„-i
Q‘ ‘K e
(6-113)
«i A continuación, refiriéndonos a la ecuación (6-108), tenemos que '
Q
K eC Q = .
= Q
8„
'
S„-i Si
[0
0
• • 1] =
'o 0
0 0
• ■ 0 • • 0
0
0
• • 0
.
GQ - Q
K f CQ =
8„
'
V i Si .
0 1 0
0 0 1
• ••• •••
0 0 0
&n—1
^n-1
2
8n-2
0
0
•••
1
-ai -
8n
8i
|zl
(G - K ,
Q
O O ii
La ecuación característica 0
se convierte en z -1 0
0 z -1
0 0 z
■ • •
0 0 0
0
0
0
■ • -1
an + 8„ -1 + 8„-i an-2 + 8n-2 = 0 z + a¡ + 5i
es decir, z" + («i + 8 i)zn 1 4- (a2 + 8z)zn 2 +■■■ + (a„ + 8n) - 0
(6-114)
Es fácil apreciar que cada uno de los 5„, 8n_¡, . . . , 8 t está asociado sólo a uno de los coeficientes de la ecuación característica. Suponga que la ecuación característica deseada para la dinámica de error es (z - fii)(z - fi2) ■■■(z - fín)
= z" + a, z n
(6-115)
a 2z
Observe que los valores característicos deseados (es decir, las localizaciones de los polos en lazo cerrado deseados) determinan la velocidad con la que el estado observado converge al estado real de la planta. Comparando los coeficientes de las potencias iguales de z en las ecuaciones (6-114) y (6-115), obtenemos ü\ + 8i = ai
a2 + 8¡ = a 2
4”
a„
www.FreeLibros.me
434
U b i c a c i ó n d e p o lo s y d is e ñ o d e o b s e r v a d o r e s
C a p ít u lo 6
de la cual obtenemos = a¡ - a¡
= a 2 - a2
8„
= an - an
Q
í»
-- 1
Entonces, de la ecuación (6-113),
1
82
Sn-1
K, .
«1
.
1
&n—1
(6-116)
«! - di
Por lo tanto, 1
1 11
O
*
c <3
s
1
Q-n Q -n —1 = (W N * )-1
ai - a 1
&n &n—\
(6-117)
ai - ax
La ecuación (6-117) especifica la matriz de ganancia de realimentación necesaria K ( . La figura 6-9 muestra una representación alterna del sistema de control con realimentación del estado observado. Una vez seleccionados los valores caracteristicos deseados (o la ecuación característica que se desea), es posible designar el observador mediante un método similar al utilizado en el caso del
Figura 6-9
Representación alterna del sistema de control con realimentación del estado observado.
www.FreeLibros.me
S e c c ió n 6 - 6
435
O b s e rv a d o re s d e e sta d o
problema de ubicación de polos. La ecuación característica deseada puede seleccionarse de tal forma que el observador responda por lo menos cuatro o cinco veces más aprisa que en el sistema en lazo cerrado; en algunas aplicaciones puede desearse una respuesta con oscilaciones muertas. Si queremos tener una respuesta con oscilaciones muertas, la ecuación característica deseada se convierte en *" = 0
(6-118)
Comparando la ecuación (6-114) con la ecuación (6-118), requerimos que üi +
=0
a2 +
82 = 0
an +
= 0
Por lo tanto, para la respuesta
ki k2
Kf =
'
s „'
Bn-1 = (W N *)~ ‘ = Q
k».
.
«1
.
- an
&n~1 “ °1
-
Fórmula de Ackermantt. La expresión dada por la ecuación (6-117) no es la única disponi ble para determinar la matriz de ganancia de realimentación del observador K t„ A continuación, deduciremos la fórmula de Ackermann para la determinación de K,. Considere el sistema completamente observable definido por las ecuaciones (6-98) y (6-99). Observe que en este sistema la salida y(k) es un escalar. Refiriéndonos a la ecuación (6-115), la ecuación característica para la dinámica de error es |zl - Q _1 G Q + Q 1K , CQ| = 0
(6-120)
donde K t, es una matriz de n x 1. Definamos Q G Q
= G,
Q K e = K e,
CQ = C
Entonces la ecuación (6-120) se convierte en |zl - G + K eC| = 0 En el diseño delobservador, determinamos la matriz K t, de tal forma que su última ecuación característica seaidéntica a la ecuación característica deseada para el vector de error; ésta es
z" + a.\Z" ' 1 + ••• + a„- iZ + a n = 0 Es decir, |zl - G + K e C| = (z - a lX z - 1x 2) ■■■ (z - fjin) = zn + a 1z n~l + ■■■ + a„~ iZ + an = 0 í (S , - ■
www.FreeLibros.me
(6-121)
436
U b i c a c i ó n d e p o lo s y d is e ñ o d e o b s e r v a d o r e s
C a p ít u lo 6
donde //,, //„ son los valores característicos de 'a matriz (G - k,, C ). Para sistemas físicos, los valores característicos complejos siempre aparecen en pares complejos conjugados. En el análi sis presente, supondremos que todos los valores característicos complejos se presentan en pares complejos conjugados, de tal forma que son reales los coeficientes a,, a2, . . . , a„de la ec característica.De este modo, la ecuación característica para la matriz (G * - C *k e) puede estar dada por ¡zl - G * + C *K *| = (z - £ 0 (2 - Mz) ■■•(z - 7 0 = z" + « iZ " -1 + •■■+ a n-i Z + a n = O donde p, es la conjugada compleja de ¡a ,. En la sección 6-5 deducimos la fórmula de Ackermann para la determinación de la matriz de ganancia de realimentación del estado K , para el problema de diseño de la ubicación de polos. Ahi determinamos la matriz K , de tal forma que la ecuación característica ¡zl - G + H K | = O sería la misma que la ecuación característica deseada, ecuación (6-121). Aquí, en el problema de diseño del observador, deseamos determinar la matriz K ; , de tal forma que la ecuación característica |zl - G * + C *K *| = O sea la misma que la ecuación característica requerida dada por la ecuación (6-121). Es claro que estos dos problemas son uno dual (es decir, matemáticamente la determinación de la matriz k , es igual a la determinación de la matriz de ganancia de realimentación k del problema de la ubicación de polos). Por lo tanto, es posible utilizar los resultados obtenidos en la sección 6-5 con respecto a la determinación de la matriz Ke para el problema actual, como se demostrará. En el problema del diseño de tai ubicación de polos analizado en la sección 6-5, para la ecuador del sistema x(k + 1) = Gx(fc) + H u (k ) con realimentación del estado
u(k) = - K x ( k ) la matriz deseada K se obtuvo según la ecuación (6-68), que se repite aquí: k = [o
o
•••
o
i] [ h ; g h :- - - : g " - 'h ] ^ ^ ( g )
( 6 - 122 *
En este caso, en el problema del diseño del observador, para la ecuación de estado
x(k + 1) = G *x(k) + C *u(k) con realimentación del estado
u{k) = - k f* x(k) la matriz deseada K ; puede, por lo tanto, obtenerse de manera similar a la ecuación (6-122), con sigue: k r = [o
o
o
i] [ c * : g * c * : - - - ; ( g * ) " '1c * ] '1<()(g*)
www.FreeLibros.me
( 6- 1:
S e c c ió n 6 - 6
437
O b s e rv a d o re s d e e sta d o
que puede modificarse a
K* = [0
0
0
1][C* : G*C* • • • • • (G* ) " _1 C * ]_1(Q * )_1 (G*)
Si tomamos la transpuesta conjugada de ambos miembros de esta última ecuación, tenemos que -1 c 'o ' 0 CG = [« K G ^ rc r1 c1 O u 1
1
1_
Si Q 'K , = K p obtenemos
-i
C CG
K e = Q
CG" 1
'o ' 0
(6-124)
1_
Observe que, dado que "G = Q 1GQ, Q G *Q _1 = G \
k = 0 ,1 ,2, . . . , n
Y, en consecuencia, Q c H G jQ '1 =
Q [G " + a, Ó ""1 + ••■+ a „_ ,G
= Q G "Q 1 +
+ a ^ Q "1
Q G " 'Q -1 + ■•• + an l Q G Q 1 + a „ I
= G " + aj G "~‘ + • • • + a„_! G + a„ I =
(6-125)
Utilizando la ecuación (6-125), la matriz de ganancia de realimentación delobservador K„ requeri da, dada por la ecuación (6-124), puede escribirse de nuevo en la forma:
K e =
C CG
-i
'o ' 0
CG" 1
(6-126)
1
donde
Resumen.
El observador de predicción de orden completo está dado por la ecuación (6-92):
x(k + 1) = (G - K e C)x(/c) + Hu(Jfc) + K ey(k) La realimentación del estado observado es u (k) = —Kx( k) Si esta última ecuación se sustituye en la ecuación del observador, obtenemos
x( k + 1) = (G - K* C - H K )x (& ) + K c y (k)
www.FreeLibros.me
438
U b i c a c i ó n d e p o lo s y d is e ñ o d e o b s e r v a d o r e s
C a p it u le £
Esta ecuación define el observador de predicción de orden completo, cuando se incorpora el control con realimentación del estado observado. Como en el caso de los cuatro métodos para el diseño de la ubicación de polos, por lo regular disponibles para determinar la matriz de ganancia de realimentación del observador K t, para el siste ma completamente observable, se pueden resumir como sigue: 1. Si nos referimos a la ecuación (6-117), la matriz de ganancia de realimentación del observador K t puede estar dada por
ll
O
K
Un O tn -1
a i
— fln-1 -
a„
=
^n—1
(W N * )* 1
.
ai
~
«1
a„
^71—1 “
(6-127)
«1
donde las matrices N y W están dadas por las ecuaciones (6-102) y (6-103), respectivamente. Las a, son los coeficientes de la ecuación característica deseada
z n + a xz n~x + ••■+ a „ ^ z + a„ = 0 y las a , son coeficientes de la ecuación característica de la ecuación de estado original [zl - G| = z n + a 1z n~í + ••• + a „_iz + a„ = 0 Observe que si el sistema ya tiene una forma canónica observable, entonces la matriz K t. puede determinarse con facilidad, pues la matriz W N * se convierte en una matriz identidad, y por lo tanto, (W N *)-1= I. 2. La matriz de ganancia de realimentación del observador Ackermann, dada, a su vez, por la ecuación (6-126):
K« =
-1
C CG
puede estar dada por la fórmula de
'0
0
CG" 1
(6-128)
1
donde
Si los valores característicos deseados juu ju2, . . . , ft„ de la matriz G - K t.C son distintos, entonces la matriz de ganancia de realimentación del observador K , puede estar expresada por la ecuación -1 *li Kf =
t)2 . V " .
'l‘ 1
(6-129)
1_
donde las r¡, se definen como sigue: T,f = C (G - M ) - 1 Observe que los tj* son los vectores característicos de la matriz (G - K t,C)*. En el caso especial en que se desee que el vector de error exhiba una respuesta con
www.FreeLibros.me
S e c c ió n 6 - 6
439
O b s e rv a d o re s d e e sta d o
oscilaciones muertas, de tal forma que //,= //2 = •■■ = //,, = 0 , la ecuación (6-129) puede simplificarse. La ecuación siguiente dará la matriz K t, para el caso de la respuesta con oscila ciones muertas: -1 Ti l T)2 K
f
Y
0
(6-130)
=
.Vn.
o_
donde las 17, están dadas por la ecuación t), = C G -',
i = 1 ,2 ,3 ,..., n
[Para detalles de la deducción de las ecuaciones (6-129) y (6-130), vea los problemas A-6-12 y A-6-13.] 4. Si el orden del sistema es bajo, suponga una matriz de ganancia de realimentación del observa dor K t, con elementos desconocidos. Entonces los elementos de la matriz K t, pueden determi narse igualando los coeficientes con potencias iguales de z de
\zl - G + K eC| y del polinomio característico requerido, que está dado por
(z ~
~ M2) ■■■(z — /¿„) = z" + a, z n~l +•■■-(- an-i z + an
donde las //, son los valores característicos deseados de G - K (,C. Ejemplo 6-10 Considere el sistema del doble integrador dado por las ecuaciones x(k + 1) = Gx(fc) + Hw(&)
y(k) = C x(k) donde G =
"1 f , 0 1
T¥ __ xl —
"T2/2' T
[1
0]
y T es el período de muestreo. (Vea el problema A-5-16 para la deducción de las ecuaciones en el espacio de estados en tiempo discreto correspondientes al sistema del doble integrador.) Suponga que la configu ración del observador es la misma que la mostrada en la figura 6-8, para diseñar un observador de estados para este sistema. Se desea que el vector de error exhiba una respuesta con oscilaciones muertas. Utilice los cuatro métodos distintos, listados en el análisis anterior. Primero, verifique la condición de observabilidad. Observe que el rango de [C* i G*C*] =
1
1
0
T
N O
|zl - G| =
O N
1
es 2. Por lo tanto, el sistema es completamente observable. A continuación examinamos la ecuación característica del sistema:
’l 0
T
z - 1
-T
1
0
z - 1
Comparando esta ecuación característica con z 2 + ai z +
a2 =
0
www.FreeLibros.me
= z 2 - 2z + 1 = 0
440
U b i c a c i ó n d e p o lo s y d is e ñ o d e o b s e r v a d o r e s
C a p ít u lo 6
obtenemos
-2 ,
ai
a2 = 1
En vista de que se desea una respuesta con oscilaciones muertas, la ecuación característica deseada para la dinámica del error es
z 2 + a 1 z + «2 = z 2 = 0 Por lo tanto.
ai = 0, Método ¡.
a2 = 0
Refiriéndonos a la ecuación (6-127), tenemos que
-1
a 2 a2 = (W N *) a¡ - ax
K,. = (W N *)-'
2
donde N y W , definidas por las ecuaciones (6-102) y (6-103), respectivamente, son
n = [ c * : g *c*] = o
- 2 l" 1 0
«1 1 1 0
w =
r
Por lo tanto, la matriz de ganancia de realimentación del observador K c se obtiene como sigue:
_ K, = Método 2.
-2 1
1 0
1 1
i -i
0
]
T )
_ -1 2
__
’o 1
1 1
T
T
r
_ -1 2
_
2 " 1
T
De la ecuación (6-128), la fórmula de Ackermann, K c, está dada por
K , =
-1
C CG
’ o" 1
donde
4>(G) = G 2 + o jG + a2I = G 2 Por lo tanto, la matriz de ganancia de realimentación del observador K„ se obtiene como sigue:
Kt
Método 3.
1 0
T
1 0
27
1
1
’i o' 1 7
r i i
L T
-i
’ o’ 1
o" 1
7
’ o" = 1
2’ 1
7
Puesto que se desea una respuesta con oscilaciones muertas, de la ecuación (6-130) tenemos
-i K , = *li
1 0
donde
TI, = C G 1,
T)2 = CG 2
www.FreeLibros.me
S e c c ió n 6 - 6
441
O b s e rv a d o re s d e e sta d o
Observe que G 1=
1
-T
0
1
Los vectores t¡, y r¡2 se obtienen como sigue: -T
1
*lr = [l
0] 0
T)2 = [1
0]
-T
1 0
—T]
[1
1
1 -2 T
0]
[1
1
0
= [1
1
-2 T]
Por lo tanto, la matriz de ganancia de realimentación del observador Ke se obtiene como sigue: 2 1
1 0
-1
2
_r
T
i
Suponemos que
1
-1
1
1
-T " -2 T
l
Método 4.
1
o
K, =
K. y expandimos la ecuación característica como sigue: 1 T 1 0 + |zl - G + K „ C| = 0
0
1
0]
[1
1
z - 1 + Ay -T = z2 + (/ti - 2)z + l- / c i + fc2r = 0 k2 z - 1 Dado que deseamos una respuesta con oscilaciones muertas, esta ecuación característica debe ser igual a
z2 = 0
De modo que,
kr = 2 , es decir. kt k2
Kf =
" 2 1IT
Verifiquemos que el vector de error se reduce a cero cuando mucho en dos períodos de muestreo. Observe que la matriz de coeficientes para la ecuación de error se convierte en G - KfC =
1 T
°
1
’-l
'2 ” — 1 [i r
0) =
Si el estado inicial x(0) está dado por x (0 )
donde a¡ y b, son arbitrarias, y x (0) se supone que es
www.FreeLibros.me
- i T
T 1
44 2
U b i c a c i ó n d e p o lo s y d is e ñ o d e o b s e r v a d o r e s
C a p ít u lo ó
donde a 2 y í>, son también arbitrarias, entonces
Ol - a2
e(0) = x(0) - x(0) =
b' - b2
a b
donde a y b son constantes arbitrarias. Ahora, la ecuación (6-95) se convierte en
T ~ex(k)
'- 1
~ex{k + 1)' e2{k + 1)
1
T
'ci(O )' _e2( 0)_
e2{k) ’
a b
Los vectores e( I ) y e(2) se determinan como sigue:
’-l 1
e2(l)
1
~j,a + b
a - bT - a + bT 1
Ta
l
T
1
+ o-
.« 2( 2)
~ - a + bT~
a b
T ' - a + bT~ 1
1
-Sl'-
’-l
r*
~et(2)
~T
T
o’ 0
b - j,a + b
Es claro que el vector de error e(k) se convierte en cero en cuando mucho dos períodos de muestreo. Por lo tanto, la respuesta con oscilaciones muertas. Observe que para cualquier estado inicial x(0), el vector de estado observado se vuelve idéntico al vector de estado actual en, a lo mucho, dos períodos de muestreo. Finalmente, la ecuación del observador es
Xi(k + 1 ) x2(k + 1 )
-1 1_
"T
x,{k) x 2(k)
Ii 2
u(kT) +
y (k )
T
[Observe que ésta es la ecuación dada por la ecuación (6-93).
Comentarios sobre la selección de la mejor Kt, Refiérase a la figura 6-8 y observe que la señal de realimentación a través de la matriz de ganancia de realimentación del observador K t, sirve de señal de corrección al modelo de la planta, con el fin de tomar en cuenta las incógnitas en la misma. Si están involucradas incógnitas significativas, la señal de realimentación a través de la matriz K e debe ser relativamente grande. Sin embargo, si la señal de salida está muy contaminada por perturbaciones y ruido en la medición, la salida y (k) no será confiable y la señal de realimentación a través de la matriz K (, deberá ser relativamente pequeña. En la determinación de la matriz K t, (que depende de los valores característicos deseados fjh //2, . . . , //„), se debería examinar cuidadosamente los efectos de las perturbaciones y de ruido implicados en la salida y (k). Recuerde que la matriz de ganancia de realimentación del observador KL.depende de la ecuación característica deseada = (z ~ li\)(z ~
(z ~ Un) = 0
La selección de un conjunto de //,, ju2, . . . , //„ no es única. Por lo tanto, se pueden seleccionar muchas ecuaciones características diferentes como ecuaciones características deseadas. Para cada una de éstas tendremos una matriz K t, distinta. En el diseño del observador, es conveniente determinar varias matrices de ganancia de realimentación del observador K c, basadas en varias ecuaciones características deseadas distintas. Para cada una de las matrices diferentes K c„ deberán llevarse a cabo pruebas de simulación a fin de evaluar el desempeño resultante del sistema. A continuación seleccionaremos la mejor K c desde el
www.FreeLibros.me
S e c c ió n 6 - 6
443
O b s e rv a d o re s d e e sta d o
punto de vista del desempeño general del sistema. En muchos casos prácticos, la selección de la mejor matriz K, se reduce a un punto intermedio entre una respuesta rápida y la sensibilidad a perturbaciones y ruido.
Efectos de la adición del observador en un sistema en lazo cerrado. En el proceso del diseño de la ubicación de polos, supusimos que el estado verdadero x(k) estaba disponible para la realimentación. Pero en la práctica, el estado verdadero x(k) puede no ser medible, por lo que será necesario que utilicemos el estado observado x ( k ). Investiguemos ahora los efectos de la utilización del estado observado x (k), en lugar del estado verdadero x(£), sobre la ecuación característica de un sistema de control en lazo cerrado. Considere el sistema de estado completamente controlable y completamente observable, defi nido por las ecuaciones x(k + 1) = G x(& ) + H u(& ) y(k) = C x(k) Para el control con realimentación del estado basado en el estado observado x (k), tenemos que u (k) = - K x (Jt) Con este control, la ecuación de estado se convierte en
x(k + 1) = Gx(ífc) - H Kx ( k) = (G - H K )x (fc) + H K [x(k) - x(/c)]
(6-131)
La diferencia entre el estado real x(k) y el estado observado x ( k) se ha definido como el error e(k):
e(k) = x( k) - x(k) Sustituyendo el vector de error e(k), la ecuación (6-131) se convierte en
x(k + 1 ) = (G - H K )x (i) + HKe(A:)
(6-132)
Observe que la ecuación de error del observador fue dada en la ecuación (6-95), que se repite aquí:
e(k + 1) = (G - K eC ) t ( k )
(6-133)
Combinando las ecuaciones (6-132) y (6-133), obtenemos "x(fc + 1 )" e(k + 1 )
G - HK 0
HK G - K fC
x(k) e(k)
Esta ecuación describe la dinámica del sistema de control con realimentación del estado observado. La ecuación característica para el sistema es zl - G + HK 0
-H K z I - G + K .C
es decir, |zl - G + H K| |zl - G + K e C| = 0
(6-134)
Observe que los polos en lazo cerrado del sistema de control con realimentación del estado observa do están formados por los polos debidos sólo al diseño de ubicación de polos, además de los polos que se deben sólo al diseño del observador. Esto significa que el diseño de ubicación de polos y el
www.FreeLibros.me
444
U b i c a c i ó n d e p o lo s y d is e ñ o d e o b s e r v a d o r e s
C a p it u le :
diseño del observador son independientes uno del otro. Pueden diseñarse por separado y combinarse para formar el sistema de control con realimentación del estado. Los polos en lazo cerrado que se desea que se generen mediante realimentación del estado (ubicación de polos) se seleccionan en forma tal que el sistema satisfaga los requisitos de desempe ño. Los polos del observador por lo general se seleccionan para que la respuesta del observador sea mucho más rápida que la respuesta del sistema. Una regla práctica es escoger una respuesta de ' observador por lo menos cuatro a cinco veces más rápida que la respuesta del sistema, o, en algunos casos, escoger todos los polos del observador en el origen (para una respuesta con oscilaciones muertas). En vista de que el observador no es, por lo general, una estructura de hardware, sino un programa de computadora, es posible aumentar la velocidad de respuesta u obtener la respuesta con oscilaciones muertas de forma que el estado observado converja con rapidez al estado verdadero. La velocidad máxima de respuesta del observador queda generalmente limitada sólo por los problemas de ruido y de sensibilidad involucrados en el sistema de control.
Observador actual. En el observador de predicción, se obtiene el estado observado x (A) a partir de mediciones del vector de salida hasta y(A - 1) y del vector de control hasta u(A - 1). Por lo tanto, el vector de control u(A) = - K x (A) no utiliza la información de la salida actual y(A). Una formulación diferente del observador de estados consiste en utilizar y(A) para la estimación de x (At Esto se puede llevar a cabo separando el proceso de observación en dos pasos. En el primer paso, determinamos z(A + 1), que es una aproximación de x(A + 1) basada en x (A) y u(A). En el segundo paso, utilizamos y(A + 1) para mejorar z(A + 1). La z(A + 1) mejorada es x (A + 1). El observador áe estado basado en estaformulación seconoce como observador actual. Considere el sistema de estado completamente controlable y completamente observable, defnido por lasecuaciones
1 i i i I
1 I I
\ ( k + 1) = G x(A ) + Hu(/c)
I
y (k ) = C x (k )
I
donde
I x(A) = vector
de estado (de dimensión n)
■
u(A) = vector
de control (de dimensión r)
■
y(A) - vector
de salida (de dimensión m)
fl
G
= matriz
de n x n
I
H
= matriz
de n x r
fl
C
= matriz
de m * n
fl
actual están dadas por
fl
Las ecuacionesdel observador
í ( * + 1) = z(A + 1) + K e[y(k + 1) - Cz(k
z(k + 1) = Gi(Jfc) + H u (A )
+ 1)]
(6-133H (6 - 1 M *
La ecuación(6-136) da la predicción z(A + 1) con base enx (A) y u(A)en la etapa A. La e cu a cü ^ | (6-135) indica que, midiendo y(A + 1), podemos mejorar z(A + 1) para obtener x (A + 1).
www.FreeLibros.me
S e c c ió n 6-6
445
O b s e rv a d o re s d e e sta d o
Entonces,
e(k + 1 ) = x(k + 1 ) — x(k + 1 ) = G x( k) + Hu(A:) - (Gx(A:) + Hu(/t) + K e{C [G x(/t) + H u(fc)] - C[G x(fc) + H u(/c)]}) = (G - K e CG)[x(/c) - k(k)] = (G - K e CG)e(k) Por lo tanto, la ecuación de error del observador para el observador actual es similar a la del obser vador de predicción dada por la ecuación (6-95). Sin embargo, en la dinámica de error aparece una diferencia. La matriz K , puede obtenerse exactamente como en el caso del observador de predicción, excepto por que la matriz C queda remplazada por la matriz C G . Para hacer posible que los valores característicos de (G - K t,C G ) se ubiquen en forma arbitraria, el rango de la matriz CG CG2
C CG
CG"
CG" 1
G
debe ser n. Observe que si la matriz G es no singular, entonces esta condición es equivalente a la condición de observabilidad, es decir, rango [C * i G *C * i ■••i (G * )'M C *] = n Si el rango de la matriz de observabilidad es n, entonces los valores característicos de G - K t,CG pueden ubicarse en forma arbitraria mediante una selección adecuada de K t„ y la matriz K t. puede determinarse de manera similar a como se hizo en el caso del observador de predicción. En la determinación de la matriz K,, remplazamos la matriz C por C G en los cálculos involucrados. Por ejemplo, si la salida y (k) es un escalar, la fórmula de Ackermann, como se dio en la ecuación ( 6 126), se modifica a la forma correspondiente: CG CG2
0 0
CG" 1 CG"
0 1
K e =
(6-137)
Sin embargo, si la matriz G es singular, entonces el rango de [G *C * : (G * ) 2C * : •••: (G * )"C * ] es q , que es menor que n. En este caso, escribamos (G - K .C G )* = G * - G *C *K ,* = G * - B K f* donde B = G *C *. Observe que la matriz (G * - B K ,*) tiene la misma forma que la matriz (G - H K ), que jugó un papel importante en el diseño de la ubicación de polos.
www.FreeLibros.me
446
U b i c a c i ó n d e p o lo s y d is e ñ o d e o b s e r v a d o r e s
C a p ít u lo ó
Con un análisis similar al dado en la sección 6-5 [refiérase a las ecuaciones (6-55) y (6-57)], es posible utilizar una matriz de transformación adecuada para transformar las matrices G y B e n G * y B , donde * i r*
G
_ _ n _ 1_y_i2
G * = T -1 G *T =
.
B = T _1 B = q) se
0 ÍG Í
y donde todos los valores característicos de la matriz G 22 no controlable de (n - q) x (n puedan hacer cero. (Por lo tanto, se puede estabilizar el sistema.) A continuación, defina * ' \¡T* 1 K e* X1 ~ £" * ~ IXÍt A ¿11 • Entonces,
o
0
1
*—
o G* - BK * =
rBul
I G*2_
0
-{y * i Gf, - B u JVen i 0
[K e : k *12]
]si
Bn K *12 *22
Por lo tanto, si la matriz G es singular y el rango de la matriz de observabilidad es q, sólo necesita mos especificar q valores característicos de la matriz de q x q G b „ k ;
Observador de orden mínimo. Los observadores analizados hasta ahora están diseñados para reconstruir todas las variables de estado. En la práctica, algunas de las variables de estado pueden medirse con precisión. Estas variables de estado medibles con precisión no necesitan ser estimadas. Un observador que estime menos de n variables de estado, donde n es la dimensión del vector estado, se conoce como observador de orden reducido. Si tal observador es el mínimo posi ble, el se conoce como observador de orden mínimo. Suponga que el vector de estado x(k) es uno de dimensión n y que el vector de salida y (k) es de dimensión m, que puede medirse. Dado que las variables de salida m son combinaciones lineales de las variables de estado, m variables de estado no necesitan ser estimadas. Sólo necesitamos estimar n -m variables de estado. Entonces, el observador de orden reducido se convierte en un observador de orden (n - m). Un observador de orden n m como éste, es el observador de orden mínimo. La figura 6-10 muestra el diagrama de bloques de un sistema con un observador de orden mínimo. Es importante notar, sin embargo, que si la medición de las variables de salida incluyen ruido significativo y son relativamente poco precisas, la utilización de un observador de orden completo puede dar como resultado un mejor desempeño del sistema. El observador de orden mínimo puede diseñarse dividiendo primero el vector de estado x{k) en dos partes, como sigue: * (* ) =
Sa(k) *b (k j
donde xa(k) es aquella porción del vector de estado que puede medirse en forma directa [por lo tanto, xa(k) es un vector de dimensión m\ y xh(k) es la porción no medible del vector de estado [así que xb(k) es un vector de dimensión (n - m)\. Luego, las ecuaciones de estado divididas se convierten en:
x a(k + 1 ) x b(k + 1 )
G uu ^ G „;. Xa(k) + Gf,„ | Gbb _ _ X * W .
www.FreeLibros.me
H„ H„
u(*)
( 6 - 138)
S e c c ió n 6 -ó
447
O b s e rv a d o re s d e e sta d o
y(*l Figura 6-10
Sistema de control de realimentación del estado observado, con un observador de orden mínimo.
y (k) = [IiO ] xA kl
x t (k)
(6-139)
donde
Gaa = matriz de m x m Gah = matriz de m * (n - m) G fc, = matriz de ( r ¡- m) x m
GM = matriz de (« - m) x (« - m) H n = matriz de m x r H a = matriz de (n - ni) x r Reescribiendo la ecuación 6-138, la ecuación correspondiente a la porción medible del estado se convierte en
x a(k + 1 ) = Gaa x a(k) + G abx b(k) + H„ a(k) es decir,
x a(k + 1 ) - Gao x a(k) - HaU(fc) = Gabx b(k)
(6' 14° )
donde son medibles los términos del primer miembro de la ecuación. La ecuación (6-140) actúa como ecuación de salida. En el diseño del observador de orden mínimo, consideremos el primer miembro de la ecuación (6-140) como una cantidad conocida. De hecho, la ecuación (6-140) rela ciona las cantidades medibles con las no medibles del estado.
www.FreeLibros.me
448
U b i c a c i ó n d e p o lo s y d is e ñ o d e o b s e r v a d o r e s
C a p ít u lo 6
De la ecuación (6-138), la ecuación de la porción no medible del estado se convierte en
x b(k + 1) = Gbax a{ k ) + Gbbx b(k) + H fcu(A:)
(6-1411
La ecuación (6-141) describe la dinámica de la porción no medible del estado. Observe que los términos G io xa(k) y H 4 u(¿) son cantidades conocidas. E l diseño del observador de orden mínimo puede facilitarse si utilizamos la técnica de diseño desarrollada para el observador de orden completo. Comparemos la ecuación de estado correspon diente al observador de orden completo, con la correspondiente al observador de orden mínimo. La ecuación de estado para el observador de orden completo es
x( k + 1) = G x (* ) + H u (* ) y la “ ecuación de estado” para el observador de orden mínimo es
x b(k + 1) = G bbx b(k) + [G bax a(k) + H* La ecuación de salida para el observador de orden completo es y (k) = C x(k) y la “ ecuación de salida” para el observador de orden mínimo es
x a(k + 1) - G aox a(k) - H 0 u(/:) = G abx b(k) El diseño del observador de orden mínimo se puede llevar a cabo efectuando las sustituciones que se dan en la tabla 6-1 en la ecuación para el observador de orden completo, dada en la ecuación (6-93. y que repetimos aquí:
x( k + 1) = (G - K eC )x (£ ) + Hu(Jfc) + K ey(A:)
(6-142.
Efectuando la sustitución de la tabla 6-1 en la ecuación (6-142), obtenemos
xb(k + 1) = (Gbb - K eGab)xb(k) + Gbax„(k) + Hf,u(A:) + K e[Xa(¿: + 1) - GaaXa(A:) - H a u(k)]
(6-143.
T A B L A 6-1 LISTA D E S U S T IT U C IO N E S N E C E S A R IA S PARA E S C R IB IR LA ECU AC IÓ N DE O B S E R V A D O R PARA E L O B S E R V A D O R DE EST A D O S D E O R D EN MÍNIMO Observador de estados de orden completo
Observador de estados de orden mínimo
x (k )
x*(¿)
G
G hh
Hu (k)
G*„ xa(k) + Hhu(k) x„(k
y{k)
c
+ 1) - G aa x„{k) - H„ u(k)
G„*
K (., matriz de n x m
www.FreeLibros.me
K e, matriz de ( n ~ m)
xm
S e c c ió n ó -ó
449
O b s e rv a d o re s d e e sta d o
donde la matriz de ganancia de realimentación del observador K c es una de (rt-ni) * m. La ecuación (6-143) define el observador de orden mínimo. Refiriéndonos a la ecuación (6-139), tenemos que y (k) = x a(k)
(6-144)
Sustituyendo la ecuación (6-144) en la ecuación (6-143), obtenemos
x b(k + 1) = (Gw, - K eGab) x b(k) + K ey(k + 1) + (G ba - K eG ao)y(fc) + (H b - K eH „)u (k)
(6-145)
Observe que para estimar x h(k + 1) se necesita el valor medido de y(k + 1). Esto no es conveniente, por lo quedesearíamos algunas modificaciones. [En el caso del observador de ordencompleto, x (k + 1)puede estimarseutilizando la medición y (k) y no requiere de la medición dey(k + 1). Vea la ecuación (6-93).] Volvamos a escribir la ecuación (6-145) como sigue: x¡,(k + 1) - K ey(£ + 1) = (Gbb - K eG ab)x b(/:) + (G ba - K eGaa)y(k)
+ ( H b - K eH a)u(k) = (Gbb - K eGab)[Xb(k) ~ K ey (* )] + (G bb - K f G ab) K ey(fc) + (Gba - K eGaa)y(k) + (H * - K ( H ,)u (i) = (G bb - K eGab)[xb(k) - K ,y (/c)] + [(G bb - K eG ab) K e + Gba - K e Gm]y(k) + (H b - K e H „)u (fc)
(6-146)
Definamos
x b(k) - K ey( k) = x b(k) - K ex a(k) = -n(Ar)
(6-147)
x b(k) - K ey(A:) = x b(k) - K ex a(k) = f|(^ )
(6-148)
y
Entonces, la ecuación (6-146) se puede escribir como sigue: •ñ(¿ + 1) = (G bb - K e Gab)i](k) + [(G bb - K , G ab) K f + Gba
- K e Gaa]y(k) + (H * - K , H .)u (* )
(6-149)
Las ecuaciones (6-148) y (6-149) definen la dinámica del observador de orden mínimo. Observe que para obtener r¡(k + 1) no necesitamos el valor medido de y (k + 1 ). A continuación obtengamos la ecuación de error del observador. Definamos
e(k) = r\(k) - r\(k) = xb(k ) - xb(k ) Rotando la ecuación (6-143) de la ecuación (6-141), se tiene xb(k + 1) - xb(k + 1) = G bb[xb(k ) - xb(A:)] + K e Gab x b(k) - K e[xa(A: + 1 ) - Gaax a(k) - H a u(fc)] Sustituyendo la ecuación (6-140) en esta última ecuación, obtenemos
x b(k + 1) — x b(k + 1) = G bb[xb(k) — x b(k)} + K f G abx b(k) — K eG abx b(k) = (G bb — K f.G flb)[x b(k ) — x b(k)}
www.FreeLibros.me
(6-150)
450
U b i c a c i ó n d e p o lo s y d is e ñ o d e o b s e r v a d o r e s
C a p ít u lo ó
Esta última ecuación se puede dividir en la forma e (* + 1) = (G m - K f G ,fc)e(A:)
(6-151)
Esta es la ecuación de error del observador. Observe que e(k) es un vector de dimensión (n - m). La dinámica de error puede determinarse como se desee, siguiendo la técnica desarrollada para el ob servador de orden completo, siempre y cuando el rango de la matriz ab
G G
-i
J ab
ab Gbb g -\n ~ m ~ 1
sea n —m. (Ésta es la condición de observabilidad completa aplicable al observador de orden míni mo.) La ecuación característica para el observador de orden mínimo se obtiene a partir de la ecuación (6-151), como sigue:
(6-152)
Izl — G hh + K .G a J — O
La matriz de ganancia de realimentación del observador K , puede determinarse a partir de la ecua ción (6-152) seleccionando primero las localizaciones de los polos en lazo cerrado deseados para el observador de orden mínimo [esto es, ubicando las raíces de la ecuación característica, ecuación (6-152) en las posiciones deseadas] y, a continuación, mediante el uso del procedimiento desarrolla do para el observador de predicción de orden completo. Si, por ejemplo, la salida y(k) es un escalar, entonces xa(k) será un escalar, Gah una matriz de 1 x (« - l ), y G hb una de (n - 1) x (n - 1). Para este caso, la fórmula de Ackermann, como se dio en la ecuación (6-126), puede modificarse para obtener -1 G „ i, G
ab G bb
'o' 0
(6-153)
K , =
donde
4>(Gbb) — Gm, + aqG bb- 2
Gah Gbb 2 .
+
.
.
.
+
0 _ 1 _
_2C
+ «n-l I
(6-154)
Resumen. Una vez determinada la matriz de ganancia de realimentación del observador K (. que es una de (n - m) x m, se puede definir el observador de orden mínimo, mediante las ecuaciones (6-148) y (6-149): *(,(£ ) = ti(£ ) + K exfl(£ ) í, ( ¿ + 1) = (G/,b - K .G .ijiK * ) + [(Gbb - K eG o6) K E + Gba - K eG j y ( ¿ )
+ (H 6 - KeHa)u(/c) En forma equivalente, en términos de e(k), más que de fj(k), se puede definir el valor de orden mínimo mediante las ecuaciones (6-150) y (6-151):
x b(k) = x b(k) - e(k) e(* + 1) = (Gbb - Ke Gab)e(k)
www.FreeLibros.me
(6-155) (6-156)
S e c c ió n 6 - 6
451
O b s e rv a d o re s d e e sta d o
Sistema de control con realimentación del estado observado con observador de orden mínimo. Considere el sistema de estado completamente controlable y completamente observable, dado por
x ( k + 1) = Gx(k) + H u(& ) y( k) = Cx(A:)
(6-157) (6-158)
donde x(k) es un vector de dimensión n, u(k) es un vector de dimensión r y y (k) es un vector de dimensión m. Las matrices G, H y C están dadas por G =
Gaj__¡_G“í Gba | Gbb
H
Ha H í,
Considere la combinación de control con realimentación del estado, en la que el estado realimentado está formado por la porción medida del estado y la porción observada (estimada) del mismo, obteni da mediante el observador de orden mínimo. La figura 6-11 muestra el diagrama de bloques corres pondiente al sistema. En este sistema el vector de control u(k) es u (k) = -Kx(A:)
(6-159)
Figura 6-t 1 Esquema de control con realimentación del estado, en el que el estado realimentado está constiituido por la porción medida del estado y la porción observada del mismo, obtenida mediante el uso del observador de orden mínimo.
www.FreeLibros.me
45 2
U b i c a c i ó n d e p o lo s y d is e ñ o d e o b s e r v a d o r e s
C a p ít u lo 6
donde x ( k) está formado por el estado medible xa(k) y el estado no medible (observado) x h(k):
*¿k)_ k b(k)
* (* )
x«(&) Tj(&) + K ex a{k)
(6-160)
Sustituyendo la ecuación (6-159) en la ecuación (6-157), obtenemos
x(k + 1) = Gx(k) - HK x( k ) = (G - H K )x (it) + HK[x(ifc) - í{k)}
(6-161)
Observe que
x(k) - i ( k ) =
xAk) *b(k)
*Ak_) k b(k)
0
x b(k) - x b(k)
0
1
e(k)
donde e(k) = xh(k) - x h(k). Defina 0
Entonces, utilizando esta matriz T, la ecuación (6-161) puede reescribirse como sigue:
x(k + 1) = (G - H K )x (fc) + H K re(/c)
(6-162)
Las ecuaciones (6-162) y (6-156) caracterizan el sistema de control con realimentación del estado, en el que el estado realimentado está constituido por la porción medida del estado, x„(k), y la porción observada del estado, x h{k), obtenida mediante la utilización del observador de orden mínimo. Com binando las ecuaciones (6-162) y (6-156), resulta que
x(k + 1 ) e(/c + 1 )
G - HK ! H Kr 0 | Gbb — K f Gab
?(*)_ e(A:)
(6-163)
La ecuación (6-163) caracteriza la dinámica del sistema con realimentación del estado observado, mediante un observador de orden mínimo. La ecuación característica del sistema es zl
G
HK
-H KT G bb +
0
Gal)
= Izl - G + H K |zl - Gb
K , Go/,1 — 0
(6-164)
La ecuación (6-164) implica que los polos en lazo cerrado del sistema incluyen los polos en lazo cerrado debidos a la ubicación de polos [los valores característicos de la matriz (G - H K )] y los polos en lazo cerrado debidos al observador de orden mínimo [los valores característicos de la ma triz (Ghh - K l G J ] , Ejemplo 6-11 Considere el sistema con doble integrador en tiempo discreto definido por las ecuaciones
x(k + 1) = Gx(&) + H u{k)
(6-165)
y(k) = Cx(k)
(6-166)
donde el período de muestreo T se supone de 0.2, es decir, T = 0.2, y
1 0
T
"l
1
0
L
0.2 1
T2 H =
2
T .
www.FreeLibros.me
" 0.02_ 0.2
C = [l
0]
S e c c ió n ó -ó
453
O b s e rv a d o re s d e e sta d o
Utilizando la técnica del diseño de la ubicación de polos, determine la matriz de ganancia de realimentación del estado K tal que los polos en lazo cerrado del sistema queden localizados en Zi = 0.6 + /0.4,
z2 = 0.6 — ;0 .4
Suponiendo que la salida y(k) = x ,(i) es la única variable de estado que puede medirse, diseñe un obser vador de orden mínimo tal que la señal de error exhiba una respuesta con oscilaciones muertas a un error inicial arbitrario. Determine la función de transferencia pulso para el controlador (formado por el control mediante realimentación del estado y el observador de orden mínimo). Primero examinaremos la controlabilidad y la observabilidad del sistema. Dado que el rango de las matrices 0.02 0.2
[H i G H ] =
0.06 0.2
[C * : G *C*] =
1
1
0
0.2
en ambos casos es 2. el sistema es de estado completamente controlable y completamente observable. Ahora resolveremos la porción de la ubicación de polos del problema. Dado que |zl - G| =
z - 1
-
0.2
2z + 1 = z2 + «i z +
z - 1
0
a2 =
0
tenemos que
ai = - 2 ,
«2 = 1
La ecuación característica deseada es |zl — G + H K| = (z - 0.6 - ;0.4)(z - 0.6 + /0.4) = z2 - 1.2z + 0.52 = z2 + a i z + a 2 = 0 Por lo tanto, a i = -1.2,
a 2 = 0.52
De la ecuación (6-65) se obtiene la matriz de ganancia de realimentación del estado K , como sigue: K = [a 2 - «2: a i - « i ] ! " 1 = [-0.48
0.8]T“
(6-167)
donde T = [H : G H ]
-
0.02 0.2
«1
1
1
°.
" 0.02 0.2
0.06" 0.2
-2 1
1 0
0.02 0.2
y T 1=
25 25
-2.5 2.5_
Por lo tanto, la matriz de ganancia de realimentación del estado K , dada por la ecuación (6-167). se convierte en K = [-0.48
0.8]
n25 25
-2.5" = [8 2.5
3.2]
La señal de control de realimentación puede entonces estar dada por
u(k ) = - K x(k) = - [8
3.2]
X i(k ) x2(k )
= - [8
www.FreeLibros.me
3.2]
y(k) x2(k )
(6-168)
454
U b i c a c i ó n d e p o lo s y d is e ñ o d e o b s e r v a d o r e s
C a p ít u lo 6
A continuación, resolveremos la porción de observador del problema. En vista de que el estado \(k) es un vector 2 y la salida y(k) es un escalar, el observador de orden mínimo es de primer orden.
Observe que
1 170__ .2 " ’ oí
Gaa 1 Gab Gba j Gbb
~Hh
0.02" 0.2
Dado que deseamos una respuesta con oscilaciones requeeri, la ecuación característica requerida para el observador es 4>(z)
=z =0
Refiriéndonos a la fórmula de Ackermann, como fue dada por la ecuación (6-153), obtenemos K . = < KG m )[G .*]_ ,[ 1] = (l)(0-2) '(1 ) = 5
Refiriéndonos a la ecuación del observador de orden mínimo, dada por la ecuación (6-149), resulta que
T](k + 1) = (Gbb ~ KeGab)T}{k) + [(Gm, - KeGab)Ke + Gba — Ke Gaa\y(k) + ( H „ - K eH a) u ( k )
= (1 - 5 x 0.2) í ¡ ( k ) + [(1 - 5 x 0.2) x 5 + 0 - 5 x l]y(fc)
+ (0.2 - 5 x 0.02)w(/r) que puede simplificarse a la forma i¡(k + 1) = ~ 5 y ( k ) + 0 .1 u (k )
(6-169))
La ecuación (6-169) define el observador de orden mínimo. El control con realimentación del estado observado u(k) ahora se da por u (k ) = - K x (fc) = -8 x ,{ k ) - 3.2x2( k ) = -8 y ( k ) - 3.2x 2( k )
(6-170)
donde, refiriéndonos a la ecuación (6-148), i 2( * ) = K ey ( k ) + i ( k ) = 5y ( k ) + t}(* )
(6-171)
En la figura 6-12 se muestra el diagrama de bloques del sistema. De las ecuaciones (6-169), (6-170) > (6-171), obtenemos
u(k + 1) = -8y(k + 1) - 3.2[5y(A: + 1) + i)(k + 1)] = -24 y ( k + 1) + 16y(/fc) - 0.32u {k ) es decir, u (k + 1) + 0.32 u ( k ) = -24 y ( k + 1) + 16y(Ar)
Si tomamos la transformadaz de esta última ecuación, y suponemos condiciones iniciales cero, obtenez U ( z ) + 0.32(/(z) = - 2 4 z 7 (z ) + 16Y ( z )
La función de transferencia pulso del regulador es
g D(z )
= -m
= 2 4 Í ^ ^ p ) = 24/1 - °-6667^ '
Y (z )
+ 0.32 /
1 + 0.32z"
(6-172)
Al referirnos a la ecuación (5-60), la función de transferencia pulso del sistema, definida por las ecuaciones (6-165) y (6-166), puede ser obtenida como sigue:
www.FreeLibros.me
S e c c ió n 6 - 6
45 5
O b s e rv a d o re s d e e sta d o
' S is te m a co n d o b le in tegrad or
Y(z) = G ,(z ) = C (zl - G ) 1H U{z) -1 ’ 0.02" z — 1 -0.2" = [1 0]
0
0.02(z + 1) (2 - i ) 2
z —1
0.2
0.02(1 + 2 -,)2 (1- z
(6-173)
Utilizando las funciones de transferencia pulso de las ecuaciones (6-172) y (6-173), el diagrama de bloques de la figura 6-12 puede modificarse a la forma mostrada en la figura 6-13. Utilizando la forma dada por la ecuación (6-164),
|zl - G + HK| |z - Gbb + KeGab\ = 0 hemos obtenido la ecuación característica siguiente para el sistema: (.z2 - 1.2z + 0.52)(z - 1 + 5 x 0.2) = (z2 - 1.2z + 0.52)z = 0 La ecuación característica para el sistema en lazo cerrado, mostrado en la figura 6-13. es
1 + Gp(z )G D(z) = 0
www.FreeLibros.me
(6-174)
456
U b i c a c i ó n d e p o lo s y d is e ñ o d e o b s e r v a d o r e s
0.02(1 +
Uiz)
C a p ít u lo 6
YU)
(1 - z - ’ )2
/I - 0.6667z-M ^
l
1 + 0 .3 2 ,"
i
~G d U) Figura 6-13
Forma modificada del diagrama de bloques del sistema diseñado en el ejemplo 6-11.
es decir,
1+
"o.02(1 + z -' ) z-
24
(1 - z-')2
1 - 0.66672-1 1 + 0.32z~'
=0
que se puede escribir como sigue:
1+
0.02(2 + 1) (2
-
l) 2
241 .
z - 0.6667) 2 + 0.32 /
Y, de una manera sencilla, esta ecuación característica se puede simplificar a (z 2 - 1.2z + 0.52)2 = 0
t que es igual a la ecuación (6-174) obtenida mediante la ecuación (6-164).
Sistema de control con entrada de referencia. Aplicaremos el método de realimentación del estado observado, para diseñar sistemas de control que deban seguir entradas de referencia cam biantes. Es importante observar que la ubicación de polos con el enfoque o método del estado obser\ ado no tiene control sobre la dinámica del numerador del sistema en lazo cerrado. (Para controlar la dinámica del numerador, consulte el método de ecuaciones polinomiales presentado en el capítulo 7.) Sin embargo, es posible transformar un sistema de regulación con realimentación del estado observado, en un sistema de control, como se muestra en la figura 6-14. Como se dijo antes, la parte de la ubicación de polos determina la ecuación característica de grado n deseada para el sistema de orden n. La porción de observador de estados determina la ecuación característica de error del observador de grado n o menor. Tal y como se obtiene de la ecuación (6-134) o la (6-164), el producto de la ecuación característica de grado n y la ecuación característica de error del observador de estados da la ecuación característica correspondiente a la totalidad del sistema. Al modificar el sistema de regulación en un sistema de control, es necesario incluir una ganan cia ajustable K 0 en la trayectoria de entrada, de tal forma que la ganancia de entrada de la totalidad del sistema de control pueda determinarse para que sea la unidad la salida en estado permanente a una entrada escalón unitario. Esto se debe a que la ubicación de polos con el observador de estados modifica la ganancia de la totalidad del sistema. Por lo tanto, a menos que K0 esté correctamente ajustada, el sistema no se comportará en forma correcta.
www.FreeLibros.me
S e c c ió n 6 - 6
457
O b s e rv a d o re s d e e sta d o
Figura 6-14
Diagrama de bloques de un sistema de control con realimentación del estado observado.
Ejemplo 6-12 Modifique el sistema de regulación considerado en el ejemplo 6-11 a un sistema de control, tal que la salida siga la entrada de referencia. A continuación, obtenga la respuesta escalón unitario y la respues ta rampa unitaria del sistema de control. (Suponga que el período de muestreo T es 0.2. es decir, que T = 0.2.)
La figura 6-15 muestra un diagrama de bloques posible para el sistema de control. En este sistema de control es necesario definir la ganancia K0 de forma que no exista desplazamiento en la salida a una entrada escalón. (Observe que si K0= 1, entonces la salida en estado permanente para una entrada escalón unitario no será igual a la unidad, excepto en casos especiales.) Del diagrama de bloques, la función de transferencia pulso enlazo cerrado Y(:)/R(z) es
Y(z )____________K„(0.Q2)(z + 0.32)(z + 1)__________ R(z) (z - l ) ‘(z + 0.32) + 0.48(z + l)(z 0.6667) _ Ko(0.02)(z + 0.32)(z + 1) z3 - 1.2z2 + 0.52z El sistema es de tercer orden. Antes de examinar el comportamiento del sistema, es necesario determinar la constante de ganan cia K0. Supongamos que R(z) es la transformada z de la secuencia escalón unitario. Entonces, la salida en estado permanente está dada por
Figura 6-15 figura 6-13.
Sistema de control obtenido modificando el diagrama de bloques que aparece en la
www.FreeLibros.me
458
U b i c a c i ó n d e p o lo s y d is e ñ o d e o b s e r v a d o r e s
limy^) = lim[(l -
C a p ít u lo 6
’)^(2)]
2
z—1 2 - 1 /fo(0.02)(z + 0.32)(z + 1) 2 z™ 2 z3 — 1.2z2 + 0.52z 2 —1
= 0.165/ko Establecemos la ganancia K0 de modo que y(«=) = 0.165Alo = 1 es decir.
K0 = 6.0606 Sustituyendo K0 = 6.0606 en la función de transferencia de pulso en lazo cerrado, obtenemos
Y(z) = 0.1212z2 + 0.162 + 0.03879 R(z) z3 - 1.2z2 + 0.52z La respuesta escalón unitario de este sistema puede obtenerse con facilidad utilizando MATLAB. Un programa MATLAB de muestra para la obtención de la respuesta escalón unitario aparece en el MATLAB Program 6-2. La respuesta escalón unitario resultante se tiene en la figura 6-16.
MATLAB Programa 6-2 num = [0 0.1212 0.1600 0.03879]; den = [1 -1.2 0.52 0]; r = ones(1,41); v = [0 40 0 1.6]; axis(v); k = 0: 40; y = filter(num,den,r ); plot(k,y/o') grid titlef Respuesta escalón unitario")
xlabel('k') ylabeK'y(k)')
Asimismo, la respuesta rampa unitaria puede obtenerse si se introduce el programa MATLAB Program 6-3 en la computadora. La respuesta rampa unitaria resultante aparece en la figura 6-17. El error que sigue a la entrada rampa unitaria se obtiene como sigue: si observamos que el período de muestreo T es 0.2, la entrada rampa unitaria está dada por
R(z)
0.2z~ (1
Entonces, obtenemos
E(z) = R(z) - Y(z) =
1
-
Y(z) R(z) R(z)
1.3212z2 + 0.362 - 0.03879 0.2z 1.2 z2 + 0.522 (z - l ) 2 (z - l)(z 2 - 0.3212z + 0.03879)
0,2z
23 - 1.2z2 + 0.52z
(2 - l ) 2
www.FreeLibros.me
S e c c ió n ó -ó
459
O b s e rv a d o re s d e e sta d o
R e s p u e s ta e s c a ló n unitario
----- r~
1.6 1.4
1.2
1 S
0 o Q o O O o O OO O O O O O O O O O O O © 9 o <20041
0.8 0.6 0.4
0.2 ------ 1 ------ 1 ------ 1 ------ 1------ 1.------ 1 ---o i ------ 1 O 5 10 15 20 25 30 35 40
k Figura 6-16
Respuesta escalón unitario del sistema de control mostrado en la figura 6-15 con K0 = 0.0606.
MATLAB Programa 6-3 num = [0 0.1212 0.1600 0.03879]; den = [1 -1.2 0.52 0];
k = 0:20;
r = [0.2*k]; v = [0 20 0 4]; axisív); y = filter(num,den,r); plot(k,y,'o',k,y,'-',k,0.2*k,,~ l) grid titleCUnit-Ramp Response') xlabel('k') ylabelCylk)')
Por lo tanto.
z - 1 (z - l)(z 2 - 0.32122 + 0.03879)
lime(A:) = lim-
2
,
, . ,
2 — 1.22 + 0.522
.
0.22
(2 - 1)
= 0.4485 lii error en estado permanente al seguir la entrada rampa unitaria es 0.4485. (Vea la figura 6-17
www.FreeLibros.me
460
U b i c a c i ó n d e p o lo s y d is e ñ o d e o b s e r v a d o r e s
C a p ít u lo 6
Respuesta rampa unitaria
4
3.5
3
2.5
1.5
1
0.5
0
0
5
10
15
20
k Figura 6-17
Respuesta rampa unitaria del sistema de control mostrado en la figura 6-15, con Ka = 0.0606.
6-7 S IS T E M A S DE SEG U IM IEN TO Por lo general, en el sistema de seguimiento es necesario que el sistema tenga uno o más integradores dentro del lazo cerrado. (A menos que la planta a controlarse tenga una propiedad integradora, a fir. de eliminar el error en estado permanente a entradas escalón, es necesario añadir uno o más integradores dentro del lazo.) Una forma de introducir un integrador en el modelo matemático de un sistema en lazo cerrado, es introduciendo un nuevo vector de estado, que integre la diferencia entre el vector de comando R y el vector de salida Y. La figura 6-18 muestra una configuración posible del diagrama de bloques para un sistema de seguimiento con realimentación del estado y control integral. El controlador integral está formado por m elementos integradores, uno por cada uno de los componentes de la entrada de comando. (La entrada de comando es un vector de dimensión m y tiene m componentes, t El integrador puede incluirse como parte de la formulación de la ubicación de polos presentada en la sección 6-5.
Sistema de seguimiento con integrador. Considere el sistema de seguimiento mostrado er la figura 6-18. Se supone que la planta es de estado completamente controlable y completamente observable. Suponga que la planta no tiene un integrador. La ecuación de estado de la planta y su ecuación de salida son x( k + 1) = Gx(A:) + Hu(A:) y (k) = Cx(k)
www.FreeLibros.me
(6-1751 (6-1761
S e c c ió n 6 - 7
S i s t e m a s d e s e g u im ie n t o
Figura 6-18
461
Sistema de seguimiento con realimentación del estado y control integral.
donde
x(k) = vector de estado de la planta (de dimensión n) u(A) = vector de control (de dimensión r) y (k) = vector de salida (de dimensión m) G = matriz de n x n H = matriz de « x « C = matriz de m x n (Observe que en el análisis presente suponemos que las dimensiones del vector de salida y del vector de control son iguales; ambos son vectores de dimensión m.) La ecuación de estado del integrador es
v(k) = v(k - 1) + r(A:) - y (k)
(6-177)
donde
\(k) = vector de error de actuación (vector de dimensión m ) r (k) = vector de entrada de comando (vector de dimensión m ) La ecuación (6-177) puede volverse a escribir como sigue:
y{k
+ 1) = v(k) + r(k + 1) - y(k + 1) = \ ( k ) + r (k + 1) - C [G x(fc) + Hu(/c)] = —CGx(fc) + v(Jt) - CHu(/c) + r (* + 1)
(6-178)
El vector de control u(A') está dado por
u(k) = - K 2x (* ) + K, v()t )
(6-179)
En nuestro sistema de seguimiento, la configuración del sistema queda especificada en la figura 6-18. Los parámetros de diseño son las matrices K, y K : .
www.FreeLibros.me
462
Ubicación de polos y diseño de observadores
Capítulo 6
A continuación analizaremos el procedimiento para determinar de las matrices K , y K 2, de forma que el sistema tenga los polos en lazo cerrado deseados. De las ecuaciones (6-175), (6-178) y (6-179), obtenemos u(/c + 1) = —K 2x(k + 1) + KjvOfc + 1) = (K 2 - K 2G - K ,C G )x (£ ) + ( I m - K 2H - K ,C H )u (A :) + K ^ A : + 1)
(6-180)
Si observamos que u(A) es una combinación lineal de los vectores de estado x(k) y v(A), podemos definir un nuevo vector de estado formado por x(k) y u(A) [en vez de x(k) y v(A)]. De las ecuaciones (6-175) y (6-180) obtenemos la siguiente ecuación de estado: x (* + 1) u (k + 1)
=
G
H
K 2 - K 2G - K i C G
^ - K jH -K .C H
*(*) _»(*)
0
+
r (k + 1)
(6-181)
K1
La ecuación de salida, ecuación (6-176), puede escribirse como sigue: 1
2 $ w
o
II
Tí
(6-182) 1
Observe que los polos en lazo cerrado del sistema están determinados por el sistema mismo, y no dependen de la entrada de comando r(k). En la ecuación (6-181), los valores característicos de la matriz de estado determinan los polos en lazo cerrado del sistema. Para aplicar en forma directa la técnica de la ubicación de polos de la sección 6-5 al diseño del sistema de seguimiento presente, considere el caso en el que el vector de comando r(A) es un vector constante (entrada escalón), de forma que r (k) Entonces, la ecuación (6-181) se convierte en
x(k + 1) u(k + 1) G K z - K z G - IG C G
H I m - K 2H - K , C H
x(k) a (k)
+
0 K ,r
(6-183)
Observe que para la entrada escalón, x(k), u(k) y x(k) tienden a los valores de vector constantes x (*). u(oc) y v(oo), respectivamente. Por lo tanto, de la ecuación (6-177), obtenemos la ecuación siguiente en estado permanente: v(oo) = v (c°) + r - y (°°) es decir,
y(°°) = r 1
1
En la salida no hay error en estado permanente cuando la entrada de comando es un vector escalón. Asimismo, en estado permanente, la ecuación (6-183) se convierte en
_u (°°)
G K .- K a G - K jC G
H l m - K 2H
www.FreeLibros.me
X(c°) K, CH
U(°o)
+
0 K ir
(6-184)
Sección 6-7
Sistemas de seguimiento
463
Definamos los vectores de error por
xe(k) = x(k) -
x(oo)
ue(k) = u(fc) - u (°°) A continuación, restando la ecuación (6-184) de la ecuación (6-183), obtenemos
x e(k + 1) u e(k + 1)
G K 2 - K 2G - K ,C G
H I m - K 2H - K jC H
x e(k) u t (k)
(6-185)
La dinámica del sistema queda determinada por los valores característicos de la matriz de estado, que aparecen en la ecuación (6-185). La (6-185) puede modificarse a
x e(k + 1) u e(k + 1)
G 0
H 0
x f(£) u e(k)
+
0
w (* )
(6-186)
donde w(Jfc) = [K 2 - K 2G - K ! C G : im - K 2H - K iC H ]
x e{k) u e(k)
(6-187)
Si definimos
= (n + m)-ve ctor = (n + m) x (n + m) matriz
= (n + m) * m matriz K = - [K , - K 2G - K, C G : I,„ - K , H ■ ■ =m x (« + rrí) matriz
K, C H ] (6-188)
las ecuaciones (6-186) y (6-187) se convierten, respectivamente, en
%(k + 1) = G | ( * ) + H w (¿ )
(6-189)
y (6-190)
w (k) = - k m Observe que la matriz de controlabilidad del sistema definido por la ecuación (6-189) es [H i G • ■••i G ,,+m 1H = matriz de (n + m) x m(n + m ) En términos de G y de H, esta matriz de controlabilidad puede escribirse como sigue: [H :G H : •••:G " +m l H ] =
H ! GH 0 ¡ Ó
G " 'H o í
• 1G n+m' 2H :r " o
(6-191)
En vista de que la ecuación de estado de la planta, dada por la ecuación (6-175), se supone de estado completamente controlable, el rango de la matriz
[H : GH :
i Gn 1H]
www.FreeLibros.me
464
U b i c a c i ó n d e p o l o s y d is e ñ o d e o b s e r v a d o r e s
C a p ít u lo ó
es n. Por lo tanto, el rango de la matriz dada por la ecuación (6-191) es n + m. En consecuencia, si la planta es de estado completamente controlable, el sistema definido por la ecuación (6-189) es de estado completamente controlable y, por lo tanto, en este caso es aplicable la técnica de ubicación de polos analizada en la sección 6-5. Una vez especificados los polos en lazo cerrado deseados, es posible determinar la matriz K mediante la técnica de ubicación de polos. Utilizando la matriz K así determinada, podemos obtener las matrices K, y K 2, como sigue. Primero, obsérvese que [K 2i K j
G - I„ CG
H CH
= [K 2G - K 2 + K ,C G .K 2H + K jC H ]
(6-192)
Entonces, de las ecuaciones (6-188) y (6-192), tenemos que k
= [k 2g = [K 2: K j]
k
2+ K j Cg ; - i
G CG
H CH
K 2H + K i C H ]
+ [ o : - i m]
Por lo tanto, [ k 2: k ,
G - I„ I H C G C H
= K + [0: I m]
(6-193)
Las matrices K , y K 2 deseadas pueden determinarse a partir de la ecuación (6-193). Debe observarse que, cuando u(k) es un vector de dimensión m, y m > 1, la matriz K no es única. En consecuencia, es posible determinar más de un conjunto de matrices K , y K 2. (Cada K posible genera un conjunto de matrices K, y K 2.) En general, debe escogerse el conjunto de K , y K ; que dé el mejor desempeño general del sistema. Finalmente, hay que notar que si no son medibles todas las variables de estado, entonces necesitaremos utilizar las variables de estado observadas en lugar dé las variables de estado no medibles, para fines de la realimentación del estado. (Asimismo, si las variables de estado medidas están contaminadas por ruido y, en consecuencia, no son precisas, para fines de realimentación del estado preferiremos utilizar las variables de estado observadas, y no las variables de estado actua les.) En la figura 6-19 se muestra un diagrama de bloques para el sistema de seguimiento, con realimentación del estado, en el cual en vez del estado real se utiliza el estado observado. Ejemplo 6-13
Considere el control digital de una planta mediante el uso de realimentación del estado y control integral. Suponga que la configuración del sistema es la misma que la que se muestra en la figura 6-18. También que la función de transferencia pulso de la planta es Z í i ) = _______ - __ _ -------U(z) 1 - z-1 + O.Olz'2 + 0.12z-3
(6-194 i ^
donde Y(z) y U(z) son las transformadas z de la salida de la planta,y(k), y de la entrada de planta (señal de control), u(k), en forma respectiva. Determine la constante de ganancia integral K¡ y la matriz de ganancia de realimentación del estado K 2, de forma que la respuesta a una entrada de comando escalón unitario tenga oscilaciones muertas. Suponga que no todas las variables de estado están disponibles para medición directa, y utilice la configuración de sistema mostrada en la figura 6-19 como ejemplo para un diagrama de bloques de ur. sistema con un observador de estados, a fin de diseñar un observador de estados tal que el estado obser vado tienda al estado verdadero tan rápido como sea posible.
www.FreeLibros.me
S e c c ió n 6 - 7
465
S i s t e m a s d e s e g u im ie n t o
Figura 6-19
Sistema de seguimiento con realimentación del estado observado.
Primero obtendremos una representación en el espacio de estados para la función de transferencia pulso de la planta. Comparando la función de transferencia pulso dada con la forma estándar F (z )
U(z)
b0 + b¡z~l + b2z ~2 + b3z 1 + axz 1 + a2z 2 + a3z~
encontramos que
bo = 0,
bi = 0,
«i = -1,
b2 =1,
a2 = 0.01,
= 0.5
a} = 0.12
Entonces, refiriéndonos a las ecuaciones (5-8) y (5-9). podemos obtener las ecuaciones siguientes en el espacio de estados para la planta:
x(k + 1) = Gx(k) + Hu(fc)
(6-195)
y(k) = Cx(k) donde G =
0 0 -0.12
1 0 -0.01
0 1 1
0 H = 0 1
(6-196)
C = [0.5
1 0]
Observe que esta planta es de estado completamente controlable y completamente observable. Determinación de la constante de ganancia integral A', y de la matriz de ganancia de realimentación del estado K 2para una respuesta con oscilaciones muertas. Ahora determinaremos la constante de ganancia integral Kt y la matriz de ganancia de realimentación del estado K :. En el sistema presente es necesario que la respuesta a la entrada de comando escalón tenga oscilaciones muertas. (Por lo tanto, deberemos ubicar los polos en lazo cerrado del sistema en el origen.)
www.FreeLibros.me
466
Ubicación de polos y diseño de observadores
Capitulo 6
Refiriéndonos a las ecuaciones (6-189) y (6-190), tenemos | (* + 1) = G | (* ) + Hw(A) W(* ) = - k m donde 0 0 -0.12 0
G 1H G = ~ ¿"¡T
1 0 -0.01 0
o 10 1 !0 1í 1 0 10
0 0 0 T
H
Nuestro problema aquí es determinar la matriz K de forma tal que los polos en lazo cerrado del sistema queden en el origen, es decir, que la ecuación característica deseada sea z4 = 0 Mediante la técnica de ubicación de polos analizada en la sección 6-5, se puede determinar fácilmente la matriz K •Refiriéndonos a la fórmula de Ackermann, tal y como se obtuvo de la ecuación (6-71), obte nemos k = [o
i] [ h : g h : g 2h : g 3h ] '<(>(g)
o o
donde
K = [0 0 0
= [0
0
= [-0.12
0
0 0 1] 0 1
0 0 1 0
0 1 1 0
0 0.01 1 1
1]
-0.13
0.99
1 1 0.99 0 0 -1 1 0
0 1 0 0
-i
1 0 0 0
0 0 -0.12 0
1 0 -0.01 0
-0.12 -0.1188 -0.1032 0
0 1 1 0
0 0 1 0
-0.13 -0.1299 -0.1274 0
0.99 0.86 0.7301 0
1 0.99 0.86 0 (6-197i
1]
La ecuación (6-197) da la matriz K . La constante de ganancia integral deseada K¡ y la matriz de ganancia de realimentación del estado K 2se obtienen de la ecuación (6-193). Si observamos que
G - I„ CG
H CH
-1 0 -0.12 0
1 -1 -0.01 0.5
0 1 0 1
0 0 1 0
es no singular (para ver esto, utilice las operaciones de renglones y columnas, y convierta la matriz en una triangular), obtenemos
www.FreeLibros.me
Sección 6-7
Sistemas de seguimiento
467
[K2: A,] = [K + [0:1]]
G - I, H CG TCH
[-0.12
-1 -0.13 0.99 i 2] 0 -0.12 0
0.12
-1 0 -0.13 0.99:2] 0 -0.12
= [ -
1 -1 -0.01 0.5 _
2 3 2 3
_
1 3
_
0.26 3
0 10 1 0 0¡1 1!0 1 1 1.5 0 ¡ 1.51 0
0
1.5
!
1¡
0.13 1.5
= [-0.12 0.3233 2:0.6667]
(6-198)
De la ecuación (6-198) obtenemos la constante de ganancia integral A',: (6-199)
Ai = 0.6667 = |
La matriz de ganancia de realimentación del estado K, está dada por K2= [-0.12 0.3233 2] Cómo determinar la salida y(k).
(6-200)
A continuación determinemos la saliday(ifc). En la ecuación
(6-196).tenemos que y (k )
= Cx(k) = [0.5 1 0]
xi(k) x2(k) x3(k)
Para obtener la saliday ( k ) . primero determinaremos el vector del estado x { k ) y la señal v ( k ) . De la figura 6-18. x(k + 1) = Gx(k) + Hu(k)
(6-201)
y(k) = Cx(¿)
( 6-202)
v(k) = v(k - 1) + r(k) - y(k)
(6-203)
u(k) = —K 2x(/c) + Ai v(k)
(6-204)
Por lo tanto, de las ecuaciones (6-201) y (6-204) obtenemos x(k + 1) = Gx(k) + Hu(k) = (G - HK2)x(/c) + HA, v(k) Asimismo, de las ecuaciones (6-202). (6-203) y (6-205) v(k + 1) = v(Jt)+ r(k +1) - y (k
(6-205) +
1)
= v(k) + r(k + 1) - Cx(k + 1)
= v(fc) +r(k + 1) - C[(G - HK2)x(/c) + HA, v(/c)] = -(CG - CHK2)x(A:) + (1 - CHA,)v(lt) + r(k Combinando las ecuaciones (6-205) y (6-206), resulta x(k + 1) v(k + 1)
G - HK2 ! HA, -CG + CHKzl 1 - CHA,
www.FreeLibros.me
x{k) v(k)
+
1)
0 " r(k + 1) 1
(6-206)
(6-207)
468
U b i c a c i ó n d e p o lo s y d is e ñ o d e o b s e r v a d o r e s
1)
0
1
0
0
* i(£ )
x 2( k + 1)
0
1
0
*2 ( A )
+ 1)
0
0 i
-1
2 3
* 3( A )
0
v ( k + 1)
0
2
-1
1
_v(*)_
1
*i (£
+
* 3( *
Dado que la entrada de comando
r (k )
_ 3 _1
0 0 +
es de escalón unitario, tenemos que r ( k )
=
1,
*=0,1,2,...
Supongamos que el estado inicial es
a b c d
*i(0 ) *2(0) * 3(0) _v (0 )_ donde a, b. c y d son arbitrarios. Entonces, de la ecuación * i(l) *2(1) *3(1) v (l)_
0 0 0 0
1 0 _1 3 _1 2
0 1 -1 -1
a b c d
0 0 2 3
1
0 0 0 [1] = 1
+
b c —ib — c + Id —ib — c + d + 1
De manera similar,
*.(2) -\b
*2( 2 ) *3(2) v (2 );
- ib - le + i d + 2
*i(3)
- ib - c + \d
*2(3)
2
3 2 3 2 3
* 3 (3 )
v(3)
* i (k)
*2(k) *3(*)
k = 4 ,5 , 6 , .. .
. y(k)
,a salida y(k) se obtiene como sigue:
*:( 0 ) y (0 ) = [0.5
1
0]
*2( 0 )
= [0.5
1
0]
*3(0) Del mismo modo,
y ( l ) = \b + c
y ( 2) = - ib - i c + l d y ( 3 ) = - i b - i 2c + i d + l y(k) = 1,
* = 4 ,5 , 6 , . . .
www.FreeLibros.me
C a p ít u lo ó
+ b
(6-208)
Sección 6-7
Sistemas de seguimiento
469
u(k) = —K 2x(k) + K lV(k) = - [-0 .1 2
0.3233
2]
+ (§)(?) = 0.08670
donde k = 4. 5. 6. . . . En vista de que u(f). para t >47'(donde / es el periodo de muestreo). es constante, en la salida no existe oscilación entre muestras. Entonces, la respuesta del sistema tiene oscilaciones muertas. Observe que la salida v(A) llega a la unidad en cuatro períodos de muestreo como máximo, y que se queda ahí en ausencia de perturbaciones o de nuevas entradas de comando. [Vea. por ejemplo, la secuencia de respuesta escalón unitario de muestra que aparece en la figura 6-20a).J Bajo condiciones iniciales especiales, por ejemplo. a = b = c = 0 \ d = 1. la salida alcanza la unidad en tres períodos de muestreo y se queda ahí. es decir. y(k) = 1 para k = 3. 4. 5. . . . [Véase la figura 6-206).[
Diseño del observador de estados. A continuación, diseñaremos un observador de estados para el sistema. En vista de que la salida de la planta y(k) es medible. diseñemos un observador de orden mínimo. Supongamos que deseamos la respuesta con oscilaciones muertas. En el sistema presente, la
X, (0) x 2 (0) *3 (01 x(0)
1 - 0 .5 0 1
y{k) =0.5.x, ( k ) + x2{k)
(a)
yW, x, (0) x2(0) x3(0) r(0)
1.0
0.5
Y 0 0 _1
ytk) = 0.5.x, U ) + x2 ik)
(b) Figura 6-20
Secuencias de respuesta escalón unitario de muestra para el sistema de seguimiento, con realimentación del
estado actual (medida) y control integral diseñado en el ejemplo 6-13.
www.FreeLibros.me
470
Ubicación de polos y diseño de observadores
Capítulo ó
matriz de salida C está dada por
C = [0.5 Para modificar la matriz de salida C [0.5
1
1 0]
0] a [ 1
0
0], hagamos la siguiente transformación:
x(*) = T S(k)
(6-209)
donde
0 0 1 1 0 -0.5 0 1 0
T =
( 6 -2 1 0 )
Observe que
0.5 0 1
T -> =
1 0 0 1 0 0
(6-211)
Entonces, las ecuaciones de estado de la planta se convierten en ( 6-2121
Í(k
+ 1) = T - 'G T |(tfc) + T ’ H u(k)
y(k)
= C T |(fc)
(6-213)
donde
'0.5 T l GT = 0 1 =
1 0' 0 1 0 0
0.5 -0.01 1
0 0 -0.12
1 0 -0.01
1 -0.25 ' 1 -0.115 = G 0 -0.5
'0 ' 1 0' r °" 0 1 0 = 1 0 0 0 i
'0.5 T _1H = 0 1
0 0 1 0] i 0 0 1
CT = [0.5
0' '0 0 1 1 1 0 -0.5 1 0 1 0
1 -0.5 0
H * = [1 = [1
0
0] = c
Las ecuaciones de sistema transformadas son las siguientes: ‘ f . (* + 1) ‘ fc(* +‘ í ) =
6 (* + 1)
0.5 1 1
-oVofj
1 1 ! 0
-0.25 ' [ 6 (* )1 ' 0' -0.115 & (* ) + í u ( k ) 0 -0.5 6 (* )
6 (* )'
y{k) = [1:0 0] fe(*)
(6-214)
(6-215)
6 (* ) Dado que sólo se puede medir una variable de estado, necesitaremos observar dos de ellas. Por lo tanto, el orden del observador de orden mínimo es 2. De las ecuaciones (6-138) y (6-114). tenemos que
www.FreeLibros.me
Sección 6-7
Sistemas de seguimiento
471
G m, — K , G o* 1 - kei
—kei
-0.115 + 0.25fce, -0.5 + 0.25ke2
La ecuación característica del observador es
|zl - Gbb + K f G„é| =
z - 1 + ke¡
k€1
0.115 - 0.25kei ! z + 0.5 - Q.25keJ.
= (z - 1 + kei){z + 0.5 - 0.25k' 2) - Jfc,2(0.115 - 0.25/t,)
= z 2 + (ket - 0.25ke2 - 0.5)z + (0.5keí + 0.135^2 - 0.5) =0
(6-216)
Dado aue Queremos una respuesta con oscilaciones muertas, la ecuación característica deseada es
Por lo tanto, es necesario que
ke¡ - 0.25ke2 - 0.5 = 0 0.5ke¡ + 0.135/t2 - 0.5 = 0 Resolviendo estas dos ecuaciones simultáneas en función de krl y
kei ke2
. tenemos
"0.7404' 0.9615
Control integral con observador de estados. Hasta ahora hemos considerado un problema de diseño en el cual las variables de estado observadas se realimentan en un lazo menor, y en el lazo princi pal se utiliza un controlador integral. En la parte del diseño de la ubicación de polos, hemos utilizado un estado real en vez de un estado observado. A continuación obtendremos las ecuaciones de sistema para el caso en el que se utilizan el controlador integral y el observador de estados. El uso del estado observado x (k), donde x ( k) = T £(k). modifica la señal de control it(k). en el control con realimentación del estado, como sigue. En la ecuación (6-204) tenemos
u(k) = - K 2x(*) + K, v(k) = - K 2TC (¿) + K, v(k)
(6-218)
Definamos
i ik) - m
= €(*)
Entonces, la ecuación (6-218) se puede escribir como sigue:
(6-219)
u(k) = - K 2T |(fc) + K íV{k) + K^T e(fc) que puede expresarse como
b(k) u(k) = [-0.3233
-2
0.2817] &{k)
Uk) + §v(tfc) + [0.3233
www.FreeLibros.me
2
«,(*) -0.2817] e2(k)
e,(k)
(6-220)
Ub icación de polos y diseño de observadores
472
Capitc
Sustituyendo la ecuación (6-220) en la ecuación (6-214). obtenemos
0.5
U k + 1) 6 (* + 1) H k + 1)
=
_i
3 1
1 - 0 .25 " m 1 -1 h(k) 6 0 -0.5 6 (* ) "0" 2 3
0
0
0
v(k) + 0.3233 2 -0.2817 0
0
0
(k) e,{k) «2
0
(6-221
Asimismo, se puede modificar la ecuación (6-206) para obtener
v(k + 1) = -(C G T - CH K2T)|(fc) + (1 - C H K .M *:) + r(k + 1) es decir.
£>(*) 1 -0.25] fe(*)
v(k + 1) = -[0.5
+ v(£) + r(k + 1)
(6-222i
ÍÁk) Si nos referimos a la ecuación (b-ioo), y ooservamos que error del observador mediante
e2(k + 1) e 3( *
+
e¡(K)
—[Gí,* —K, Ga(,]
1)
= u. es posioie dar la dinámica
«2(k)
ak)
Y. por lo tanto.
ei(k + 1) l!0 0 e2(k + 1) = 0_| 0.2596 ' ' “ 0"07Ó1 V2(fc) 0 ! -0.9615 -0.2596 eÁk) «3(k + 1)
(6-223)
Si combinamos las ecuaciones (6-221). (6-222) y (6-223) en una ecuación de estado.
Uk Uk ak v(k
+ 1) + 1) + 1) + 1)
e i(*
+
1)
e2(k + 1) a k + 1).
_
0.5 1 3
1
=
- 0.5 0 0 0
1 -1 0 -1 0 0 0
0 0 2 0.3233 3 0 0 -0.5 0.25 1 0 0 1 0 0 0 0 0 0 0
-0.25 1
6
0 2 0 0 0 0.2596 -0.9615
0 a ^ -0.2817 a ^ 0 a ^ v(k) 0 0 ak) 0.0701 a a -0.2596 _ a k )
(6-224)
r(k + 1)
.a salida de la plantay(k) puede ser
# ) = [!
« * )' 0 0] 6 (* )
fi(k)
(6-225)
Uk) Se puede demostrar que para la entrada de comando escalón unitario, la respuesta del sistema ba una condición inicial arbitraria.
www.FreeLibros.me
Sección 6-7
Sistemas de seguimiento
473
m m m
a b c d
_
v ( 0 )
0
€,(0) e2(0)
a
.*3(0).
A
requiere de por io menos seis períodos de muestreo para completarse. (F.s decir, la salida llega a la unidad como máximo en seis períodos de muestreo. y después se queda ahí en ausencia de perturbaciones y nuevas entradas de comando.) Observe que, como ya vimos, si el estado real puede ser realimentado. el sistema requiere como máximo de cuatro períodos de muestreo para completar la respuesta escalón unitario. [En el caso en que ¿ , ( 0 ) = 0 , £2( 0 ) = 0 . É s (0 ) = 0 , y v ( 0 ) = 1, el sistema sólo requiere de tres períodos de muestreo para completar la respuesta escalón unitario.] Sin embargo, si se utiliza el observador de estados, el tiempo de respuesta aumenta. Si se utiliza el observador de orden mínimo (en este caso de segundo orden), el sistema requiere como máximo de seis períodos de muestreo. para completar la respuesta escalón unita rio. [Vea, por ejemplo, la secuencia de respuesta escalón unitario de muestra, que aparece en la figura 621a).] Esto significa que, en casos especiales, el tiempo de respuesta es mucho más corto. Por ejemplo, si las condiciones iniciales son ¿ , ( 0 ) = 0, £ , ( 0 ) = 0, £ ¡( 0 ) = 0, v(0) = 1. £ , ( 0 ) = 0. y e , ( 0 ) = 0.
0 í, (0) 0 fj(0) 0 Í 3(0I r(0) = 1 e, (0) 0 e2(0) 0.5 €3(0) 0
1.5
1.0
0.5
WM =£,(*•)
(a)
i \ ’ o"
í,(0 ) É 2 I°>
0
t 3 (0)
0
v(0 )
• -
1
=
e , (O í
0
e 2 (0 |
0 0
e ,(0 ) ,------- é -
0
1
I
2
3
4
1
5
1
6
1
7
i
8
,
L
*
W*> =*,<*• (b)
Figura 6-21
Secuencia de respuesta escalón unitario de muestra para el sistema de seguimiento con una rcalimentación del estado observado y un control integral diseñado en el ejemplo 6-13.
www.FreeLibros.me
474
Ubicación de polos y diseño de observadores
Capítulo 6
entonces, para completar la respuesta escalón unitario, el sistema sólo requiere de tres períodos de muestreo. Véase la figura 6-21 (b).
PROBLEMAS DE EJEMPLO Y SOLUCIONES
Problema A-6-1 La definición de controlabilidad que se da en la sección 6-2 no es la única que se usa en los libros. A veces se utiliza la siguiente definición: un sistema de control se define como de estado controlable si. dado un estado inicial arbitrario x(0). es posible traer el estado al origen del espacio de estados en un intervalo de tiempo finito, siempre que el vector de control no tenga restricciones (no acotado). El concepto de alcanzabilidad. similar al de controlabilidad, se encuentra en los libros y se utiliza en la forma siguiente: un sistema de control se define como alcanzadle si. al empezar desde el origen del espacio de estados, el estado puede ser llevado a un punto arbitrario en el espacio respectivo en un período finito, siempre que el vector de control no esté restringido (no acotado). Demuestre que el sistema
0 0 -1 1
Xj (k + x2(k +
x,(k) x2(k)
u(k)
es controlable (en el sentido definido en este problema), pero no alcanzable. Solución
Si se reescribc la ecuación de estado del sistema, se obtiene
x¡(k + 1) = 0 x2(k + 1) = ~x,{k) + x2(k) + u(k) Empezando a partir de un estado arbitrario resulta JT l(l) = 0 x 2( l ) = - * i ( 0 ) + x 2( 0 ) + u ( 0 )
Por lo tanto, al seleccionar
u( 0) = x,(0) - x2(0) el estado puede ser llevado al origen en un solo paso. Por lo tanto el sistema es controlable en el sentido definido en este problema. Si el estado empieza a partir del origen, tenemos
* ( 1) = o
x2(l) = -x,(0) + x2(0) + k(0) = -0 + 0 + u(0) = u(0) Aunque ,v2( l ) puede ser llevado a un punto arbitrario en un paso, jr,(l) no puede ser controlado. En consecuencia, el sistema no es alcanzable. Observe que el sistema presente no es controlable en el sentido definido en la sección 6-2 (donde el estado terminal es un punto arbitrario en el espacio de estado incluyendo el origen), porque no se satisface la condición de rango requerida, como muestra lo siguiente:
rango [H: GH] = rango
www.FreeLibros.me
0 0 1 1
= 1< 2
Capítulo ó
Problemas de ejemplo y soluciones
475
Como se ve en este problema, controlabilidad y alcanzabilidad (ambas definidas en este proble ma) son distintas. Sin embargo, si la matriz de estado G es no singular, entonces la controlabilidad completa del estado, en el sentido definido en este problema, y la alcanzabilidad completa del estado, significan lo mismo. Es decir, para el sistema con una matriz no singular G. la controlabilidad completa del estado significa la alcanzabilidad completa, y viceversa. Problema A-6-2 Considere el sistema de estado completamente controlable definido por
x(k + 1) = Gx{k) + H u{k) donde G =
1 0
0.6321 0.3679
H
0.3679 0.6321
El periodo de muestreo es de 1. La señal de control u(k) es no acotada, es decir -C O
< u(k) <
00
entonces un estado inicial arbitrario x(0) puede ser traído al origen como máximo en dos períodos de muestreo. utilizando una señal de control constante por intervalos. Deduzca la ley de control para transferir un estado inicial arbitrario x(0) al origen. Determine la región en el espacio de estados en el cual el estado inicial puede ser llevado al origen en un período de muestreo. Si la magnitud de u(k) está acotada, entonces algún estado inicial no podrá ser transferido al origen en dos períodos de muestreo. (Pudieran requerirse de dos, tres, cuatro o más de tales períodos.) Suponga que
\u(k)\ < 1 Determine la región de los estados iniciales en el plano y . y que pueden ser transferidos al origen en uno y en dos períodos de muestreo. respectivamente, al usar la señal de control acotada \u{k)\ < 1.
Solución
Para el casoenque it(k) es no acotada. como máximo dos períodos de var que
En vista de que el sistema es del segundo orden, se necesitan muestreo para transferir cualquier estadoinicial x(0)al origen. Al obser
x (l) = Gx(0) + Hw(0)
(6-226)
x(2) = 0 = G x (l) + H w (l) = G2x(0) + GHw(0) + H m(1) y que G es no singular, se obtiene
x(0) = -G ~ 'H u(0 ) - G~2H u (l)
(6-227)
Sustituyendo la ecuación (6-227) en la ecuación (6-226).
x (l) = - G -tH « (l)
(6-228)
Observa
G lH =
G 2H =
1 -1.7181' 0.3679 0
2.7181
"l 0
—6.3881 7.3881
0.6321
-0.7181 1.7181
" 0.3679" 0.6321
-3.6700 4.6700
www.FreeLibros.me
Ubicación de polos y diseño de observadores
476
Capítulo ó
De las ecuaciones (6-227) y (6-228) se obtienen las dos siguientes:
*,(0) .*2(0)
’ -0.7181" h ( 0) 1.7181
*,(1)
-0.7181" «(1) 1.7181
.^ O ).
-3.6700 w(l) 4.6700
(6-229i (6-230
Si se conminan las ecuaciones to-z/y) y (o-zjug se tiene
*,(0)
x .(l)
*2(0)
*2<1)
'u(O)
« (1)'
_ « (1)
0
3.6700" fu(0) -4.6700 L « 0 )
0.7181 -1.7181
« (1)'
0
que puede modificarse a
-1.5820 0.5820
-1.2433] *,(0) 0.2433] *2(0)
* i(l)
(6-231
x *(l).
de la cual se obtiene
u(k) = -1.5820*1(/fe) - 1.2433*2(fc),
k
=
0,1
Esta ecuación da la ley de control requerida. Con esta ley cualquier estado inicial x(0) puede transferirse al origen cuando mucho en dos períodos de muestreo. A continuación se determinarán los estados iniciales a partir de los cuales el estado del sistema puede ser transferido al origen en un solo período de muestreo. Al igualar x (l) a 0 en la ecuación (6-226). se obtiene
x (l) = 0 = Gx(0) + Hu(0) de lo cual resulta
x(0) = - G -1Hu(0) es decir
‘*,(0)" * 2(0)
0.7181 -1.7181
m
( 0)
(6-232
De la ecuación (6-232) se encuentra que si el estado inicial está sobre la línea
1.7181*,(0) + 0.7181x2(0) = 0 entonces puede ser transferido al origen en un solo período de muestreo. (De lo contrario, necesitamos ce dos períodos para traer el estado inicial al origen.) Si se necesita x (l) = 0, entonces, a partir de A
En el caso en que u(k) está acotada, es decir \u(k)\ <1. ecuación (6-232) se tiene
*,(0) = 0.7181u(0),
*2(0) = -1.7181u(0)
Dado que |«(0)| < 1,
|*,(0)| < 0.7181,
|*2(0)1 < 1.7181
Por lo tanto, si el estado inicial está sobre el segmento de recta
1.7181*i(0) + 0.7181*2(0) = 0,
-0.7181 < *,(0) < 0.7181
puede ser llevado al origen en un solo período de muestreo. Este segmento aparece en la figura 6-22 como AOB.
www.FreeLibros.me
Capítulo ó
F ig u ra 6-22
Problemas de ejemplo y soluciones
477
Regiones a partir de las cuales los estados iniciales pueden ser llevados al origen en lino o dos períodos de
muestreo, cuando m k) está acotada de forma que |;,(A)| < 1.
Si se necesita que x(2) = 0. entonces de la ecuación (6-23 I ) se obtiene « (0 ) = —1.5820* ,(0) - 1.2433;c2(0)
u( 1) = 0.5820*,(0) + 0.2433*2(0) Como ¡;/(0)¡ < I \ ]»(1)| < 1. se obtienen las siguientes cuatro relaciones: 1.5820*,(0) + 1.2433*2(0) s 1 1.5820*,(0) + 1.2433*2(0) > -1 0.5820*,(0) + 0.2433*2(0) s 1 0.5820*,(0) + 0.2433*2(0) > -1 l.a región limitada por estas cuatro desigualdades aparece en la figura 6-22. Si el estado inicial ocurre en esta región, excepto en la línea.-íOtí. puede ser transferido entonces al origen en dos periodos de muestreo. Si el estado inicial está fuera de esta región, llevar el estado al origen tomará entonces más de dos periodos.
www.FreeLibros.me
478
Ubicación de polos y diseño de observadores
Capítulo ó
Problema A-6-3 Considere el sistema de función de transferencia pulso siguiente:
*(z ) 1/(2)
z ~ '(l + 0.8z~') 1 + 1.3Z'1 + 0.4z~2
Una representación en el espacio de estados para este sistema puede estar dado por
Xi(k + 1) x2(k + 1)
0 -0.4
1 -1.3
Xt(k) x2(k)
’o'
1 « (* )
X i (k)
(6-233) (6-234)
y(k) - [0-8 1] x2(k)
!
(k) x2(k)
i o
*i (k + 1) x2{k + 1)
O
1
Para el mismo sistema se puede dar una representación en el espacio de estados diferente mediante
-1.3
0.8’ 1 “W
v*.i lr\) xt(k y(k) = [o i] x2(k)
(6-235) (6-236)
Demuestre que la representación en el espacio de estados definida por las ecuaciones (6-233) > (6-234) da un sistema que es de estado controlable, pero no observable. Demuestre, por otra parte, que la representación en el espacio de estados definido por las ecuaciones (6-235) y (6-236) da un sistema que no es de estado completamente controlable, pero sí observable. Explique lo que causa la diferencia aparente en controlabilidad y observabilidad del mismo sistema.
Solución Considere el sistema de control en tiempo discreto definido por las ecuaciones (6-233) > (6-234). El rango de la matriz de controlabilidad [H :GH] =
0 1 1 -1.3
es 2. Por lo tanto, el sistema es de estado completamente controlable. El rango de la matriz de observabilidad [C * : G *C *] =
0.8 1
-0.4 -0.5
es 1. De modo que el sistema no es observable. A continuación, considere el sistema definido por las ecuaciones (6-235) y (6-236). El rango de la matriz de controlabilidad [H :GH] =
0.8 1
-0.4 -0.5
es 1. Por lo tanto, el sistema no es de estado completamente controlable. El rango de la matriz de observabilidad |C * : G * C * ] =
0 1 1 -1.3
es 2. En consecuencia, el sistema es observable. La diferencia aparente en controlabilidad y observabilidad del mismo sistema está causada por e hecho de que el sistema original tiene una cancelación polo-cero en la función de transferencia de puls:
Y ( z ) ____________________________________ 2 + 0.8 z + 0.8 U(z) z 2 + 1.3z + 0.4 (z + 0.8)(2 + 0.5)
www.FreeLibros.me
Capítulo 6
Problemas de ejemplo y soluciones
479
Si ocurre una cancelación polo-cero en la función de transferencia pulso, entonces la controlabilidad y la observabilidad varían, dependiendo de cómo se escojan las variables de estado. Note que para que sea de estado completamente controlable y completamente observable, el siste ma de función de transferencia pulso no debe tener ninguna cancelación polo-cero.
Problema A-6-4 Considere el sistema de control definido por
x(k + 1) = Gx(k) + Hu(k)
(6-237)
y{k) = Cx(fc) + D
(6-238)
donde
x(k) ü{k)
= vector de estado (de dimensión n) = señal de control (escalar)
y(k) = señal de salida (escalar) G = matriz de n x n
H = matriz de n * 1 C = matriz de 1 * n
D = escalar (constante) Como se indicó mediante la ecuación (5-60), la función de transferencia de pulso F(z) puede darse como sigue:
F(z ) = C (zl - G) 'H + D Demuestre que si el sistema es de estado completamente controlable y completamente observable, en tonces en la función de transferencia pulso F(z) no hay cancelación polo-cero.
Solución Suponga que existe una cancelación polo cero en la función de transferencia de pulso, aun que el sistema sea de estado completamente controlable y completamente observable. Considere la siI 0 C (zl - G ) '1 1
zl - G
H
~C
D
zl - G 0
H
F(z)
Al tomar el determinante del primer miembro de la ecuación, e igualarlo al del segundo miembro, se obtiene
zl - G -C
H l = |zl - G|F(z)
D\
es decir.
F(z) =
zl - G -C
H
D
¡zl - G|
Los polos de F(z) son las raíces de |zl —G| = 0, y los ceros de F(z) son las raíces de
zl - G -C
H
D
=0
(6-239)
Ahora suponga que ocurre una cancelación polo-cero. Supongamos que z = z, es un polo de F(z) y también es un cero de F(z), por lo que se presenta cancelación. Entonces :-z¡ es una raiz de |rl —G| = 0. También es una raíz de la ecuación del determinante dada por la ecuación (6-239).
www.FreeLibros.me
480
Ubicación de polos y diseño de observadores
Capítulo ó
Esto significa que existe un vector
donde v es un vector de dimensión n y w es un escalar, de Forma que
0 Ó
(6-240)
(G - Z il)v = Hw
(6-241)
Zi I - G : H -C \D
V
w
Si u' > 0. entonces de la ecuación (6-240) tenemos
es decir.
Dado que o = o, es una raíz de la ecuación característica, el polinomio característico 4>{z) de G se puede escribir como sigue:
4>(z) = (z
- Z i)4 > (z )
o sea
<Á(G)H = 0 En vista de que <(,(z) es un polinomio de grado n - 1, el hecho de que <^(G)H = 0 significa que el vector G ”~' H se puede expresar en función de G, G H , . . ., G" 2 H. Por lo tanto. rango [H :. G H • ••• i G ""1H] < n Esto contradice la suposición de que el sistema es de estado completamente controlable. Por lo tanto, si el sistema es de tal estado, entonces en la función de transferencia pulso no existe cancelación de polocero. Ahora, refiriéndonos a la ecuación (6-240), si w = 0 y v > 0 se tiene entonces
(z, I - G)v = 0 Cv = 0
(6-242: (6-243 >
De la ecuación (6-243),
v*C* = 0 De la ecuación (6-242),
v*G* = Zi v* Por lo tanto.
v*G*C* = z, v*C* = 0 donde hemos utilizado la ecuación (6-244). En forma similar, v*(G *)2C*
= v*G*G*C* = z, v*G*C* = z?v*C* = 0
www.FreeLibros.me
(6-244 ‘
Capítulo 6
Problemas de ejemplo y soluciones
481
v*(G *)*_1 C* = z í“ V C * = 0,
fe = 1 ,2 ,3 ,... ,n
Por lo tanto,
v*[C* : G *C *: •••: (G *)"-1 C*] = 0 es decir,
rank [C* i G*C* i •••i (G *)"*1C*] < n Lo anterior contradice la suposición de que el sistema sea completamente observable. Entonces, si el sistema es de tal clase no existe cancelación polo-cero. Esto comprueba que si el sistema es de estado completamente controlable y completamente obser vable, entonces en la función de transferencia pulso F(z) no existe cancelación polo-cero.
Problema A-6-5 Considere el sistema de estado completamente controlable
x(fe + 1) = Gx(fe) + Ha(fe) Defina la matriz de controlabilidad como M:
M = [H i GH i 0 1 M “ ‘ GM = 0
Demuestre que
•:g "~ ‘ h ]
0 ••• 0 0 0 1 ••• 0
0 0 donde a,. a2, . .. ,
a„
~an O/i—i (6-245)
1
~°X
son los coeficientes del polinomio característico
\zl - G| = z n + axz n—1 + •'• + ün-\ z + an Solución
Consideremos el caso donde
n =
3. Se demostrará que 1
i «5 1
O
O
GM = M 1 0 - a 2 0 1 -a,
(6-246)
El primer miembro de la ecuación (6-246) es
gm = g [ h : g h : g 2h] = [G H : G2H G3H] El segundo miembro de dicha ecuación es
[h : g
h
0 0 ; g 2h ] 1 0 0 1
-a3 —a2 = [g -a,
h ; g 2h
; -fl3H - a2GH - a,G 2H]
(6-247)
El teorema de Cayley-Hamilton dice que la matriz G satisface a su propia ecuación característica, es decir,
G" + ai G"-1 + ■•• + a„-i G + a„ I = 0 Paran = 3 se tiene
G3 + «’ G 2 + ^
+ «31 = 0
www.FreeLibros.me
(6-248)
482
Ubicación de polos y diseño de observadores
Capítulo 6
Al usar la ecuación (6-248), la tercera columna del segundo miembro de la ecuación (6-247) se convierte en
- b jH - a2GH - a¡ G2H = G3H Por lo tanto, la ecuación (6-247), que es el segundo miembro de la ecuación (6-246), se convierte en
[h : g
h
0 0 -a3 ; g 2h ] 1 0 —a2 0 1 -a,
[g
: g 2h : g 3h ]
h
Así se ha demostrado que la ecuación (6-246) es cierta. Por lo tanto,
0 0 10 0 1
M " 'G M =
-a3 -a2 -a,
La deducción anterior se puede extender fácilmente al caso general de cualquier entero positivo n. Problema A-6-6 Considere el sistema de estado completamente controlable
x(k + 1)
= G x(k) + Hw(fc)
Defina
= [H
g h
i
;
•:G "^' H]
2 ••• a¡ i
1 0
... ...
0 0
On-2 an- 3 . . . W = «1 1
1 0
o o
donde las a, son los coeficientes del polinomio característico
\zl - G\ = z" + a\ z n
+ ••• + a„-1 z + a„
Defina también
T = MW Demuestre que
0 0
1 0
0 1
•
0 0
0 0 T _1H =
T 1GT =
0 1
• 1 0 0 -a„ • -fll Úfl-1 —
Solución
0
T _1GT = (M W )"'G (M W ) =
www.FreeLibros.me
1
0
0 0 1 —«3 ~o2 -a¡
(6-249'
Capítulo ó
Problemas de ejemplo y soluciones
483
Refiriéndonos al problema A-6-5, se tiene (M W )- 'G (M W ) = W ^I(M ^1G M )W = W 1
0
0 —a 3
1
0 ~a2
0
1 - a¡
W
Por lo tanto, la ecuación (6-249) se puede reescribir como sigue: 0 0 w 1 1 0 0 1
0 0
1 0
~a3
~a2
0 1 -fli
0
1
0
0
0
1
-a3
~a2
-a¡
~a3
-
W =
a2
-ai
En consecuencia, debemos demostrar que -a3
0
-a2
0
1
-ai
£ II
0
1
£
0
(6-250)
El primer miembro de la ecuación (6-250) es 0
0
~a3
a2
fli
1
1
0
~a2
ai
1
0
0
1
—a ¡
1
0
0
~a3
0
0
a¡
1
0
1
0
=
0
Y el segundo miembro a2
ai
1
0
1
0
ai
1
0
0
0
1
1
0
0
-a3
~a2
-ai
~a3
0
0
ai
1
0
1
0
=
0
Es claro que la ecuación (6-250) es cierta. Por lo tanto, se ha demostrado que 0 0
T ’ GT =
1 0
-a 3 ~a2
0 1 -a¡
A continuación, se demostrará que
T
(6-251)
H =
Observe que la ecuación (6-251) se puede escribir de la forma: 0 0 H = T 0 = MW 0 1 1 Esta última ecuación puede verificarse fácilmente, debido a que 0 0 T 0 = M W 0 = [H : GH IG 2H] 1 1
= [h : g h ; g 2h ]
h
www.FreeLibros.me
a2
ai
1
ai
1 0
0 0
1
0 0 1
484
Ubicación de polos y diseño de observadores
Capítulo 6
Por lo tanto, T^H = La deducción anterior puede extenderse con facilidad al caso general de cualquier entero positivo n. Problema A-6-7 Considere el sistema siguiente:
x{k + 1) = Gx(fc) + Hw(At) donde G =
0 H = 0 1
1 0 1 , 0 - a 3 - a 2 -a, 0 0
Observe que el sistema está en la forma canónica controlable. Defina la matriz de transformación T como sigue: T = MW donde m
= [h ; g
h íg
2h ]
a2 ai 1 w = ai 1
1 0 0 0
Demuestre que si el sistema está en la forma canónica controlable, entonces T = I. En consecuencia, si el sistema está en la forma canónica controlable se tiene que «i 1 0
M 1= W = solución
En vista de que
M =
0 1
-ai se tiene
Por lo tanto.
0 0 1 T = MW = 0 1 -a i
1 - ai —a2 + a\
1
-ai ~a2 + ai
a2 ai 1 1 0 0 ai 1 0 = 0 1 0 = I 1
«2
M -1 = W =
ai 1
0
0
ai 1 1 0 0 0
www.FreeLibros.me
0 0
1
Capítulo 6
Problemas de ejemplo y soluciones
485
Problema A-6-8 Considere el sistema completamente observable x(fc + 1) = G x(k)
y{k ) = C \{k) Defina la matriz de observabilidad como N: N = [C * : G*C* : •■•: (G *)"-1 C*] Demuestre que 0 0
1 0
0 1
• •
0 0
0 -a„
0
0
•
1
■
- fll.
N *G (N *)-1 =
&n~
-2
(6-252)
donde ab a2, . . ., a„ son los coeficientes del polinomio característico |zl - G| = zn + aiZ ""i + ••• + a„_!z + an Solución forma
Consideremos el caso donde n = 3. Entonces la ecuación (6-252) 0 0
1 0
0 1 ~a2 -fli - ~°3 La ecuación (6-253) se puede volver a expresar como N *G(N*)~' =
1 0 0 1 N* -a2 -fli
0 0 -fl3
N*G =
(6-253)
(6-254)
Demostraremos que la ecuación (6-254) es cierta. El primer miembro de la ecua c CG CG G = CG2 CG2 CG3
N*G = El segundo miembro de la misma es 0
1
0
0
0
1
~fl3
-a 2
-fli
N* =
0
1
0
C
0
0
1
C G
- a 3
-a 2
-fli
C G
C G
=
2
C G •"ÍÍ
3C
Ü2 C
2 G
ci\ C
G
2
El teorema de Cayley-Hamilton dice que la matriz G satisface su propia ecuación característica, es decir, para el caso de n = 3, G3 + a iG 2 + a2G + a3I = 0 Por lo tanto,
- a , CG2 - a2CG - a3C = CG3
www.FreeLibros.me
486
Ubicación de polos y diseño de observadores
Capítulo ó
E n consecuencia.
0 0
1 0
-a}
0
CG 1 N* = CG2 CG 3 ~a2 -fli
Se ha demostrado así que la ecuación (6-254) es cierta. Por lo tanto.
N *G (N *)_1 =
0 0 —a3
1 0
0 1
—Ü2 —a\
La deducción aquí presentada puede extenderse al caso general de cualquier entero positivo n. Problema A-6-9 Considere el sistema de estado completamente controlable y completamente observable, dado por
x(k + 1) = G x(k) + H u(k)
(6-255)
y{k) = Cx(k) + Du(k)
(6-256)
Defina
1
1 0
0 0
0 0
a¡
a„-i
a„- 2 a„-2 an-3 w = «i 1
1 0
donde las a, son los coeficientes del polinomio característico
\zl - G| = z" + «i z"~' + ■•• +
z + a„
Defínase también
-1 3 = (W N *)' Demuestre ahora que
Q
0 0 0 1 0 ••• 0 GQ = 0 1 0
—a„ - a „-,
0 0
“ Al
•••
[0 0
Q _1 H
—2
1 0
1]
b„ - a„bo b„~i — a„ ~ i bo b\ —Q\ bo
donde las b¡ (k = 0, ], 2, , n) son los coeficientes que aparecen en el numerador de la función ce transferencia de pulso, cuando C(zJ - C p 1H + D se escribe como sigue:
www.FreeLibros.me
Capítulo 6
Problemas de e[emplo y soluciones
C (zl - G )_1 H + D =
487
z n + «1 z n
+ a„-i z + a„
donde D = b,..
Solución
Consideremos el caso cuando n = 3. Se demostrará que
0 0 -« 3 1 0 -02 0 1 “ Oí
Q_1GQ = (W N *)G (W N *)_I =
(6-257)
Observe que refiriéndonos al problema A-6-8. se tiene
0 0 -03
(W N *)G (W N *)~1 = W [N *G (N *)_1]W '' = W
1 0 0 1 w_ -02 -Oí
Por lo tanto, se necesita demostrar que
0 1 0 0 0 1 W -o3 —o2 —Oí
W
=
0 0 -o3 1 0 -02 0 1 -Oí
es decir 0
1
0
0
0
1
-03
-02
-O í
W
=
0
0
—o 3
1
0
- 0 2
0
1
-O i_
W
(6-258)
E l primer miembro de la ecuación (6-258) es 0 0
1 0
0 1
. ~ °3
-o2
-fll_
W
o2 fli 1 Oí 1 0
=
1 0 0
0 0
1 0
-o3
-02
0 1 —Oí
=
=
o3 0 0 Ol 0 1
-03 0 0
0 Ol 1
0 1 0
Y el seeundo. 0 1 0
0 0 1
—a3 —o2 W = -a3
0 1 0
0 0 1
-03 -o2 -Ol
02 Ol 1 Ol 1 0
1 0 0
0 1 0
Entonces, la ecuación (6-258) es cierta. Por lo tanto, se ha demostrado que la ecuación (6-257) también lo es. Ahora se demostrará que
CQ = [0
0
1]
es decir.
C (W N *)_1 = [0
0 1]
(6-259)
Observe que
0
fl2 fli 1] o, 1 1 0
1 0 0
c CG CG2
Por lo tanto, se ha demostrado que
[0 0 1] = C(WN*)"‘ que es la ecuación (6-259).
www.FreeLibros.me
O
1](WN*) = [0
O
0
II
[0
c CG CG2
Ubicación de polos y diseño de observadores
Capítulo ó
Ahora definamos
x = Qx
Entonces la ecuación (6-255) se convierte en
x(k
(6-260)
+ 1) = Q -1 GQx(fc) + Q - 'H u(k)
y la ecuación (6-256) en
y(k) =
C Q x(& ) +
Du(k)
(6-261)
Para el caso de n = 3, la ecuación (6-260) será: x (* + 1) =
0 1 0
0 0 1
-a3
73
-« 2 * ( * ) + -ai
72 « (* ) _7i_
donde Q ‘H
La función de transferencia pulso F(z) para el sistema definido por las ecuaciones (6-260) y (6-261) es F(z) = (C Q )(z I - Q ~ 1G Q )“ 1Q “ 1H + D Al observar que C Q = [0
se tiene F ( z ) = [0
0
0
1]
-i
z
0
a3
1] - 1
z
«2
0
-1
z + ai
73 + D 7i
Mote que D = b0. Como -i
z
0
«3
-1 0
z
a2 z + ai
-1
=
z + axz + a 2 -a3 z + a¡ z 2 + a iz z 3 + ai z 2 + a2z + a 3 1 z
- a 3z
- a 2z - «3 z2
tenemos
F ( z ) = -3
j - --------- [1
z + a¡z + a2z + a 3
__
z
z2]
+ D
y i z + y2z + y2 x--------í- Üo z + í i z + a2z + a 3
~ -----
_ b0z 3 + O í + a, b(t) z 2 + {y2 + a2b0)z + (y 3 + a 3b„) z 3 + a , z 2 + a2z + a3 -
+ b i z 2 + b2z + ¿>3 z 3 + ai z 2 + a2z + a 3
Por lo tanto, y,, = 6, - a,60, y2= b2- a2bay y2= b2- a2b0. Se ha demostrado así que
www.FreeLibros.me
Capítulo 6
Problemas de ejemplo y soluciones
489
bs — a2bo 73 72 = b2 — a2bo
Q“ ‘ H =
bi — ai bo Observe que lo que se ha deducido aquí puede extenderse fácilmente al caso en donde n es cualquier entero positivo. Problema A-6-10 Considere el sistema definido por
G(z) =
z +1 z 2 + z + 0.16
(6-262)
Refiriéndonos a la sección 6-4, obtenga las representaciones en el espacio de estados para este sistema en las tres configuraciones siguientes: 1. Forma canónica controlable 2. Forma canónica observable 3. Forma canónica diagonal Solución 1.
Forma canónica controlable. Al compararlas ecuaciones (6-262) con la ecuación (6-39), se obtie
ne
a-i = 1,
a2 = 0.16,
b0 = 0,
bi = 1,
¿>2=1
Por lo tanto, refiriéndonos a las ecuaciones (6-37) y (6-38) resulta X i(k
+ 1)
0 -0.16
x 2( k + 1)
l‘ -1
X i(k )
’o'
x 2( k )
1
u(k)
y(k) = [1 1] * i(* ) x2(k) 2. Forma canónica observable. En vista de que a, = 1, a2= 0.16, ba= 0, b, = 1y b2= 1, refiriéndonos a las ecuaciones (6-41) y (6-42), se obtiene que
x-i {k + 1) x2(k + 1)
0 -0.16 1 -1
X i(k )
u(k)
x 2{ k )
Xi (k)
# ) = [0
1] x2(k)
Forma canónica diagonal. Observemos que
G (z ) =
_1 3
^
z + 0.2
z + 0.8
Al comparar esta última ecuación con la (6-47) resulta «i/3i = i,
a2/h = - i,
Pl = -0.2, p 2 = -0.8, D =0 Por lo tanto, escogiendo arbitrariamente a¡ = a2= 1 y refiriéndonos a las ecuaciones (6-45) y (6-46), resulta 0 1 O 00
-0.2 O
Xi(k + 1) x2(k + 1)
Xi(k) x2(k)
x-i (k)
3’W = B -fl x2(k)
www.FreeLibros.me
+
1 u(k) 1
490
Ubicación de polos y diseño de observadores
Capítulo 6
Problema A-6-11
Considere el sistema con doble integrador x((* + l ) r ) = G x(kT) + H u(kT) donde G =
’l °
T 1
,
H -
' t 2I2 T
y donde T es el período de muestreo. (Vea el problema A-5-16 para la deducción de esta ecuación de estado en tiempo discreto correspondiente al sistema con un doble integrador.) Determine la matriz de ganancia de realimentación del estado K tal que la respuesta a una condición inicial arbitraria sea con oscilaciones muertas. Para el estado inicial x(0) = determine u(0) y u( 7), para T = 0.1 s, T= 1 s y T = 10 s. Solución
Definamos K = [*,
*,]
Entonces y2
-r2
Z - l + y * ,
zl - G + HKl
Tk , = z2 - | 2
~ T + — k2
z - 1 + Tk2 ■ 2 T \ T2 k x - 7*2)z + 1 + — *, - 7*2
=0
(6-263)
La ecuación característica deseada es (6-264)
z2 = 0 Por lo tanto, al comparar las ecuaciones (6-263) y (6-264) se obtiene 2 — y *, — 7*2 = 0
1 + y * , -
7*2 = 0
De las cuales resulta 3_ 2T
*2 — ^
k\ — -j i, Por lo tanto, K = ±
i . 1
T2 2 T J
A continuación se demostrará que la respuesta a las condiciones iniciales es con oscilaciones muertas. Suponga que el estado inicial es ‘*.(0 )'
a b
www.FreeLibros.me
Capítulo 6
Problemas de ejemplo y soluciones
491
La ecuación con la realimentación del estado es x((Jt + 1 )T ) = (G - HK) x( kT )
es decir, T 4
1 2
* . ( ( * + 1)70
x 2((k + 1)T)
1 T
1
T "
2
4
1 2 1 T
x¿kT) 1 _x2( k T ) 2_
Observe que * i(D
M T )_
x t(2T)
1 T
’ * . ( 0) 1 .•*2( 0)
2
1
T
2
4
1
1
4
a 1 [h 2
7\
2a + 4 - r1 - - 1bh
7\
-a + -b
x 2(2T)
1 T
r
T
k
2
Por lo tanto, es claro que la respuesta es con oscilaciones muertas. Se determinará ahora «(0) y u(T). Note que u(kT) = - K x (k T ) = -
" 1
3
T
2T
x( kT)
Por lo tanto, «(0) = -
’ 1
3 '
J 2 2T
' 1 u ( T) = - j.2
a b
T 2<1
1 2
3 " 2T
T
Para a = 1y b = 1, se tiene “ (°)
T2
_
-
27”
- l
2T
_ J_ ,b_ T 2° 2T
2
T 2 + 2T
En particular, para 7"= 0.1 s, u(0) = -115,
u ( T) = «(0.1) = 105
Para T= 1 s, u( 0) = -2.5,
u( T) = u ( l ) = 1.5
Para T= 10 s, u(0) = -0.16,
u{T) = u(10) = 0.06
Observe que para un valor pequeño del período de muestreo T, se hacen grandes n(0) y n(T). Al aumentar el valor de T se reducen en forma significativa las magnitudes de u(0) y de u(T).
www.FreeLibros.me
492
Ubicación de polos y diseño de observadores
Capítulo 6
Problema A-6-12
Considere el sistema definido por
x(k + 1) = G x(k) + Hu(fc) donde x(k) es un vector de dimensión 3. Se supone que el sistema es de estado completamente controla ble. Mediante la utilización de la técnica de ubicación de polos, se desea diseñar el sistema con polos en lazo cerrado en z = , z =¡á2y z = ¡j }, donde las ¡u, son distintas. Es decir, al usar el control con realimentación del estado
u(k) = -Kx(fc) se desea obtener \zl - G + HK| = (z - fii)(z - ¡j.2)(z - fi3) - z3 + ai z2 + a2z + a3
Demuestre que la matriz de ganancia de realimentación del estado K deseada puede darse por K = [1
1 l][6i
fc
fe] ' 1
(6-265)
i = 1,2,3
(6-266)
donde t¿ — (G — n¡l) ’ H,
Demuestre también que los vectores £, son vectores característicos de la matriz G - H K; esto es, £ satisface la ecuación (G - H K )fc = /*,«,, Solución
i = 1,2,3
Definamos G = G - HK
Al usar el teorema de Cayley-Hamilton, G satisface su propia ecuación característica:
G3+ «i G2+ a2G + 0)31 = <^>(G) = 0
(6-263
Considere las identidades siguientes: I =I
G = G - HK G2= (G - HK)2= G2- GHK - HKG G3= (G - HK)3= G3- G2HK - GHKG - HKG2 Si se multiplica cada una de las ecuaciones precedentes por a3, a2, y sumando los resultados, se obtiene
y a0(siendo a0= 1) en este orden.
a 31 + a2G + «i G2+ G3= a 31 + a2G + oaG2 + G3—a2HK
- a, GHK - a, HKG - G2HK - GHKG - HKG2 Al observar que el primer miembro de esta última ecuación es cero, esta última ecuación se puede reducir
o =
a2K + a,KG + KG2 a, K + KG K
De modo que
www.FreeLibros.me
Capítulo 6
Problemas de ejemplo y solucione
493
a2K + a ,K G + K G 2 ai K + KG = [h : g K
h : g 2h
Premultiplicando ambos miembros de esta última ecuación por [0
[0 0
1]
a2K + a, KG + K G 2 = [o o a, K + K G
i ][h
]‘ X 0
:g
g
)
1], se obtiene
h ig
2h ]_1^(g )
o bien
K = [0 0
1][H I G H i G 2H ]- 1<*>(G )
(6-268) -268)
que es la fórmula de Ackermann. Observando que <*>(G) = G3 + a i G 2 + a 2G + a 3I = (G -
m,I)(G
- M 2 l)(G - M3l)
tenemos K = [0 0
1][h : g
h
: g 2H ]- '(G - Mi I)(G - M2l)(G - Mj I)
Mediante la posmultiplicación de ambos miembros de esta última ecuación por £, = (G - Ml I)'1H, resulta K |, = [0 0 1 ][H : G H : G 2H ] ‘ (G - I ) ( G - M X G - ^ 3I) ( G = [o o
i
][h : g h : g 2h ]-' ( g - m
x g
-
m 3i ) h
(6-269)
Definamos (G - fi, I ) ( G - /i2I) = G 2 + p l2G + >3,31 (G - M ) ( G
" M sl) = G 2 + f e G + f e l
(G - /X3l)(G - M il) = G 2 + f r 2G + f r 3I
Entonces la ecuación (6-269) puede escribirse como sigue: K£, = [0 0 = [o o
1][h :G H !G 2H ]- '(G 2 + /feG + jfcO H i ][h
:g
h
: g 2h ]- , [h : g
h
fe : g 2h ] f e 1
fe =1
= [0 0 1] fe 1
Por lo tanto,
Kfe = 1 De manera similar.
Kfc = 1,
Kfc = 1
En consecuencia, K [«i
&
fc] =
[l
1
1]
es decir.
K = [l
1
1][É,
&
www.FreeLibros.me
fc ]-
(6-270)
494
Ubicación de polos y diseño de observadores
Capítulo 6
La ecuación (6-270) da la matriz de ganancia de realimentación del estado K deseada en términos de 6y Para demostrar que los £ son vectores característicos de la matriz G - HK, note que (G - H K)& = (G - H K )(G - /*,I)_1H = (G -
a lI
+ M il - H K )(G -
= (G - M ) (G -
+ (/u, I - H K )(G -
= H + ( m iI - H K )Í = H - HK& + /¿i i
(6-271)
Como ya se ha demostrado anteriormente, K&
= 1,
¡'
=1,2,3
Por lo tanto, la ecuación (6-271) se puede simplificar a la forma (G - H K )6 = /i¡fe, ¡ = 1,2,3 Por lo tanto, los vectores £, y son vectores característicos de la matriz G - H K correspondiente a los valores característicos /q, ¡á2 y /a3, respectivamente. Problema A-6-13 Considere el sistema definido por
x{k + 1) = Gx(ifc) + Hü(fc) donde x(k) es un vector de dimensión 3. Se supone que el sistema es de estado completamente controla ble y que se desea respuesta con oscilaciones muertas al estado inicial x(0). (Es decir, los polos en lazo cerrado deseados deberán estar en el origen de modo que =/j2= = 0.) Demuestre que la matriz de ganancia de realimentación del estado K deseada puede darse median te la fórmula K = [10 0]K, fc fc]-1 (6-272) donde
^ & = G _2H & = G 3H
Demuestre también que los vectores £, son vectores característicos generalizados de la matriz G - HK: esto es, que £ satisface las ecuaciones (G - H K )|i = 0 (G - HK)i¡2 = £, (G - HK)£3 = & Solución
Refiriéndonos a la ecuación (6-268), tenemos k
= [o o
i ][h
: g h : g 2h ]-'< k g )
donde * (G ) = G3 Por lo tanto. K = [0
0
1][h : g H .: G 2H ] - ‘ G 3
www.FreeLibros.me
(6-273)
Capítulo 6
Problemas de ejemplo y soluciones
495
Posmultiplicando ambos miembros de la ecuación (6-273) por K | i = [0
0
= G 1H, se obtiene
1 ][H : G H : G 2H ]_1 G 3G -1 H
= [o o
i ][ h
:g
h
: g 2h ]-1g 2h
= [o o
i ][ h
:g
h
: g 2h ]-1[h : g
= [0 o
1]
h
: g 2h ]
=1
Así que Kfe = 1 Posmultiplicando ambos miembros de la ecuación (6-273) por fe = G“2H. resulta Kfe = [o
o
i] [ h : g h : g 2h ]- 'g 3g-2h
= [0 0
1 ][H :G H :G 2H ]_1GH
= [0 0
1][H i G H G 2H ]“ ' [H ! G H : G2H]
=0
Por lo tanto, Kfe = 0 De igual manera, si se posmultiplican ambos miembros de la ecuación (6-273) por fe = G~’ H. se obtiene Kfc = [o
o
i] [ h : g h : g 2h ] '1g 3g-3h
= [0 0
1 ][H :G H :G 2H ]_1H
= [0 0
1][H : GH G2H ] 1[H i GH i G2H]
=0
De manera que. Kfc = 0 En consecuencia se tiene que K [fc
fe
fc] =
[l
0
0]
En consecuencia. K = [1
0 0][€,
&
fe ]'1
que es la ecuación (6-272). Para demostrar que £, es un vector característico de la matriz G - HK. observe que (G - HK)fe = (G - H K )G _1 H = H - H K G 1H = H - HKfe En vista de que K f , = 1, se obtiene
(G - HK)fe = 0
www.FreeLibros.me
496
Ubicación de polos y diseño de observadores
Capítulo 6
Para demostrar que fe =G 2H es un vector característico generalizado de la matriz G - HK, observe que (G - H K)fe = (G - H K )G “ 2H = G 'H - HKG~2H = fe - HKfe Como Kfe = 0, se obtiene (G - H K)fe = fe Similarmente, para demostrar que fe = G"3H es un vector característico generalizado de la matriz G HK, observe que (G - HK)fe = (G - H K )G “ 3H = G '2H - H K G _3H = fe - HKfe Y en vista de que Kfe = 0, se obtiene (G - H K)fe = fe Problema A-6-14 Considere el sistema definido por x ( k + 1) = G x(k) y ( k ) = Cx(k) donde x(k) es un vector de dimensión 3 y y(k) es un escalar. Se supone que el sistema es completamente observable. Se desea determinar la matriz de ganancia de realimentación del observador Ke para un observador de predicción de orden completo, tal que la dinámica de error tenga raíces características en z = //|,z = /í2yz = ft.Es decir |zl - G + K „ C|
= (z - pti)(z - tí2){z ~ Ms) = z3+ a 3z2 + a2z + a 3
Suponga que losvalores característicos de G son A,,A2y A3y que son distintos de /j¡, ¡jl2y /xy También suponga que /q, //2y /q son distintos. Demuestre que la matriz Ke puede estar dada por K„ =
f, f2 f3
-i
1 1 1
donde f, = C ( G - / U r \
í = 1 , 2,3
Demuestre también que las f," son vectores característicos de la matriz (G - K eC )*; esto es, f,' satisface la ecuación (G - K .C )* ff
1 = 1,2,3
donde ¡ü, es el complejo conjugado de //,. (Observe que cualquiera de los valores característicos comple jos se presentan en pares conjugados.) Solución Refiriéndonos a la fórmula de Ackermann, tal como se dio mediante la ecuación (6-126) para la matriz de ganancia de realimentación del observador K e, se tiene C K e =
-i
0 0 1
A l observar que
<(>(G) = G3 + a 3G2 + a2G + a3I = (G -
www.FreeLibros.me
pr,I)(G
- m.2I)(G - pt3I)
Capítulo 6
Problemas de ejemplo y soluciones
497
se tiene
C K , = (G — m. I ) ( G - M 2 I ) ( G - M3I) CG CG2 Premultiplicando ambos miembros de esta última ecuación f, = C(G -
fiK , =
C(G - /x2I)(G -
n ,I)
c CG CG2
-1
-1
0 0 1
(6-274)
I ) ” 1resulta 0 0
(6-275)
1
Definamos (G — fj.i I ) ( G
—/X2 I ) = G 2 + P 12 G + 0i31
(G - /*2I ) ( G
- /i3I ) = G 2 + 022 G + 023 I
(G — fl3 I ) ( G
—/Lll I ) = G 2 + 032 G + 033 I
Entonces la ecuación (6-275) se convierte en flK ,
= C(G2 +
-
[023
022
022
G +
1]
Por lo tanto,
C CG CG2
023 I )
C CG CG2
C CG CG2
-1
-1
0 0
1 0 0 1
f, K t = 1
Similarmente se obtiene f2K , = 1,
f3K , = 1
Y así,
1f. Í2 K f = Í3 f! K, =
U f3
-i
1 1 1 -1
1 1 1
(6-276)
La ecuación (6-276) da la matriz deseada K t en función de f h f2 y f3, donde (G - K e C ) * f * = C * - C * + /i, f* = 7Z, f ,*
Para demostrar que las f,‘ son vectores característicos de la matriz (G - K,, C)*, note que (G - K , C )* f * = (G - K , C ) * [ C ( G - fjL¡ I ) -1]* = (G * - C * K * ) ( G * - 7Z, I ) “ 'C * = (G * - p , I + 71,1 - C * K ,* )(G * - T Z iir 'C * = C * + (7x,I - C * K ? ) f *
= c * - c * k * f r + m, tr
www.FreeLibros.me
(6-277)
498
Ubicación de polos y diseño de observadores
Capítulo ó
Como se ha demostrado antes, f,K e = 1
En consecuencia, k * tr = i Por lo tanto la ecuación (6-277) se convierte en (g - K ec)*f* = c * - c * + -¡¿¡ir = 71, tr Así que se ha demostrado que los vectores f f, f 2 y f 3" son vectores característicos de la matriz (G - K e C)* correspondientes a los valores característicos /r2y respectivamente. Problema A-6-15 En el problema A-6-14 se obtuvo la matriz de ganancia de realimentación del observador K t, para el caso en que los valores característicos ¡uu fi2y fi¡ de G - K eC fueran distintos. Supongamos que deseamos una respuesta con oscilaciones muertas para el vector de error. Entonces requerimos que //, = fi2 = = 0. Demuestre que para este caso la matriz Ke puede darse como sigue:
Í! = C G '1,
f.
II
fl
0 0 1
tt
donde
-1
O
U K , = Í2
-l
f2 f3
f2 = C G '2,
i 0 0
f3 = C G '3
[Note que los vectores fb f2y f3 dados aquí son los vectores característicos o vectores característicos generalizados de la matriz (G - K eC)*.] El sistema se supone completamente observable. Solución
Refiriéndonos a la ecuación (6-274), K , = (G -
C - /*2I)(G - m s I) CG CG2
-1
0 0 1
Al tomar fj¡ = //2=/j3= 0 y sustituir de acuerdo con esta última ecuación, se obtiene -i C 0 K „ = G3 CG 0 CG2 1 L J L J que se puede escribir como sigue: -1 C G '3 0 0 f3 = C G '2 0 0 = f2 C G '1 1 1 fl
(6-278)
La ecuación (6-278) da la matriz de ganancia de realimentación del observador K t deseada cuando = ^ 3 = 0. Observe que la ecuación (6-278) puede ser modificada para leerse C G '3 0 C G '2 K e = 0 1 C .G '1
www.FreeLibros.me
= fj-
Capítulo 6
Problemas de ejemplo y soluciones
499
que es equivalente a las siguientes tres ecuaciones:
CG'3K , CG
= f3K , = 0
2K , = f2K , = 0
CG-1 K ,
= ft K , = 1
Por lo tanto se obtiene que fi K f
f
hKe
t2 K , = U
f3K ,
1 0 0
es decir, K, =
f. f2 f3
-i
1 0 0
que también da la matriz de ganancia de realimentación deseada, cuando //¡ =
= 0.
Problema A-6-16 Considere el sistema
x(k + 1) = Gx(k) + Hu(k) donde
G=
0 -0.16
1 , -1
H -
’o
1
Suponga que se utiliza el siguiente esquema de control: u = -Kx
Utilizando MATLAB, determine la matriz de ganancia de realimentación del estado K, de modo que el sistema tenga polos en lazo cerrado en z = 0.5 + j 0.5,
z = 0.5 - yO.5
Utilice la fórmula de Ackermann dada por la ecuación (6-68). Solución Primero construimos la matriz J, cuyos valores característicos son los polos en lazo cerrado deseados. J =
0.5 + yo.5 0
o 0.5 - ;0.5
El comando poly(I) da el polinomio característico para J.
p = poly(J) P=
1.0000
-1.0000
0.5000
Esta es la expresión MATLAB correspondiente al polinomio característico para J. p o ly (J) = 0 ( J ) = J 2 - J + 0.51
www.FreeLibros.me
500
Ub ¡cación de polos y diseño de o b serva d o res
C a p ítu lo 6
donde 1 es la matriz de identidad. Para la matriz 0 0.16
G =
1 -1
el comando polyvalm (poly (J), G) evalúa la d>(G) siguiente: -1 0.84
0.16 0.16
4>(G) = G2 - G + 0.51 =
0.34 0.32
0 -0.16
1 -1
+
0.5 0
0 0.5
-2 2.34
Vea la salida de MATLAB que sigue: polyvalm (poly(J),G ) ans 0 .2 4 0 0 0 .3 2 0 0
-- 2 .0 0 0 0 2 .3 4 0 0
Refiriéndonos a la fórmula de Ackermann, dada por la ecuación (6-68), la matriz K deseada se obtiene a partir de K = [0 = [0
1][H
G H ]-1 <¿>(G)
1]M“ ^ (G )
donde M = (H GH). Un programa MATLAB para la determinación de la matriz de ganancia de realimentación de estado K se da en el programa 6-4 de MATLAB. M ATLAB Programa 6-4 %
Colocación de polo en el plano z ----
% *****Este programa determina el estado de la matriz de ganancia de % realimentación K, basado en la fórmula de Akermann ***** % Anote la matriz de estado C la de control H ***** G = [0 1;-0.16 H = [0;1 ];
-i];
% *****Anote la matriz de controlabilidad M y % compruebe su rango***** M = [H rank(M)
G*H];
ans = 2 % *****C om o el rango de la matriz de controlabilidad es 2,
www.FreeLibros.me
Capítulo 6
Problemas de ejemplo y soluciones
501
% es posible colocar un polo arbitrario***** % ***** Anote el polo característico deseado definiendo % la siguiente matriz J y calcular poly(J)***** ) = [0.5+0.5’ i
0;0
0.5-0.5*¡]
J) = poly(J)
II = 1.0000
-1.0000
0.5000
% ***** A note el polinom io característico Phi***** Phi = polyvalm {poly(J),G); % *****E| estado de la matriz de ganancia de realimentación lo da****** K = [0
1]*inv(M )*Phi
K= 0.3400
-2.0000
k l = K(1), k2 = K(2) kl = 0.3400
k2 =
-2
Problema A-6-17 Considere el sistema
x(k + 1) = G x(k) + Hu(k) y(k) = Cx(k) donde x(A') = vector de estado (de dimensión 3)
u(k) = señal de control (escalar) y(k) = señal de salida (escalar) y
G =
0 0 -0.5
1 0 -0.2
0 1 , 1.1
0 H = 0 1
www.FreeLibros.me
502
Ubicación de polos y diseño de observadores
Capítulo ó
1. Determine la matriz de ganancia de realimentación del estado K, tal que el sistema muestre respuesta con oscilaciones muertas a cualquier estado inicial. Suponiendo que el estado es completamen te medible, de modo que el estado real \(k) puede realimentarse para control, es decir,
u(k) = - K x(k) determine la respuesta del sistema al estado inicial
* ( 0) = siendo a, b y c constantes arbitrarias. 2. Al suponer que sólo una porción del vector de estado es medible, es decir, solamente lo es la salida y(k), diseñe el observador de orden mínimo tal que la respuesta de error del observador sea con oscilaciones muertas. Suponga que la configuración del sistema es la misma que la que se muestra en la figura 6-11. 3. Considerando que el estado observado se utiliza para realimentación, obtenga la respuesta del sistema a
r
a b , c
-|
1 Xa a
é(0) =
1
x(0)
donde é(0) es el error de observador inicial para el observador de orden mínimo, y a, b, c, a y ¡3 son constantes arbitrarias. 4. Deduzca la función de transferencia de pulso Gn(z) del regulador-observador.
Solución
Observe que el sistema es de estado completamente controlable y observable.
1. La matriz de ganancia de realimentación de estado K requerida para respuesta con oscilacio muertas se puede obtener ^Ornente como sigue. Definamos K = [fcl
k2 k3]
Entonces
|zl - G + HK| =
z O ki + 0.5
-1 z k2 + 0.2
O -1 z + k2 — 1.1
= z3 + (¿ 3 - l.l)z 2 + {k2 + 0.2)z + A, + 0.5 = 0 Al igualar esta ecuación característica a la ecuación característica deseada (para una respuesta con osci laciones muertas),
z3 = 0 obtenemos
K = [A:,
k2 k3] = [-0.5
-0.2
1.1]
Con esta matriz K, la ecuación de sistema se convierte en
\ ( k + 1) = Gx(A) + Hu(k) = (G - HK)x(A) es decir,
Xi(A + 1) 0 1 0 x,(k) x2(k + 1) = 0 0 1 x2(k) x2(k + 1) 0 0 0 x3(k)
www.FreeLibros.me
Capítulo 6
Problemas de ejemplo y soluciones
503
La respuesta de este sistema a un estado inicial arbitrario se convierte en: 0 1 0 * l(l) *2(1) = 0 0 1 0 0 0 * 3(1)_
a Y b = c c 0
c ’ o 1 o" y '* i(2 )‘ *2(2) = 0 0 1 c = 0 0 0 0 0 0 * 3 (2 ) ’o 1 0 *i(3) *2(3) = 0 0 1 0 0 0 * 3(3)_ o sea
x(fe) = 0,
’ o’ 0 = 0 0 0 c
fe = 3 ,4 ,5 ,...
Claramente, la respuesta es con oscilaciones muertas. 2. Ahora diseñaremos un observador de orden mínimo, suponiendo que solamente la saliday( es medible. Primero transformaremos el vector de estado x(k) a un nuevo vector de estado £{k), tal que la matriz de salida C se transforme de [0 1 0] a [1 0 0], La matriz siguiente T llevará a cabo la transformación requerida: T =
0 1 0 1 0 o 0 0 1
Entonces definimos x(fe) = T|(fe) De manera que las ecuaciones de sistema serán |(fe + 1) = T - 'G T g (fe ) + T - ’ H «(fe) = Gg(fe) + Híi(fe)
y{k) = C i m = C|(fe) donde
0 1 0 1 0 o 0 0 1
G = T ‘ GT =
0 1 -0.2
1 0 -0.2
0 o -0.5
II
X
7 H
0 1 0 1 0 0 0 0 1
0 0 1
1 o 1.1
Gaa G ba
0 1 0] 1 0 El sistema transformado está dado por lo tanto por =
0 1 0 1 T ‘T 0 ’o -0.2 1 -0.5 1.1
y ( k ) = [ 1 :0
0]
0 1 0 1 0 0 0 Jai
Jbb
0 0 1
C = CT = [0
6 (* + 1) 6 (* T Í) 6 (* + 1)
0 1 1.1
= [1 0
Uk) W ) Uk)
W ) W ) m
www.FreeLibros.me
0]
0
+ 0 «(fe)
(6-279)
1 (6-280)
50 4
Ubicación de polos y diseño de observadores
Capítulo 6
En vista de que sólo se puede medir una variable de estado. (k). es necesario que se observen dos variables de estado. Por lo tanto, el orden del observador de orden mínimo es 2. Debido a que
K , G ab —
0 1.1
0 -0.5
-
1 1 «J u 1
l
G/,b
[0
1] =
0 -0.5
- k e¡ 1.1 - ke2
la ecuación característica del observador se convierte en
Izl — Gbb + K , G„
z 0.5
ke¡
z 2 + ( kt2 - l.l)z - 0.5&,.,
z - 1.1 + ke]
La ecuación característica deseada (para respuesta con oscilaciones muertas) es
z2 = 0 Por lo tanto.
ke, = 0,
ktl =1.1
es decir.
0 1.1
K, 3.
La ecuación para el sistema con realimentación de estado, con un observador de orden mínim
corresponde a la (6-163):
G-HKi HKT 0 ¡ Gbb - K, G ab
~x(k + 1)' e(k + 1)
A (*).
(6-281)
e(k)
Volvamos a escribir la ecuación (6-281) en función del nuevo vector de estado £) y del vector de error e(k). Al notar que el estado observado es el utilizado para la realimentación, esto es,
u(k) = - K ¿ (* ) tenemos que
S(* + 1) = G$(k) + Hu(fc) = G S(k) - Ü U ( k ) = (G - H K )« * ) + H K [g(k) - & * )] = (G - HK)|(Jfc) + HKré(Jk) donde
0 0 r= i 0 0 1 K = K T = [-0.5
-0.2
0 1 0 1.1] 1 0 0 í.i] 0 0 1
= [-0.2
-0.5
Por lo tanto, se puede modificar la ecuación (6-281) para quedar
" f í k- t A i é(k + 1).
G - HK ! 0
H kr
¡ Gbb ~~
www.FreeLibros.me
G ab
e(k)_
1.1]
Capítulo 6
Problemas de ejemplo y soluciones
505
es decir,
6 (* Uk 6 (* é, (k éi(k
+ 1) + 1) =
+ 1) + 1) + 1)
0 1 0 0 0
0 0 0 0 0
1 0 0 0 0
0 0 -0.5 0 -0.5
0 0 1.1 0 0
& (* )
m 6« 6 (* ) é2{k)
La respuesta de este sistema a la condición inicial dada puede obtenerse como sigue. Primero observe que la condición inicial supuesta es
a *i(0) b *2(0) *3(0) = c a é.(0) é2(0) A Por lo tanto,
r 6 (o)i 6(0) 6(0) 6(0) é2(0)_ 6(2) 6(2) 6(2) 6(2)
b a
=
c
[6 0 ) 6(1) 6(1) 6(1) .6(1).
»
a
A -0 .5 a + 1.1/3
M 2\
.
-0.55a 0 0
0 6(4) —0.55a 6(4) 0 6(4) = t 0 6(4) 0 6(4)
=
6(3) 6(3)
c
=
c
b — 0.5a + 1.1/3 0 -0.5a
y
.
—
6(3) = 6(3)
.6P).
.
6(5)
6(5) 6(5) 6(5) 6(5)
=
-0.55a 0.5a + 1.1/3 0 0 0
0 0 0 0 0
Es claro que la respuesta es con oscilaciones muertas. Para cualquier condición inicial, el tiempo de asentamiento es como máximo de cinco períodos de muestreo. (Esto significa que como máximo se necesitan dos períodos para que el vector de error se convierta en cero y, además, como máximo son necesarios tres períodos de muestreo para que el vector de estado se anule.) 4. Para deducir la función de transferencia de pulso Gc(z) del regulador-observador, nos refe mos a la ecuación de estado y a la ecuación de salida que se da en las ecuaciones (6-279) y (6-280), respectivamente. Las ecuaciones para el observador de orden mínimo son las (6-148) y (6-149), escritas de la forma siguiente:
h>(k) - K ty (k ) = tj(fc) ñ(k
+
1) = (G„„ - K,G„f,)ij(A:) + [(G*í, - K ,G „*)K , + Gia - K „ G ^ M * ) + (Hh - K , Ha)u{k)
Para este problema,
www.FreeLibros.me
(6' 282)
506
Ubicación de polos y diseño de observadores
~ K eG ab '■
Gbb
0 0 -0.5 0 1 0.2
-
Hí, - K eHa ■ Por lo tanto, la ecuación (6-282) se convierte en
W
0 0 tj (* ) + -0.5 0
+ 1) :
1 0.2
-
y(k) +
u(k)
Y(z) +
U(z)
Si se toma la transformada z de esta última ecuación resulta
zí|(z) =
0 -0.5
0 ij(z ) + 0
1 -
0.2
es decir,
z 0.5
0 z v (z )
1 -
U{z)
Y (z) +
0.2
Al resolver en función de r¡(z), se obtiene
_
1
z
íl(2 ) =
0.5 z2
0.2 z
Y (z) +
0 1 U{z) z
La ecuación (6-148) será entonces
0
!* (* ) =
1.1
Y(z) + -n(z) 1
’o" Y (z) +
i . i - z4 - ^z
1 U{z) z
La señal de control u(k) está dada por
«(A:) = -KÍ(Ar) = -[-0.2 = 0.2y(k) - [-0.5
-0.5
l.l]g (Jt)
1.1]íb(k)
La transformada z de esta última ecuación se convierte así en
1
U(z) = 0.2Y(z) - [-0.5
1.1]
1.1
[-0.5
1.1]
0.2
Y(z)
U(z)
0.2 + — - l . l í 1.1 -
z
0.5
\
z
- —
www.FreeLibros.me
z
Y (z )- 1 - ^ U (z )
Capítulo ó
Capítulo 6
Problemas de ejemplo y soluciones
507
es decir,
i + ^ j u (z) = ( - í . o i + ^
+ ^ jy (z )
de lo cual se obtiene la función de transferencia pulso G„(z) del regulador-observador como sigue: U( z) _ 1.01z2 - 0.72z - 0.55
G d (z ) =
y (z )
(6-283)
z2 + í . i z
La función de transferencia pulso de la planta puede obtenerse mediante la ecuación (5-60) como sigue: Gp(z) =
Y(z)
= C (z l - G ) - 'H = C ( z l - G ) ' H
z3 - l . l z 2 + 0.2z + 0.5
En la figura 6-23 se muestra un diagrama de bloques del sistema regulador diseñado.
Figura 6-23
Diagrama de bloques del sistema regulador diseñado en el problema A-6-17.
Problema A-6-18 Considere el sistema de seguimiento definido por la ecuación (6-185). La ecuación característica para este sistema es Zln +m
G K 2 - K 2G - K i C G
H 1 =0 I m - K 2H - K i C H j
(6-284)
Al volver a escribir la ecuación (6-284) se obtiene z l„ - G i -H - K T + K 2G + 'K ,'C G ] z l m - I m + K 2H + K , C H i„ lo " z l „ - G + H (K 2 + K ,C )I -h ] [ ln 0 1 L - ( K 2 + K . C ) j \ mJ 1 z l„ — I_ K, C K 2 + K ,C | l m z l„ — G + H ( K 2 + K , C ) ¡ -H KiC ¡ 2 lm Im z l„ - G + H K 2 + H K , C + H K , C ( z lm - I - T 1 1 ®
' Sí 1 1i
.
www.FreeLibros.me
.
-H lm
508
Ubicación de polos y diseño de observadores
Capítulo 6
I* j 0 k rc (z í„, - í j - 1 \ \ m z_I_„_- G + H K 2 + H K i _ C + H K, C (z l„, r I* ,)” ' !
-H
= z l„ - G + H K 2 + H K, C + H K, C ( z l m - I m)- ‘| |zlm - I m| = 0
(6-285)
La ecuación (6-285) da la ecuación característica correspondiente al sistema. Se pueden determinar las matrices K, y K 2de forma tal que las raíces de esta ecuación característica asuman los valores deseados. Por ejemplo, si se desea una respuesta con oscilaciones muertas a una entrada escalón, entonces determi naremos K, y K 2de modo que todas las raíces de la ecuación característica estén en el origen. [Cuando el vector de control u(k) es de dimensión m (siendo m > 1), las matrices K, y K 2no son únicas. Es decir, se puede obtener más de un conjunto de K, y K 2], Refiriéndonos al problema de diseño del sistema de seguimiento analizado en el ejemplo 6-13, considere primero el problema de determinar una constante de ganancia integral Áj y una matriz de ga nancia de realimentación del estado K 2, utilizando la ecuación característica dada por la ecuación (6284), o la ecuación (6-285), tal que la respuesta escalón unitario sea con oscilaciones muertas. A conti nuación considere diseñar un observador de predicción de orden completo (tercer orden), tal que la respuesta al error de observador sea con oscilaciones muertas. Si se define la matriz de ganancia de realimentación del observador como K e, determine esta matriz igualando los coeficientes de las poten cias iguales de z de [zl - G + K ,C | = O
y los de las potencias similares de z de la ecuación característica deseada, que es z3 = O
Solución
Definamos K 2 — [fc,
k-¿ fc3]
Al observar que 0 0 -0.12
1 0 -0.01
0 1 , 1
0 H = 0 1
C = [0.5
1 0]
la ecuación (6-285) se puede escribir como sigue: |zl3 - G + H K 2 + HA-, C + HA-, C(z/, - Z,)-'! |z/, - 7,| 3 - G + H K 2 + HA, C[1 + (z - 1)-*]\\z -11 1 0 H »— O 0 1
i
[AT,][0.5
1 0] 1 +
0 ’o’ 1 + 0 [ki 1
z- 1
k-H
-i z 0.12 +
+ °-5- 1/ z —1
k2 k3
1
0 0 es o 1
z 0 0 0 z 0 0 0 z
0.01 + k2 +
0 -1 z - 1
|z-l|
z — 1 + k3
z 0
0 -1
(0.12 + k x)(z - 1) + 0.5K, z
(0.01 + k2){z - 1) + K, z
www.FreeLibros.me
(z - l ) 2 + k 3(z - 1)
Capítulo 6
Problemas de ejemplo y soluciones
509
= z4 + (-2 + k3)z3 + (1.01 + k2 - ki + K,)z2 + (0.11 + k, - k2 + 0.5Kt)z - 0.12 - k, = 0 Esta ecuación característica debe ser igual a
z4 = 0 Por lo tanto, requerimos que
-2 + k, = 0 1.01
+ k2 - ki + Kx = 0
0.11 + k, - k2 + 0.5K, = 0 -0.12 - k, = 0 de los cuales se obtiene
K , = i,
ki = -0.12,
k, = 2
es decir.
/f, = f,
K = [-0.12
0.3233 2]
[Es evidente que estos valores concuerdan con los proporcionados por las ecuaciones (6-199) y (6-200). A continuación, diseñaremos un observador de predicción de orden completo. Definamos
K, = Entonces
kri k ' 2 [0.5 1 0] k<,
K,C -
0 .12
-
0.01
1
-0.5*,, 1 - k €, -0.5&,, -0.12 - 0.5/t,3 -0.01 - k t3 1
y se tiene que
z + 0.5k ' t -1 + ke¡ 0.5fc«.2 z + k<2 0.12 + 0.5A:,3 0.01 + ke,
|zl - G + K„C |
=
z3 +(-1
0 -1 z —1
+ 0.5&,,,+ k ' 2)z2 + (0.01 - 0.5*,, - 0.5Jt,2 + kc,)z
+ 0.12 - 0.115fc„ - 0.5fc,2 + 0.5fe,3 = 0 Esta ecuación característica debe ser igual a la ecuación característica deseada
z3 = 0 Por lo tanto,
—1 + 0.5kf¡ + kt2 = 0 0.01 - 0.5*,, - 0.5kt2 + ke, = 0 0.12 - 0.115^, - 0.5ke2 + 0.5^3 = 0
www.FreeLibros.me
510
Ubicación de polos y diseño de observadores
Capítulo 6
A i resolver estas tres ecuaciones simultáneas en función de k n , kn y k ei, se obtiene
0.5192 ke\ K e = k'2 = 0.7404 0.6198 kg3 Esta expresión da la matriz de ganancia de realimentación deseada K e. Recuerde que el diseño de la constante de ganancia integral Kt y la matriz de ganancia de realímentación del estado K 2(un problema de ubicación de polos), y el diseño de la matriz análoga del observador K e (un problema de observador) son problemas independientes. Esto es, la matriz K c no depende de Kx ni de K2, y viceversa.
PROBLEMAS Problema B-6-1 Considere el sistema definido por X, {k + 1) x2(k + 1)
a c
x, (k) x2(k )
b d
+ ’ l" u (k ) 1
xi(k)
>(*) = [!
0] x2(k )
Determine las condiciones en a, b, c y d para la controlabilidad completa y observabilidad completa del estado. Problema B-6-2 El sistema de control definido Dor xx{k + 1) x2(k + 1)
0 0.16
l" -1 x2(k)
1 u(k ) 0.5
1 -1
xi(0) * 2( 0 )
es de estado completamente controlable. Determine una secuencia de señales de control u(0) y u( 1) tales que el estado x(2) sea -1 2
*i(2) x 2(2)
Problema B-6-3 Considere el sistema Xt(k + 1) x2(k + 1)
’*i(0)" .*2(0)
0 -
0.16
1 -1
x,(k) x2(k)
1
-1
Determine la posibilidad de llevar el estado ¡ 1.
*i(2) .*2(2)
0 -0.008
www.FreeLibros.me
+
1 u{k) -0.8
Capítulo 6
Problemas
2.
* i(2 )
-1
2( 2 )
2
x
Problema B-6-4
Considere el sistema *i(fc + 1) x 2(k + 1) Xi{k + 1)
0 0
a
1 0
0 1
b
a b
x\(k) x 2(k) x Á k)
+
0 1 u(k) 0
Partiendo del estado inicial x(0)
determine si el estado x(3) puede ser llevado o no al origen. También determine si puede ser llevado o no al valor x(3) =
si el estado inicial es x(0) = 0. Problema B-6-5
Para el sistema definido por Xi(A: + 1) x 2(k + 1)
0 -0.16
l" * , ( * ) -1 _ILA2 x 2(k) wj
’o’ u( k) |_1 aj
y m - [1 0] suponga que se observan las siguientes salidas: y { 0) = 1,
y (l) = 2
Las señales de control dadas son u(0) = 2,
«(1) = -1
Determine el estado inicial x(0). También determine los estados x (l) y x(2). Problema B-6-6
Demuestre que el sistema x( k + 1) = G [x(& ) + C*m(&)] y { k ) = Cx(fc) donde x(A) = vector de estado (de dimensión 4)
u(k) = señal de control (escalar) y{k) = señal de salida (escalar)
www.FreeLibros.me
Ubicación de polos y diseño de observadores
512
0 1 0 0 0 0 1 0 G = 0 0 0 1 1 0 0 0
Capítulo 6
C = [1 0 0 0]
es de estado completamente controlable y completamente observable. Demuestre también que, dado cualquier estado inicial x(0), todo vector de estado podrá ser lleva do al origen en a lo máximo cuatro períodos de muestreo, si y sólo si la señal de control está dada por
u(k) = -Cx(rfc) Problema B-6-7
Considere el sistema de control en tiempo continuo 0 -25
Xl x2
y = [3
l" Xl + 'o ' 1 -6 x2
1]
Este sistema es de estado completamente controlable y completamente observable. Observe que los valores característicos de la matriz de estado son Aj = —3 + ;4,
A2 = -3 —/4
Por lo tanto, este sistema involucra polos complejos. Como se indicó en la sección 6-3, un sistema que es de estado completamente controlable > completamente observable, en ausencia de muestreo se conserva en tales condiciones después del muestreo. si y sólo si, para todo valor característico de la matriz de estado (raíz de la ecuación característica). Re A, = Re Ay implica que Im (A¿ - Ay)
2nn
donde T es el período de muestreo yn = ±l, ±2, . . . . Considere la versión discretizada de este sistema. Demuestre que para este sistema, si el período de muestreo T= rru/4 (siendo n= 1, 2, 3, . . .), entonces el sistema discretizado es no controlable y no observable. Problema B-6-8
Considere el sistema de transferencia pulso
G(z)
(1 + 0.5z-1)( l - 0.5z_1)
Refiriéndonos a la sección 6-4, obtenga la representación en el espacio de estados del sistema de siguientes formas: 1.
Forma canónica controlable
2.
Forma canónica observable
3.
Forma canónica diagonal
www.FreeLibros.me
Capítulo 6
Problemas
513
Problema B-6-9
Considere el sistema de función de transferencia pulso 1 + 0.8z“ l G^
1 - z“ ‘ + 0.5z~2
Obtenga la representación en el espacio de estados del sistema en las formas siguientes: 1.
Forma canónica controlable
2.
Forma canónica observable
3.
Forma canónica diagonal
Problema B-6-10
Considere el sistema siguiente que se da en la forma canónica controlable: xi(k + 1) x2{k + 1) x3(k + 1)
=
0 0 í?3
1 0
0 1
(¡2 ~~ü\
xi(k) x2(k) x3(k )
u(k)
+
x¡(k) y ( k ) — [b3 — a3bo : ¿2 ~ o2bo : b¡ — ü¡ £>o] x2(k)
+ b0u(k)
x3{k) Se desea transformar las ecuaciones del sistema a dicha forma canónica observable, mediante la transfor mación del vector de estado: x = Qx
Determine una matriz de transformación Q de la forma canónica deseada. Problema B-6-11
Considere el sistema de doble integrador x((A: + 1)T) = G x(kT) +
Hu(kT)
donde G =
1 T 0 1
H
r 2/2
T
y T es el período de muestreo. (Vea el problema A-5-16 para la deducción de esta ecuación de estado en tiempo discreto en relación con el sistema de doble integrador.) Se desea que los polos en lazo cerrado queden localizados en z = /v, y z = /j2. Suponiendo que se utiliza el control de realimentación de estado
u(kT) = -Kx(kT) determine la matriz K de ganancia de realimentación del estado. Problema B-6-12
Considere el sistema definido por
x 3(k + 1) 0 1 0 *1 (k) x2(k + 1) = 0 0 1 x2(k) x3(k + 1) -0.16 0.84 0 x3(k)
www.FreeLibros.me
1
+ 1 u (k) 1
514
Ubicación de polos y diseño de observadores
Capítulo 6
Determine la matriz de ganancia de realimentación del estado, K, tal que cuando la señal de control esté dada por u(k) = - K x (& ) el sistema en lazo cerrado mostrará una respuesta con oscilaciones muertas a cualquier estado inicial *(0). Problema B-6-13
Considere el sistema \ (k + 1) = Gx(/c) + y ( k ) = C x (* ) donde
x(k) = vector de estado (de dimensión 2) u(k) = señal de control (escalar) y(k) = señal de salida (escalar) y G =
0 -0.16
H
C = [l
1]
Diseñe un observador actual para el sistema. Se desea que la respuesta al error del observador inicial sea con oscilaciones muertas. Problema B-6-14
Considere el sistema x(k + 1) = Gx(fc) + Hw(fc) y ( k ) = Cx( k) donde
x(k) = vector de estado (de dimensión 3) u(k) = señal de control (escalar) y(k) = señal de salida (escalar)
G =
0 0 1 0 0 1
-0.25 0 0.5
1 H = 0
C = [1
0
0]
1
Si se supone que es medible la salida_y(&), diseñe un observador de orden mínimo, tal que la respuesta al error de observador inicial sea con oscilaciones muertas. Problema B-6-15
Considere el sistema definido por
Xi{k + 1) x2(k + 1)
0 0.16
l ' Xl(fc) -1 x2(k)
'o ' u(k) 1
Utilizando MATLAB, determine la matriz K de ganancia de realimentación de estado, tal que cuando la señal de control esté dada por
www.FreeLibros.me
Capítulo 6
Problemas
515 u(k) = -Kx(k)
el sistema en lazo cerrado (sistema de regulación) muestra respuesta con oscilaciones muertas a un estado inicial x(0). Escriba un programa MATLAB para la determinación de la matriz de ganancia de realimentación del estado. K. Problema B-6-16
Considere el sistema definido por
x{k + 1) = Gx(fc) + Hw(fc) y(k) = C x(k) donde G =
0 -0.16 1 -1
H
[0
1]
Mediante MATLAB. determine la matriz de ganancia de realimentación de observador. K,„ tal que los valores característicos deseados para la matriz de observador sean
ix, = 0.5 + /0.5,
fx2 = 0.5 - /0.5
Suponga que la configuración del sistema sea idéntica a la mostrada en la figura 6-8. Escriba un progra ma MATLAB utilizando la fórmula de Ackermann. Problema B-6-17
La figura 6-24 muestra un sistema de seguimiento, donde el controlador inicial tiene un tiempo de retardo de un período de muestreo. (Compare este sistema con el sistema de seguimiento ilustrado en la figura 6-18.)
r
1 rv[k)
*(*:)
K,
yik)
0 .5
.. J
L . Controlador integral
L .
J
Figura 6-24 Sistema de seguimiento con realimentación del estado y control integral, que incluye un retardo unitario en la trayectoria directa.
Determine la ganancia de trayectoria directa A', y la ganancia de retroalimentación A\. donde la respuesta a la entrada de secuencia escalón unitario r ( k ) = 1(donde k = 0 , 1.2....) sea con oscilaciones muertas. Grafique la respuesta y(k ) en función de k. Problema B-6-18
Considere el sistema de seguimiento que aparece en la figura 6-25. (Este sistema es similar al mostrado en la figura 6-24, excepto que el controlador integral tiene un elemento de retardo unitario en el lazo
www.FreeLibros.me
516
Ubicación de polos y diseño de observadores
Figura 6-25
Capítulo 6
Sistema de seguimiento con realimentación del estado y control integral, que incluye un retraso unitario en
el lazo menor.
menor.) Determine la ganancia de trayectoria directa y la ganancia de retroalimentación K2, donde la respuesta a la entrada de secuencia escalón unitario r(k) = 1(donde k = 0, 1, 2,...), sea con oscilaciones muertas. Graftque la respuesta y{k) en función de k.
www.FreeLibros.me
7 Enfoque de ecuaciones polinom iales p a ra el diseño de sistem as de control
7-1 INTRODUCCIÓN En el capítulo 6 se diseñaron sistemas del estado de control mediante realim entación, o retroalimentación, al usar la técnica de ubicación de polos. Si algunas de las variables de estado no se podían medir de manera directa, se empleaban los estados observados para propósitos de realimentación. E l diseño completo se realizó en el espacio de estados. Existe un enfoque diferente para el diseño de sistemas similares. Éste se denomina enfoque de ecuaciones polinomiales y es un enfoque alterno al diseño mediante ubicación de polos con un observador del estado de orden mínimo. (E l enfoque de ecuaciones polinomiales se puede aplicar a sistemas con entradas y salidas múltiples. Sin embargo, en este capítulo, sólo se considera para sis temas con una entrada y una salida.) Este capítulo presenta una explicación introductoria al enfoque de ecuaciones polinomiales para el diseño de sistemas de control. En este enfoque se resuelven las ecuaciones Diofantinas para determinar polinomios en z que se pueden utilizar para construir sistemas físicamente realizables. Este punto de vista proporciona una solución matemática rápida a ciertos tipos de problemas de diseño. La organización del capítulo es la siguiente: la sección 7-1 presenta algunos comentarios introductorios. La sección 7-2 explica las ecuaciones Diofantinas y provee los fundamentos mate máticos necesarios para el enfoque de ecuaciones polinomiales para el diseño de sistemas de contról. La sección 7-3 presenta un ejemplo simple para demostrar el enfoque de ecuaciones polinomiales para el diseño de un sistema de regulación que tenga una ecuación característica deseada. La sección 7-4 trata el enfoque de ecuaciones polinomiales al diseño de sistemas de control. La sección 7-5 estudia el diseño de un sistema de control mediante la igualación a un modelo. Aquí se diseña dicho sistema de modo que su respuesta a cualquier entrada sea la misma que la especificada por un 517
www.FreeLibros.me
518
Enfoque de ecuaciones polinomiales para el diseño de sistemas de control
Capítulo 7
modelo matemático. Para diseñar dicho sistema, se determinan, con base en el enfoque de ecuaciones polinomiales, filtros físicamente realizables que producen las características deseadas del sistema.
7-2 LA ECUACIÓN DIOFANTINA En esta sección se explica la ecuación Diofantina. Considere el sistema definido por la función de transferencia pulso Y(z)
B(z)
U(z)
A(z)
(7-1)
donde
A ( z ) = z" + a xz n 1 + • ■• + an~¡ z + an B ( z ) = b0z n + b xz n~x + •• ■ + b n~\ z + b n Suponga que esta función de transferencia pulso es de estado completamente controlable y comple tamente observable. Esto es, no existe una cancelación entre polos y ceros enla función de trasferencia pulso, o A(z) y B(z) no tiene factores en común. Cuando los polinomios A(z) y B(z ) no tiene cancela ciones, se dice que son polinomios coprimos. Un polinomio en z se dice mónico si el coeficiente del término de mayor grado es uno. Por lo tanto, el polinomio A(z) es mónico. A continuación se define un polinomio estable D(z) de grado (2 n - 1) como sigue:
D ( z ) = d0z 2n~l + d xz 2n~2 + ••• + íf2n_2 z + d ^ -1 Entonces existen polinomios únicos de grado ( n - 1), a(z) y ¡3(z) tales que a (z )A (z ) + P(z)B(z) = D (z )
(7-2)
donde a ( z ) = a 0z n~1 + a¡ z n~2 + •• ■ + a„-2z + a „- , j8 (z ) = f t z - 1 + P l z n~2 + ■■■ + P „ -2 Z + Pn
La ecuación (7-2) se denomina ecuación Diofantina, en honor a Diofanto de Alejandría (2467-330? d.C.). La ecuación Diofantina se puede resolver para a(z ) y p (z) mediante el uso de la matriz de Sylvester E de 2n x 2n, la cual se define en términos de los coeficientes de los polinomios coprimos A(z) y B(z) como sigue: "
a n
0
0
@ n —1
a„
0
ítn - i
0
bn
0
b n -l
bn
.
0
0
b n -l
.
0
b i
«1
E =
.
1
ai
0
1
0
0
a i
0
0
0
0
1
0
0
* •
a„
b 0
b i
.
■
bn
@ n- 1
0
b 0
.
■
b n -l
■
b i
.
'
(7-3)
b 0
[Para utilizar la ecuación (7-3), el polinomio A(z) debe ser mónico. De otra forma, se deberá modi ficar la ecuación (7-3).] Si n = 4, esta matriz se escribe como:
www.FreeLibros.me
Sección 7-2
519
La ecuación diofantina
0 a4
0 0 a4
0 0 0 a4
b4
«3
0 0 0
1 0 0
ai 1 0
a2 ai 1
0 0 0
fl4
b3 fl2 «3 b2 b\ «1 a2 «3 1 a\ a2 a3 bo
0 b4
0' 0 0 b2 b3 b4 bi b2 b3 bo b. b2 0 bo b, 0 0 b0 0 0 b3 b4
La matriz de Sylvester E es no singular si y sólo si A(z) y B(z ) son coprimos, o no tienen factores en común. Este hecho se puede ver de lo siguiente: en referencia a la matriz E anterior de 8 x 8, el determinante |E¡ es: a4 0 a3 a4 a2 a3 ai a2 1 ai 1 0 0 0 0 0 = bo(Ai
0 0 0 0 a4 0 a3 a4 a2 a3 ai a2 1 ai 0 1
b4 b3 b2 bi b0 0 0 0
0 b4 b3 b2 bi b0 0 0
0 0 0 0 b4 0 b3 b4 b2 b3 b\ b2 K bi 0 b0
—A5) ( A i — A6)(A ! — A7) ( A i — As)
• (A2 —As)(A2 ~ A6)(A 2— A7)(A 2 — A8) ■(A 3
—Ag)(A3 — A6)(A 3— A7)(A 3 — Ag)
■(A 4
—A5)(A 4 — A6)(A 4— A7)(A 4 — Ag)
(7-4)
bAson los coeficientes de A(z) y B(z), respectivamente, y A,, . . ., A4 y A5. . . , As son las raíces características de A(z) y B(z), respectivamente: A ( z ) = z 4 + a3z 3 + a2z 2 + a3z + a» = (z - Aj)(z - A2)(z - A3)(z - A4) B ( z ) = b0z 4 + b \ z 3 + b2z 2 + b3z + bA = b0(z - A5)(z - A6)(z - A7)(z - As) De la ecuación (7-4) se observa que el determinante |E| no es cero si y sólo si todos los factores multiplicativos en el segundo miembro de la ecuación no son cero, esto es, si y sólo si no hay cancelaciones entre A(z) y B(z). [Para obtener la ecuación (7-4), refiérase al problema A-7-1.] Ahora se definen los vectores D y M tales que
Ot„-l a * -2
«2n-l ^2n-2 D =
M =
dr do
«o
Pn-1 Pn- 2 A>
www.FreeLibros.me
520
Enfoque de ecuaciones polinomiales para el diseño de sistemas de control
Entonces los coeficientes a 0, a „ .. .,
Capítulo 7
y 0O, 0,, . . . , 0„_, se pueden determinar a partir de M = E _1 D
(7-5)
La ecuación (7-5) da la solución a la ecuación Diofantina. [Para obtener la ecuación (7-5), véase el problema A-7-2.] Ejemplo 7-1 Considere los siguientes A(z) (un polinomio mónico de grado 2), B(z) (un polinomio de grado 1), y D(z) (un polinomio de grado 3):
A( z) = z2 + 2 + 0.5 B(z) = 2 + 2 D (2) = 23 [Es claro que no hay factores comunes en A(z) y B(z).] El problema es encontrar dos polinomios únicos a(z) y /3(z) tales que:
a(z)A(z) + 0 (z)B(z) = D(z) donde
a(z) = a 02 + ai 0(2) = 0o 2 + 0 , o bien (ao 2 + a ,)( 22 + 2 + 0.5) + (0o 2 + 0i)(z + 2) = z3
(7-6)
La ecuación (7-6) es una ecuación Diofantina. Para resolver esta ecuación para a(z) y ¡3(z), primero se debe observar que
a¡ = 1,
a2 = 0.5
ba = 0,
¿>i = l,
¿>2 = 2
y entonces la matriz de Sylvester E se escribe como: 0.5 1 1 0
0 0.5 1 1
2 1 0 0
0 2 1 0
La inversa de esta matriz se puede obtener de una forma fácil con MATLAB. La salida de MATLAB para la inversa de la matriz E es:
E= 0.5000 1.0000 1.0000 0
0 0.5000 1.0000 1.0000
2.0000
0
1.0000 0 0
2.0000
inv(E)
www.FreeLibros.me
1.0000 0
Sección 7-2
La ecuación diofantina
521
ans =
0 .4 0 0 0
- 0 .8 0 0 0
1.6000
0
0
0
1.0000
0 .4 0 0 0 - 0 .4 0 0 0
0 .2 0 0 0 0 .8 0 0 0
- 0 .4 0 0 0 - 0 .6 0 0 0
0 .3 0 0 0 0 .2 0 0 0
- 1 .2 0 0 0
Ya que D ( z ) = z3 se tiene do — 1,
di - 0,
d2 — 0,
£¿3 — 0
Por lo tanto, la matriz D es 0 0 0 1
£¿3
dz di do
D =
Al definir la matriz M como ai a0 A
se obtiene la solución de la ecuación Diofantina de M = E 'D
como sigue: M = (inv(E))*D M = -
1.2000 1.0000
0 .3 0 0 0 0.2000 A partir de esta salida de MATLAB, se obtiene ai = -1.2,
oto — 1,
pi = 0.3,
fio = 0.2
o bien a (z ) = otoZ + ai = z — 1.2
P (z ) = p„z + Pi = 0.2z + 0.3 Los polinomios a(z) y p(z) determinados de esta forma satisfacen la ecuación Diofantina dada por la ecuación (7-6). Para verificar esto, se debe notar que
www.FreeLibros.me
522
Enfoque de ecuaciones polinomiales para el diseño de sistemas de control
Capítulo 7
(z - 1.2)(z2 + z + 0.5) + (0.2z + 0.3)(z + 2) = z3 - 1.2z 2 + z2 - 1.2z + 0.5z - 0.6 + 0.2z2+ 0.3z + 0.4z + 0.6 = z3
7-3 EJEM P LO ILU STR A T IV O En el capítulo 6 se discutió el enfoque de ubicación de polos para el diseño de sistemas de control. Se estableció que algunas de las variables de estado podían no estar disponibles para medirse de forma directa, y que en tales casos el enfoque de ubicación de polos requería los estados estimados u observados para la realimentación. Veamos el ejemplo 6-11, donde se discutió el sistema de regulación con realimentación del estado. En tal sistema la ecuación característica estaba dada, y una de las variables de estado fue estimada mediante el uso de un observador de orden mínimo del tipo de oscilaciones muertas. En esta sección se mostrará que ese mismo sistema de regulación se puede diseñar mediante elenfoque de ecuaciones polinomiales.
Sistema de regulación diseñado en el ejemplo 6-11. El sistema de regulación diseñado en el ejemplo 6-11 se presenta en la figura 7-1. La planta es de estado completamente controlable y com pletamente observable. (N o existe cancelación entre el polinomio numerador y el polinomio deno minador.) El período de muestreo fue de 0.2 segundos, o T= 0.2. El controlador fue diseñado con base en el enfoque de ubicación de polos al especificar los polos de lazo cerrado en Zi = 0.6 + /0 .4 ,
z 2 = 0.6 - /0 .4
y al incorporar un observador de orden m ínimo para estimar las variables de estado para la realimentación. El observador de orden mínimo tenía la ecuación del error de observación
f)
Figura 7-1 6-11.
www.FreeLibros.me
<7- 7 >
Sistema de regulación diseñado en el ejemplo
Sección 7-3
Ejemplo ilustrativo
523
A continuación se presentará el enfoque de ecuaciones polinomiales al diseño del mismo regu lador dado por la ecuación (7-7) mediante la solución de la ecuación Diofantina.
Enfoque de ecuaciones polinomiales para el diseño del sistema de regulación. Considere el diagrama de bloques de la figura 7-2. La función de transferencia realimentada f3(z)/a(z) funciona com o un regulador. Se determinarán a(z) y f3(z) mediante el enfoque de ecuaciones polinomiales. Primero se debe notar que la función de transferencia de la planta es B( z ) 0 .0 2 (z + 1) U (z)~A (z)~ (z-1)2 Y (z )
[A(z) es mónico de grado 2 y no hay cancelación entre A(z) y B(z).] Entonces, aunque R(z ) = 0, la función de transferencia pulso en lazo cerrado para el sistema está dada por
0.02(z + l)a (z) Y(z) = « (z )g (z ) = _________________________________ R(z) a ( z ) A ( z ) + ( i (z )B(z ) a ( z ) ( z - l ) 2 + /3 (z)0 .0 2 (z + 1) Como se estableció antes, en el ejemplo 6-1, se requiere que los polos de lazo cerrado deseados mediante realimentación de estado sean Zi = 0 .6 + y'0.4,
z 2 = 0 .6 - ; 0 .4
o que la ecuación característica deseada sea H ( z ) = (z - 0 .6 - y 0 .4 )(z - 0 .6 + y'0.4) = z 2 - 1.2z + 0.52 El polinomio del error del observador de orden mínimo fue
F(z) = z Para determinar a(z) y /3(z), se resuelve la ecuación Diofantina siguiente:
a { z ) A ( z ) + J3( z ) B ( z ) = F( z) H{ z ) = D ( z )
(7-8)
donde
D{ z ) = F ( z ) H ( z ) = d0z 3 + d]Z2 + d2z + d3 = z 3 - 1 .2 z 2 + 0.5 2 z Observe que D(z) es un polinomio estable de grado (2 n - 1) en z (donde n = 2 para este caso). Ya que
R(z) = 0
/0
\
U(z>.
B(z)
0.02 (z+ 1)
A(z)
( z - 1)2
pU) a{z)
Figura 7-2
Diagrama de bloques del sistema de regulación.
www.FreeLibros.me
Y{z)
524
Enfoque de ecuaciones polinomiales para el diseño de sistemas de control
Capítulo 7
A ( z ) = z 2 - 2z + 1 B ( z ) = 0.02 z + 0.02 se tiene que fli = - 2 ,
a2 = 1,
¿>0 = 0,
= 0.02,
¿>2 = 0.02
A l sustituir los polinomios A(z), B(z) y D(z) en la ecuación (7-8), se obtiene
a ( z ) ( z 2 - 2z + 1) + j3(z)(0.02z + 0.02) = z 3 - 1.2z2 + 0.52z Para resolver la ecuación Diofantina para a(z) y /3(z), primero se define la matriz de Sylvester E de 2 n x 2 n como:
0 0.02
1 -2 1
E= .
0
‘
1 0.02 0.02 -2 0 0.02
0
1
0
0
.
La matriz inversa de E se puede obtener fácilmente con MATLAB com o sigue:
1_
0.25 0 37.5 -1 2 .5
-0 .2 5 0 12.5 12.5
0.25 0 -1 2 .5 37.5
0.75 1 -3 7 .5 62.5
a(z) y /3(z) son polinom ios de grado n - l = 2 - l = l , o bien a ( z ) = «o z + a¡ /3(z) = /3oZ + ¡3, Se definen
0
dt .do.
=
'd ¡ d-2
,
1
«i «0 M= A .A).
Entonces el vector M se determina a partir de
0.25 0 37.5 -1 2 .5
-0 .2 5 0 12.5 12.5
0.25 0 -1 2 .5 37.5
0.75' 0 ' 1 0.52 -3 7 .5 - 1 .2 62.5 1
Por lo tanto,
^ = 0.32,
a0 = 1,
/3, = -1 6 ,
Entonces, a (z) y /3(z) se determinan como
a ( z ) = aoZ + ai = z + 0.32 0 (z ) = /3oZ + /3i = 24z - 16
www.FreeLibros.me
/3o = 24
' 0.32' 1 -1 6 24
S e c c ió n 7 - 4
E n f o q u e d e e c u a c i o n e s p o l in o m ia l e s p a r a e l d is e ñ o d e s is t e m a s d e c o n t r o l
525
y el regulador realimentado se obtiene como
P (z ) = J
a(z)
z ~ 0 .6 6 6 7 \ \ z + 0 .32 /
que es idéntico al que se diseñó en el espacio de estado mediante el método de ubicación de polos combinado con un observador de orden mínimo.
7-4 EN FO Q U E DE EC U A C IO N ES P O LIN O M IA LES PA R A EL D ISEÑ O DE S IS T E M A S DE CONTROL En la sección 7-3 se diseñó un sistema de regulación al usar el enfoque de ecuaciones polinomiales. El diagrama de bloques del sistema de regulación diseñado se presenta en la figura 7-3. Recuerde que a{z ) y /3(z) se determinaron a partir de la ecuación Diofantina siguiente: a { z ) A { z ) + f5(z)B(z) = H ( z ) F ( z ) donde A(z) es un polinomio mónico de grado n, B(z ) es un polinomio de grado m ( m < n ) [se supuso que no hay factores comunes entre A(z) y B(z)\, H(z) es el polinomio característico deseado para la parte de ubicación de polos, y F(z) es el polinomio característico para el observador de orden míni mo. [Ambos polinomios H(z) y F{z) son polinomios estables.] El grado del polinomio H(z) es n y el del F(z) es n - 1. (Se supone que la salida del sistema es el único estado medible. Por lo tanto, el or den del observador mínimo es n - 1.) A continuación se explicará el diseño de sistemas de control basado en el enfoque de ecuaciones polinomiales. Se consideran dos configuraciones diferentes de sistemas de control.
Configuración 1 del sistema de control. El sistema de regulación presentado en la figura 7-3 se puede modificar para un sistema de control cuya salida siga a la entrada de referencia. Un diagrama de bloques posible para este sistema de control se muestra en la figura 7-4. Como todo sistema de control, requiere tener una ganancia ajustable K0. Esta ganancia K0 debe ser ajustada para que la salida en estado estable y(k) sea igual a uno cuando la entrada r(k) es un secuencia de escalón unitario.
Figura 7-3 regulación.
www.FreeLibros.me
Diagrama de bloques del sistema de
526
E n f o q u e d e e c u a c i o n e s p o l in o m ia l e s p a r a e l d is e ñ o d e s is t e m a s d e c o n t r o l
C a p ít u lo 7
Wz)
Figura 7-4 control.
Diagrama de bloques del sistema de
La función de transferencia pulso en lazo cerrado Y(z)!R{z) es B(z) Y(z)
A (z)
R(z)
B(z)/3(z)
*°
A(z)a(z) _
v
=
K
— Ao
<*(z )B (z ) a(z)A (z) + fi(z)B(z) ( 7‘ 9>
H ( z )F( z ) Observe que el sistema en lazo cerrado es de orden (2 n - 1), a menos que ocurra alguna cancelación entre a(z)B(z ) y H(z)F{z). Observe que la dinámica del numerador ha cambiado de B(z) a K0a(z)B(z). Para determinar K0 se hace que
limy(/c) = lim (l - z -1)Y (z)
k-+oo
z—»i
= limz ~ 1 y a (Z)B(.z) Z ™ z °H(z)F(z) z - 1 H(1)F(1) = 1
de donde se obtiene
H(1)F(1) *0
=
Ejemplo 7-2 En el sistema de regulación considerado en la sección 7-3,
A ( z ) = (z - l f B ( z ) = 0.02(z + 1) H ( z ) = z 2 - 1.2z + 0.52
F(z) = z a( z) = z + 0.32 /3(z) = 24z - 16
www.FreeLibros.me
Sección 7-4
Enfoque de ecuaciones polinomiales para el diseño de sistemas de control
527
Por lo tanto, la función de transferencia pulso en lazo cerrado Y(z)/R(z) se obtiene de la ecuación (7-9) como
Y(z) K0(z + 0.32)(0.02)(z + 1) R(z) ~ z3 - 1.2z2 + 0.52z Observe que en este caso K„ está dada por:
0
//(l)F (l) a ( l) B ( l)
0.32 x 1 = 1.32 x 0.04
Note que el sistema es de tercer orden. La respuesta al escalón unitario y a la rampa unitaria del sistema con Ka = 6.0606 fueron presentadas en la figura 6-16 y 6-17, respectivamente.
Configuración 2 del sistema de control. Un sistema de control con un diagrama de bloques diferente se puede diseñar mediante el uso del enfoque de ecuaciones polinomiales. Considere el diagrama de bloques de la figura 7.5. (Para obtener dicho diagrama de bloques, véase el problema A -7-3.) De la figura 7-5, se obtiene la siguiente ecuación: U{z) =
fg t/ (z )- u (z , +
fay(2)
+ K 0R ( z )
que se puede simplificar a
U{z) =
no w
no
+ K 0R{ z )
(7-10)
La función de transferencia pulso de la planta es
Y(z) U(z)
B(z) A(z)
donde A(z) es un polinomio mónico de grado n y B(z) es un polinomio estable de grado m (m < n). Ya que u (z ) = 4 íf ly < z )
Figura 7-5
Diagrama de bloques del sistema de control.
www.FreeLibros.me
<7- i i )
Enfoque de ecuaciones polinomiales para el diseño de sistemas de control
528
Capítulo 7
al sustituir la ecuación (7-11) en la ecuación (7-10), se obtiene Y ( z ) = K 0R ( z ) Entonces Y ( z ) ___________ tfo R{z) a ( z ) A ( z ) + (3(z) F(z )B(z )
F(z )
K 0F ( z ) B ( z ) a (z)A (z) + p (z)B(z) Ya que a (z )A (z ) + P(z)B(z) = H (z)F(z) se obtiene Y ( z ) _ K 0F ( z ) B ( z ) _ K 0B ( z ) R(z)
H (z)F(z)
H (z)
(7-12)
N ote que el polinom io del observador F(z) ha sido cancelado [como F(z) es un polinomio estable, su cancelación es permitida], y el polinomio característico del sistema en lazo cerrado está dado por H(z). H(z) es el polinomio estable de grado n deseado pero que, en esencia, “se escoge en forma arbitraria”. Por lo tanto, el sistema de control diseñado es de orden n. (En el caso del sistema de control de la configuración 1, el orden del sistema es 2« - 1, a menos que ocurra cancelación en el sistema diseñado, lo que resulta en una reducción del orden del sistema.) También se observa que la dinámica del numerador de Y(z)/R(z) no ha cambiado en el presente enfoque. [El numerador es B(z) multiplicado por la constante A],.] Ejemplo 7-3 Se diseñará un sistema de control con base en el diagrama de bloques de la figura 7-5. La planta que se considera está dada por
B(z) _ 0.02(z + 1) A{z) (z - l ) 2 (El período de muestreo T es de 0.2 segundos). Se utilizarán los mismos polos en lazo cerrado deseados empleados en el ejemplo 7-2, es decir,
Zi = 0.6 + j 0.4,
z2 = 0.6 - j 0.4
y se utilizará el mismo polinomio deseado del observador de orden mínimo, o bien,
www.FreeLibros.me
Sección 7-4
Enfoque de ecuaciones polinomiales para el diseño de sistemas de control
529
y se resuelve la ecuación Diofantina siguiente:
a{z)A {z) + 0 (z)B(z) = H (z )F(z ) o bien
a(z)(z - l ) 2 + p(z)(0.02)(z + 1) = z3 - 1.2z2 + 0.52z
(7-13)
La ecuación (7-13) fue resuelta en la sección 7-3 y se obtuvieron a(z) y /3(z)
a(z) = z + 0.32 P(z) = 24z - 16 A l utilizar estas a(z) y /3(z) y en referencia a la ecuación (7-12), la función de transferencia pulso en lazo cerrado Y{z)!R(z) se puede escribir como:
Y(z) R (z) ~
K
qB
(z)
H (z)
K o(0.02z + 0.02) ~ z2 - 1.2z + 0.52
quey(°°) en la respuesta al escalón unitario sea igual
Para determinar la constante K0, se requiere a uno.
lim y(fc) = lim (l - z _1) Y (z ) z - 1 K o(0.02z + 0.02)
= lim-
= *o
z
1.2z + 0.52 z - 1
,
8 Por lo tanto, el valor de K0es Ko =
8
Entonces se obtiene la función de transferencia pulso en lazo cerrado
Y{z) = O.lóz + 0.16 R(z) ~ z2 - 1.2z + 0.52 Es claro que el sistema diseñado es de segundo orden. El diagrama de bloques del sistema diseñado se presenta en la figura 7-6a). La figura 7-6b) muestra el diagrama simplificado. Ahora se examinará la respuesta al escalón unitario y a la rampa unitaria del sistema diseñado. El programa para M A T L A B 7-1 se utiliza para obtener la respuesta al escalón unitario. E l resultado se presenta en la figura 7-7. El programa para M A T L A B 7-2 da la respuesta a la rampa unitaria. El resultado se muestra en la figura 7-8. E l error en estado estable e(x ) al seguir a la entrada rampa unitaria se obtiene como: Ya que Y (z )
8(0.02z + 0.02)
R(z) ~ z2 - 1.2z + 0.52 se tiene que
-
i
E (z ) = R(z) - Y(z)
R(z)
(z - l) ( z - 0.36) z2 - 1.2z + 0.52
R(z)
donde R (z ) =
0.2z (z-1)
www.FreeLibros.me
R(z)
Enfoque de ecuaciones polinomiales para el diseño de sistemas de control
530
Capítulo 7
(a)
mz)
8(0.022+0.02) z2 -1.22+ 0.52
V(z)
(b) Figura 7-6 a) Diagrama de bloques del sistema de control diseñado mediante el enfoque de ecuaciones polinomiales; b) diagrama de bloques simplificado.
M A TLA B Programa 7-1 num = [0 den = [1
0.16 -1.2
0.16]; 0.52];
r = o n es(l,41); v = [0
40
0
1.6];
axis(v); k = 0: 40; y = filter(num,den,r); plot(k,y,'o") grid title(' Unit-Step Response") x la b e l('k ') yla b e l('y (k )')
Por lo tanto,
x
z - 1 (z - 1)(z - 0.36) 0.2z ------ ——r 7 ---- r r z z — 1.22 + 0.52 (2 - 1)
lim e(k) = hm ----- ;—
*-.»
= 0.4 El error en estado estable al seguir a la entrada rampa unitaria es 0.4.
www.FreeLibros.me
Sección 7-4
531
Enfoque de ecuaciones polinomiales para ei diseño de sistemas de control R e spu e sta escalón unitario
1.6
-- — —
-
1.4
1.2
1
0.6
0.4
0.2
0
0
5
10
15
20
25
30
35
40
k Figura 7-7
Respuesta al escalón unitario del sistema mostrado en la figura 7-6(6).
Programa de M ATLAB 7-2
nurn = [0 den = [1
0.16
0.16];
-1.2 0.52];
k = 0:20; r = [0.2*kj; v = [0
20
0
4¡;
axis(v); y = filter(num,den,r); plot(k,y,' o ',k/y '- ';k/0.2'*k7~') grid titleCUnit-Ramp Response") x la b el('k ') y la b e l('y (k )')
Al comparar las respuestas al escalón unitario de los sistemas de control de la configuración 1 y 2 se observa que son idénticas. Al comparar las respuestas a la rampa unitaria de los dos sistemas, se nota que el sistema de control de la configuración 2 tiene un error 10% menor en estado estable al seguir la entrada rampa unitaria que el sistema de control de la configuración 1.
www.FreeLibros.me
532
Enfoque de ecuaciones polinomiales para el diseño de sistemas de control
Capítulo 7
R e spu e sta a la ram pa unitaria -------------------- 1--------------------------------------- 1---------------------------------------r 4 I-----------“ i-------------- !------------- 1----- -------- 7
„l
:.........:.........:..... y
,, / ^
V ''' : 0° \
3 .......................i........................
yy
y
y
y o 0
o 0
.........-
\
\
7
y
\
2.5 1-......................
......... .................................... 0
/ /
0
\
Y
/
\
.0 y
\
. 1
/y y/
:
Y ............................. \
1.5 r .............................
y
/
-
o0 : -
:
o
0
/
-
\
............. -< ' ........ ..............¿oI ' ....................................... 0.5 - ........> ........................ /O ; O
\
0
O
O s —-ao -—
----------------- 1---------------------------------- 1---------------------------------- 1----------------------------------
o
5
10
15
20
k Figura 7-8
Respuesta a la rampa unitaria del sistema mostrado en la figura 7-6(6).
7-5 D ISEÑ O DE S IS T E M A S DE CONTROL M ED IA N TE LA IG U A L A C IÓ N A UN M O D ELO En la técnica de diseño presentada en la sección 7-4 (del sistema de control de la configuración 2), el polinomio del observador F(z) se canceló entre el numerador y el denominador de la función de transferencia pulso en lazo cerrado. [Véase la ecuación (7-12).] La ecuación característica del siste ma diseñado fue H(z) que es un polinomio estable de grado n. [ H(z) fue un polinomio estable de grado n deseado, pero escogido en un sentido “arbitrario”.] Suponga que la función de transferencia pulso de la planta es Y(z) U(z)
B(z) A(z)
donde A(z) es un polinomio mónico de grado n en 2 y B(z) es un polinomio de grado m e n z (m < ri). y se supone que no hay factores comunes entre A(z) y B(z). Si B(z) es un polinomio estable (significa que todos los ceros están dentro del círculo unitario en el plano z), es posible escoger H(z) tal que incluya al polinomio B(z), o bien H ( z ) = B ( z ) H l( z ) E n to n ces, en re fe re n c ia a la e c u ació n (7 -1 2 ), se tiene
Y{z)
K 0B ( z )
K qB ( z )
Kq
R(z)
H(z)
B(z)H i(z)
H ¿z)
www.FreeLibros.me
Sección 7-5
Diseño de sistemas de control mediante la igualación a un modelo
533
Por lo tanto, se eliminaron los ceros del polinomio numerador lo que significa que si se desea se pueden eliminar los ceros de la planta. Suponga que se quieren tener ciertos ceros en el numerador y ciertos polos en el denominador. Esto es, se quiere que el sistema posea ciertos polos deseados y ciertos ceros deseados com o los de un “sistema m odelo”, o bien Y(z) _
R(z)
_ Bm(z)
Omoddo
Am(z)
Bajo ciertas condiciones, es posible diseñar tal sistema mediante el uso del enfoque de ecuaciones polinomiales. Ya que se obliga a que la función de transferencia pulso del sistema de control sea exactamente igual a la de un modelo, a este tipo de sistema de control se le llama sistema de control mediante la igualación a un modelo. En el proceso de diseño discutido en la sección 7-4, H(z) se escogió com o el polinomio carac terístico deseado de grado n. [H{z) es un polinomio estable de grado n que no es único, pero sí un poco arbitrario con tal de que produzca una respuesta aceptable del sistema.] Se escoge un polinom io estable de grado n - m com o H^(z). [7/,(z) debe ser un polinomio estable pero en un sentido arbitrario que produzca una respuesta aceptable del sistema resultante.] Ahora se define el producto de B(z ) por H¡(z) com o H(z), es decir, H(z) = B[z)H¿z) S iste m a de co n tro l m ed ia n te la ig ualación a u n m odelo. Primero se hará referencia al diagrama de bloques de la figura 7-9. Se supone que la planta B(z)/A(z) es de estado completamente controlable y completamente observable; esto es, no existen factores comunes entre A(z) y B(z). Se determinan a(z) y j8(z) al resolver la ecuación Diofantina siguiente: a ( z ) A ( z ) + 0 ( z ) B ( z ) = F ( z ) B ( z ) H 1( z ) donde F(z) es un polinomio estable de grado (n - 1). [Observe que a(z ) y f3(z) son polinom ios de grado (« - 1).] Entonces, del diagrama de bloques de la figura 7-9 se tiene U(z) =
Figura 7-9
Lf g u ( 2) - u ( z ) + a £ l y (2 ,
+ V(z)
Diagrama de bloques del sistema de control mediante la igualación a un modelo.
www.FreeLibros.me
Enfoque de ecuaciones polinomiales para el diseño de sistemas de control
534
Capítulo 7
o bien
Ya que
se tiene £ Íild Í£ l F (z ) B (z )
y
( z ) + @ & - Y ( z ) = V (z ) F (z ) V >
es decir 7 (2 )
F(z)B(z)
F(z)B(z)
1
V (z )
a ( z ) A ( z ) + ¡3( z ) B ( z )
F ( z ) B ( z ) H l(z )
H ,(z )
También,
m
= Gmodelo H t(z)R(z)
Por lo tanto,
Y(z) R(z)
Y(z) V(z) V (z) R(z)
^modelo H¡ ( 2 )
H\(z)
G„
En conclusión, se ha visto que si
V(z) ^modelo
entonces la función de transferencia pulso entre la salida Y(z) y la entrada R(z) es igual a Gmodekr Asi. se logra el control mediante la igualación a un modelo.
Comentarios. Al aplicar el presente enfoque para el diseño de un sistema de control median te la igualación a un modelo, es importante recordar lo siguiente: 1. Para hacer que la función de transferencia pulso Gmoddo H¡(z) sea físicamente realizable, el grado del polinomio numerador de Gmoddo H¡(z) debe ser igual o menor que el grado del polinomio denominador de Gmodelo H x(z). De otra forma, el presente enfoque no se puede aplicar. 2. Como se hizo notar antes, el polinomio numerador B(z) de la planta debe ser estable porque la cancelación de B(z) se realiza entre el numerador y el denominador de Y{z)!V(z). [Si B(z) no es un polinomio estable, esto es, B(z) tiene uno o varios ceros fuera del círculo unitario, entonces la cancelación de B(z) en Y(z)!V{z) producirá una respuesta inestable y el sistema diseñado será inestable.] E jem plo 7-4 Considere la planta definida por
7 (z ) _
U{z) ~
0.36792 + 0.2642 - 0.3679)(2 - 1)
(2
www.FreeLibros.me
Sección 7-5
Diseño de sistemas de control mediante la igualación a un modelo
535
Suponga que el período de muestreo T es de 1 segundo. Se desea diseñar un sistema de control tal que el sistema en lazo cerrado sea:
Ym(z) = 0.62z - 0.3 Rm(z) z2 - 1.2z + 0.52 A esta función de transferencia pulso se le llamará función de transferencia pulso del modelo, o bien, 'n ir .ld .r
1
Y„,{z) modelo
R J
Z )
-2
0.62r - 0.3 _ P2z+ 0.52
(7-14)
Se supone que se utiliza la configuración del sistema dada en la figura 7-9. Observe que para la planta dada
A {z ) = z2 - 1.3679z + 0.3679 B (z ) = 0.3679z + 0.2642 Por lo tanto,
a¡ = -1.3679, b0 = 0,
a2 = 0.3679
bx = 0.3679,
b2 = 0.2642
Claramente, el numerador B(z) es un polinomio estable. Como la función de transferencia pulso de la planta es de segundo orden (o n = 2), se escoge a H x(z) como un polinomio estable de primer grado [de grado (n - 1 )]. Por ejemplo, se puede escoger a //](z) como:
H x(z) = z + 0.5 [La selección de H¡(z) es, en cierto sentido arbitraria, siempre que sea un polinomio estable.] Ahora se define
H (z) = B {z )H x{z) = (0.3679z + 0.2642)(z + 0.5) Se escoge a
F(z) = z [.F(z) puede ser cualquier polinomio estable de grado (n - 1).] Entonces
D (z) = F(z )H (z ) = F (z )B (z )H ¡(z) = z(0.3679z + 0.2642)(z + 0.5) = 0.3679z3 + 0.4482z2 + 0.1321z Por lo tanto,
d0 = 0.3679,
dx = 0.4482,
d2 = 0.1321,
d, = 0
Ahora se necesita resolver la ecuación Diofantina siguiente: a ( z )A ( z ) + /3( z ) B ( z ) = F{z )B (z )H i{z ) o bien
a(z)(z2 - 1.3679z + 0.3679) + 0(z)(O.3679z + 0.2642) = 0.3679z3 + 0.4482z2 + 0.1321z donde a(z) y ¡3(z) son polinomios en z de primer grado. Entonces la matriz de Sylvester E de 4 x 4 para este problema es:
E =
a2 0 b2 0 «i a2 bx b2 1 «i b0 bx 1 0 0 bo
0.3679 -1.3679 1 0
0 0.3679 -1.3679 1
www.FreeLibros.me
0.2642 0.3679 0 0
0 0.2642 0.3679 0
Enfoque de ecuaciones polinomiales para el diseño de sistemas de control
536
Capítulo 7
Entonces, al utilizar M A T LA B, E~' se puede obtener como se muestra a continuación.
E= 0 .3 6 7 9 - 1 .3 6 7 9 1 .0 0 0 0 0
0 0 .3 6 7 9 -1 .3 6 7 9 1 .0 0 0 0
0 .2 6 4 2 0 .3 6 7 9 0 0
0 0 .2 6 4 2 0 .3 6 7 9 0
- 0 .3 8 4 9 0 0 .5 3 5 9 1 .0 4 6 1
0 .2 7 6 4 0 - 0 .3 8 4 9 1 .9 6 6 9
0 .5 1 9 7
inv(E) ans = 0 .5 3 5 9 0 3 .0 3 8 7 - 1 .4 5 6 7
1 .0 0 0 0 - 0 .7 2 3 6 2 .3 0 5 6
Se definen 0 di d2 = 0.1321 0.4482 di 0.3679 d0
D
ai M
=
a0 Pi A
Entonces la matriz 1YÍ se obtiene como sigue: 0.2642 0.3679 -0.3679 1.8680
M = E 'D =
Por lo tanto,
a(z) = otoz + oti = 0.3679z + 0.2642 P(z) = faz + /3i = 1.8680z - 0.3679 Al usar estos polinomios a(z) y p(z), Y(z)/V(z) se escribe como:
Y(z) _ F (z )B (z ) V(z) F (z )B {z )H l(z)
1
H i(z)
_
1
z + 0.5
Ya que V{z)/R(z) es (0.62z-0.3)(z+ 0.5)
V(z) R(z)
z2 -1.2z + 0.52
la función de transferencia pulso Y(z)/R(z) es
Y(z) R(z)
0.62z- 0.3
z2- 1.2z + 0.52
E l sistema de control mediante la igualación a un modelo diseñado tiene el diagrama de bloques que se presenta en la figura 7-10a). Este diagrama de bloques se puede simplificar a los mostrados en las figuras 7-106) ye ).
www.FreeLibros.me
Sección 7-5
Diseño de sistemas de control mediante la igualación a un modelo
537
R(z)
(a) R(z)
(b)
R{z)
VTz)
0.62z- 0.3 z 2 - 1.2z + 0.52
(c) Figura 7-10 a) Diagrama de bloques del sistema de control mediante la igualación a un modelo; b) y c) diagramas de bloques simplificados.
La respuesta al escalón unitario y a la rampa unitaria del sistema modelo se muestra en las figuras 7-11 y 7-12, respectivamente. La respuesta al escalón unitario presenta aproximadamente un 30% de sobrepaso, y el error al seguir la entrada rampa unitaria es de alrededor de 0.55. C o m e n ta r io s . Es importante observar que este enfoque es diferente al de m ultiplicar el filtro siguiente (función de transferencia pulso)
(z
- 0 .3 6 7 9 )( z z2 -
1 .2 z + 0 .5 2
1)
0 .6 2 z - 0 .3 0 .3 6 7 9 z + 0 .2 6 4 2
por la planta. A unque, de forma matem ática, el producto sea (z - 0 .3 6 7 9 )( z - 1) z2 -
1 .2 z + 0 .5 2
0 .6 2 z - 0 .3
0 .3 6 7 9 z + 0 .2 6 4 2
0 .3 6 7 9 z + 0 .2 6 4 2 (z - 0 .3 6 7 9 )( z -
1)
0 .6 2 z - 0 .3 z2 -
1 .2 z + 0 .5 2
y el sistem a resultante tiene la función de transferencia pulso del m od elo, en este ca so , la ca n cela ción se realiza entre un p o lo críticam ente estable en z = 1 y un cero en z = 1,
www.FreeLibros.me
538
Enfoque de ecuaciones polinomiales para el diseño de sistemas de control
Capítulo 7
R espu e sta ai al e scalón unitario
1.6
¡
,
,
,
1.4 ................
;
,
;----
i..................
-
o ° i
1 . 2 ............... 0 o
1 -............. —
0.6
i
...............
i..................................; .............. -
:© o
:
<5 o Oo OQ Oo O. o O -O O- ó-o Ó-O o Oo Oo O -o -O o Oo O -o-O' ó o- o o o- ó o o o o í > o o o
- °
-
0.4 ......................................
0.2 .................
0A 0
i.
:
i ........ ...............I..............-
1------ 1------ 1------ 1------ '------ 1------ 1-----5 10 15 20 25 30 35 40 k
Figura 7-11
Respuesta al escalón unitario del modelo GlníM, dado por la ecuación (7-14).
R e spu e sta a la ram pa unitaria
k
Figura 7-12
-
Respuesta a la rampa unitaria del modelo
www.FreeLibros.me
dado por la ecuación (7-14).
Sección 7-5
Diseño de sistemas de control mediante la igualación a un modelo
539
y el sistema se vuelve inestable. [Recuerde que nunca debe cancelar un polo inestable (o críticamente estable) con un cero.] En el presente enfoque de ecuaciones polinomiales, no ocurren cancelaciones entre polos inestables (o críticamente estables) y ceros durante el proceso de diseño y, por lo tanto, el sistema resultante siempre es estable. Si no se desea que exista error en estado estable al seguir la entrada rampa, entonces se requie re cambiar el modelo. Por ejemplo, si se utiliza la función de transferencia pulso siguiente com o la función de transferencia pulso del modelo revisado = ^ m o d e lo
0 .8 z -0 .4 8 Z 2 _ 1 . 2 z
+
0 .5 2
( 7 ' i 5 )
entonces el error en estado estable al seguir la entrada rampa se hace cero. Sin embargo, el sobrepaso máximo en la respuesta al escalón unitario es de alrededor de 45%. La respuesta al escalón unitario y la respuesta a la rampa unitaria se presentan en las figuras 7-13 y 7-14, respectivamente. Observe que al cambiar el modelo no se cambia el diagrama de bloques entre Y(z) y V(z), porque Y(z)!V(z) es independiente de la función de transferencia pulso del modelo. Además, si se desea cambiar el modelo, sólo se necesita cambiar la función de transferencia pulso del primer bloque desde Onlo(¡e¡0a Gm0(je|0.
Respuesta al escalón unitario
Figura 7-13
Respuesta a! escalón unitario del modelo G'„dcl(, dado por la ecuación (7-15).
www.FreeLibros.me
Enfoque de ecuaciones polinomiales para el diseño de sistemas de control
540
Capítulo 7
R espu e sta a la ram pa unitaria
20 18 16 14 12
3
10 8 6
4 2
°0
Figura 7-14
5
10
15
20
k Respuesta a la rampa unitaria del modelo G 'oUdl, dado por la ecuación (7-15).
P R O B LEM A S DE EJEM P LO Y SO LU C IO N ES Problema A-7-1 Considere los polinomios A(z) =
z2 + a¡ z + a 2
B (z ) = b0z2 + biZ + b2 L a matriz de Sylvester E se define como a2
0
b2
0
ai
a2
bi
b:
1 0
ai
bo
b
1
0
b,
Muestre que la matriz E es no singular si y sólo si no existe cancelación entre los polinomios
Solución
Se supone que las raíces de A(z)
= 0 son A, y A2y los de B(z) = 0 son A3y A4. Por lo tanto.
A ( z ) = z 2 + a, z + a 2 = ( z - A i) ( z - A2) — z 2 — (Ai 4- A2)z
4- Ai A2
B ( z ) = b a z 2 + b , z + b 2 = b 0{ z = bo z
A(z) y B(z).
¿>o(A3
A3)(z - A4)
A4)z 4” bo A3A4
www.FreeLibros.me
Capítulo 7
Problemas de ejemplo y soluciones
541
De donde, aj = —(Ai + A2),
a2 = Aj A2
b\ = —Z?o(A3 + A4),
¿2 = ¿ 0 A3 A4
La matriz E se escribe en términos de A como
1
Ai A2 - (A i + A2)
b0A3A4 —bo(\i + A4) bo
-¿»o(A3 + A4)
0
1
0
bo
1 A2
0
1 + A2)
E =
0
bo A3 A4
El determinante de la matriz E se puede calcular al utilizar la expansión de Laplace en menores.
bo
Aj A2
0
0
1
(Ai +
b o(A3 + bo
A 2) A
0
i
A2
(A3
O
— (Ai
+
A 4)
1
~¿o(A3
bo A3 A4 bo
-(A i
bo A3 A4
A 4)
1
A i A2
O
0 bo + Á2) Áj Á 2
A i A2
1*1 =
+
(Ai
+
^ o( A 3
1
0 A4)
-(A i
-(A i +
0
Ai
A 2)
A 2)
1
+
A4 )
0
A 2)
1
A4)
~^o(A3 +
0 +
A2 +
A 2)
bo A3 A4 bo
bo A3 A4 0 0 bo
b0A3 A4 3 + A4)
— ¿>o(A
0 ¿0A3A4
= A iA 2 Í >0 — (A] A2 + AiA 2)¿o(^3 + A4) + Ai A2 ¿>0(^3 + 2 A3 A4 + A4) — A1 A2 6 0 A3 A4 + (Ai + Ai A2 + A2)/?o A3A4 — í>o(^i "b A2)(A3 + A4)AsA4 + ¿J0A3A4 ¿o(A, A2
A] A2 A3
Ai A2 A3
Ai A2 A4
Ai A2 A4
+ Ai A2 A3 + Ai A2 A3 A4 + Ai A2 A4 + Ai A3 A4 + Ai A2 A3 A4 A2 A3 A4
Ai A3 A4
A2 A3 A4
Ai A3 A4
A2 A3 A4 d- A3 A4)
A l reacomodar los términos del segundo miembro de esta última ecuación, se obtiene |E| = ¿>o(A?A2 -
A ,
k \A3 -
A ,A 2 A 4
+ Ai A2 A3 + Ai A2 A3 A4 + A i A2 A3 A 4 + -A 1A 3 A 4 = =
—
-
d- A 2 A 3 A 4 -
A2 A3 A4 — Ai A2 A4
A i A2 A 4 — A2 A3 A 4 +
A ,A 3A 4
+
A ÍA2A3
A f A3 A4
A3A4)
A i A3 — A i A 4 +
A3 A 4 )( A 2 — A2 A3 — A2 A4 +
A3 A4)
¿ o ( A l — A 3 ) ( A l — A 4 X A 2 — A s ) ( A 2 — A4)
El determinante |E|no es cero si al menos A, = A3 o A, = A4 o A2 = A3 o A2 =A4. Por lotanto, E no es singular siy sólo si no ocurre cancelación entre A ( z ) y B(z). Esto es, siA ( z ) y B( z ) sonpolinomios coprimos, entonces |E| no es cero y EMexiste. Problema A-7-2 Suponga que en los polinomios A ( z ) y B( z ) no ocurre cancelación y que están dados por
A ( z ) = z 2 + a, z + a2 B ( z ) = b0z 2 + b í z + b2 Entonces la matriz de Sylvester E está dada por
a2 ü\
0
0
¿ti
b2 b1 bo
1 0
1
0
¿o
q2
b2 b1
www.FreeLibros.me
Enfoque de ecuaciones polinomiales para el diseño de sistemas de control
542
Capítulo 7
Se definen a (z ) = a 0z + «i
P (z ) = /30z + /3i D (z) = d0z3 + di z2 + d2z + d2 Muestre que si
a(z)A (z) + ¡3(z)B(z) = D(z) entonces a 0, a,, fa, y £¡, se pueden determinar al calcular M = E 'D donde O í
d i d 2
a0
M =
fa
d i d o
Solución
Primero se debe notar que
a(z)A (z) + (3(z)B(z) = ( a0z + a i )(z 2 + a¡z + a2) + {faz + fa ){baz2 + bt z + b2) = (a 0 + fab0)z3 + (a ! + a 0fli + fabo + fabi)z2 + (a ! ai + a 0a2 + fabi + fab2)z + a i« 2 + fab2
= D{z) = d0z3 + di z2 + d2z + d2 De donde,
d0 = ao + fabo d i
=
a i
+
a o fli
+
f a b o
+
f a b i
d 2 = a i f l i + a 0 fl2 + f a b i + f a b 2 d i — a i a 2 + fa b 2
Ahora se calcula E M . Ya que
a2 0 b2 0 ai ai fl2 bi b2 ao 1 ai bo fa fa 0 1 0 fa fa ai
cl2
Y
fa b2
ai ai +a 0a2 +
f a b i
ai
+
a0fli
a o
+
f a b o
+
f a b o
+
+ fa
b 2
f a b i
al comparar cada elemento del segundo miembro de esta última ecuación con d¿, d2, d-¡, y d0, respectiva mente, se tiene
di EM =
d,2 = D di do
www.FreeLibros.me
Capítulo 7
Problemas de ejemplo y soluciones
543
De donde, M = E 'D o los coeficientes de los polinomios a(z) y /3(z) se pueden determinar al multiplicar E _1 por D. Problema A-7-3 En el capítulo 6 se diseñaron sistemas de regulación y sistemas de control al utilizar un esquema de realimentación del estado observado. En sistemas de una entrada y una salida, la salida siempre es medible. Por lo tanto, en dichos sistemas se requieren observadores de orden mínimo, en lugar de observadores de orden completo. Considere el sistema de regulación diseñado mediante el enfoque de ubicación de polos combina do con el observador de orden mínimo. Las ecuaciones de la planta son
x(k + 1) = G x(k) + H u(k) y { k ) = C x(k) donde x es un vector de dimensión n. u(k) es un escalar, y y{k) es también un escalar. Se supone que la planta es de estado completamente controlable y completamente observable. Las ecuaciones de la planta se pueden rescribir como
xa{k + 1) x b(k + 1)
Goa Gba
y (A ) = [ l
0]
ab G bb
G
X a (k )
Ha
X b (k )
H*
u(k)
X a (k ) X b (k )
donde >'(k) = xa(k) es la variable de estado medible y xh(k) está formado por las variables de estado no medibles. La ecuación para el regulador observador (controlador) se pueden obtener de las ecuaciones (6-148). (6-149) y (6-159). reescritas
x b(k) -
(7-16)
= ij(A )
•ij(A + 1) = (Gw, - K , G aí,)*)(£) + [(Gftfc — Ke Gai^Ke + G ba
K e G aa) y{ k)
+ (H * - K e H J u i k )
u(k) = - K x(k)
(7-17) (7-18)
donde K es la matriz de ganancia de la realimentación del estado y K,. es la matriz de ganancia del observador. Se define
x(k) =
x^k) x b( k )
~y(k) ' x b(k)
donde x(k) es un vector de dimensión n y xh(k) es un vector de dimensión (n - 1) que consiste de las (n —1) variables de estado observadas. También se define K = [fc,
k,
Entonces Inecuación (7-18) es u( k) = -[Ay
k*]
y{k) x b(k)
= ~ k i y ( k ) - k b x b(k)
www.FreeLibros.me
(7-19)
Enfoque de ecuaciones polinomiales para el diseño de sistemas de control
544
Capítulo 7
Muestre que las ecuaciones del regulador (o controlador) pueden estar dadas por:
donde
a (z) = k* W (z)Q + F(z) P (z) = (Ai + kfcK e)F (z) + k6 W (z)P P = (Gw - K,G„b)Ke + Gt,a ~ K eGaa Q = H* - K , H a F(z) - \z\ - G4¡, + K e Gah\ = ecuación característica para el observador de orden mínimo (polinomio estable de grado n- 1)
W (z) = (z l - Gbb + Kc Gof,) _1 F(z) También muestre que el diagrama de bloques para el sistema de regulación puede estar dado como el que se muestra en la figura 7-15. Solución obtiene
Al tomar la transformada z de la ecuación (7-17), suponiendo condiciones iniciales cero, se
z-ñ(z) = (Gbb ~ KeGaí,)rj(z) + [(Gti - K ,G oi,)K„
+ Gba ~ K ' G aa]Y(z ) + (H„ - K eH„)U(z)
= (Gbb - K,G«,b)"n(z) + PY (z) + Q U(z) que se puede escribir como
(z l - Gbb + K eGab)i\(z) = PY (z) + Q U(z) Resolviendo esta última ecuación para
r | (z ),
se tiene
ij(z) = (z l - Gbb + Ke G„b)_1[PY(z) + Q í/(z)] Ya que
Plant
Figura 7-15
a(z)
P(z)
F(z)
FU)
Diagrama de bloques del sistema de regulación.
www.FreeLibros.me
(7-20) 7-20)
Capítulo 7
Problemas de ejemplo y soluciones
545
la ecuación ( 7-20) se escribe como sigue: (7-21)
í,(z ) = ^ [ P r ( z ) + Q tf(*)] Al sustituir la ecuación (7-16) en la ecuación (7-19), se obtiene
u(k) = - k t y ( k ) - k¡,[Ke>(A:) + -¡tf/c)] La transformada r de esta última ecuación da
U(z)
= -ki
Y(z) - M K ,F ( z )
(7-22)
+ t ,(z )]
Al sustituir la ecuación (7-21) en la ecuación (7-22) da
U(z) = - k i y (z ) - k fcK ,y ( z ) - ké ^ % p y ( z ) + q e/(z)] t(z) W (z)
= - k 67^ Q í/ (z )
ki + kf, K, + k t ^ ^ P F(z)
Y(z)
k„W (z)Q + F(z) - 1 U(z) F (z)
k\ + k„Kr + k „ ^ ^ P Y(z) F(z)
(7-23)
Al utilizar c*(z) y /3(r) definidos en el enunciado del problema, la ecuación (7-23) se puede escribir como: a (z )
u^=-Muiz)+
3 ( 2)
U iz )~ m
(7-24)
Y(z)
de donde se obtiene a (z ) r v _ _ PÍ£ l W F ( z ) (z ) F (z )
x
o bien
U(z) _ P (z) Y(z) a(z)
(7-25)
[Observe que F(z) es un polinomio estable. Por lo tanto, las dos F (r) se pueden cancelar.] La ecua ción (7-25) es la ecuación del regulador (controlador). El diagrama de bloques que representa a la ecuación (7-24) se vuelve el de la figura 7-15. (Este corresponde a un sistema regulador.) Si este diagrama de bloques se incorpora al sistema de control, se obtiene el diagrama de bloques de la figura 7-5. Problema A-7-4 F.n referencia al sistema de ejemplo discutido en la sección 7-3 (el sistema de regulación diseñado en el ejemplo 7-6) y al problema A-7-3. verifique que
a (z ) = k„W(z)Q + F (z) = z + 0.32
P (z) = (ki + k b Ke)F(z) + k b W(z)P = 24(z - 0.6667) Solución
En referencia al ejemplo 6-11. se tiene
\ (k + 1) = Gx(k) + H u{k) y(k) = Cx(*)
www.FreeLibros.me
Enfoque de ecuaciones polinomiales para el diseño de sistemas de control
546
Capítulo 7
donde
G=
1
0.2
0
1
0.02 0.2
H
,
C = [1 0]
De donde.
Gaa = 1,
Gah = 0.2,
H a = 0.02,
Gba — 0,
Gbb — 1,
H h = 0.2
Para la parte de ubicación de polos, la ecuación característica deseada fue
|z l - G +
HK| = z 2 - 1.2z + 0.52 = 0
La ganancia de realimentación del estado K para la ecuación característica deseada se obtuvo como
K = [8
3.2]
Por lo tanto,
kb = 3.2
*,=8,
Para la parte del observador de orden mínimo, la ecuación característica del observador fue
P =(Gbb - K eGab)K' + Gba — Ke G aa
=
(1 - 5 x 0.2) x 5 + 0 — 5 x l = - 5
Q = H b - Ke Ha = 0.2 - 5 X 0.02 = 0.1 F(z) = z
W(z) = (z - Gbb + KeGabT'Fiz) = (z - 1 + 5 x 0.2) ' z = 1 En consecuencia,
a(z) = kb'W(z)Q + F(z) = 3.2 x 1 X 0.1 + z
= z + 0.32 P (z) = ( * , + kbKe)F(z) + kbW (z)P
= (8 + 3.2 x 5)z + 3.2 x 1 x ( - 5 ) = 24z - 16 = 24(z - 0.6667) Problema A-7-5 Muestre que el diagrama de bloques de la figura 7-5 se puede modificar al que se muestra en la figura 7-16. Solución El diagrama de bloques de la figura 7-5 se puede modificar al de la figura 7-17. Ya que la función de transferencia pulso del lazo menor es
U(z) X (z )
1 ,
, £ Í£ ) _ i
F(z) “ (2)
F(z) al eliminar el lazo menor se obtiene el diagrama de bloques de la figura 7-16.
www.FreeLibros.me
Capítulo 7
Problemas de ejemplo y soluciones
Figura 7-16
Figura 7-17
547
Diagrama de bloques modificado.
Diagrama de bloques de la figura 7-5 modificado para tener un lazo menor.
Problema A-7-6 Considere una planta definida por
Y(z) U{z)
1 z2 + z + 0.16
Utilizando el enfoque de ecuaciones polinomiales, diseñe un sistema de control para esta planta basado en el diagrama de bloques mostrado en la figura 7-5. Suponga que la ecuación característica deseada es
H ( z ) = (z - 0.6 - ;0.4)(z - 0.6 + /0.4) = z 2 - 1.2z + 0.52 y que F(z) (el polinomio del observador de orden mínimo) es
F(z) = z Solución
En referencia a la figura 7-5, a(z) y f3(z) se determinan de la ecuación Diofantina siguiente:
a(z)A(z) + fi(z)B(z) = H(z)F(z) = D (z) donde
A ( z ) = z 2 + z + 0.16 B{z) = 1 D( z) = z3 - 1.2z2 + 0.52z
www.FreeLibros.me
Enfoque de ecuaciones polinomiales para el diseño de sistemas de control
548
Capítulo 7
La matriz de Sylvester E para este caso es 0.16 1 1 0
E =
0 1 0 0.16 0 1 1 0 0 1 0 0
La inversa de la matriz E se puede obtener como 0 0 1 0
0 0 0 1
1 0 -0.16 -1
-1 1 0.16 0.84
Observe que a(z) y (3(z) son polinomios de grado n — 1 =2-1 = I , o bien, a (z ) = a0z + a¡ /3(z) = /3„z + /Si Se definen
D
do d2 = di do
0 0.52 -1.2 1
M =
O] «0 0.
Entonces el vector M se determina a partir de M = E H D como sigue: -
M-E-D-
2.2
J j52 2.56
De donde cx(~) y ¡3(z) se determinan como a (z ) = z - 2.2
¡3yz) = 2.56z + 0.352 En referencia a la ecuación (7-12), el sistema diseñado tiene la función de transferencia pulso Y(z)/R(z \ siguiente:
Y(z) = K o B (z )= R (z) H (z)
V
1 - 1.2z + 0.52
A continuación se necesita determinar la ganancia K0de la figura 7-5. Se requiere que la salida cr estado establey(^) a una entrada escalón unitario sea uno, o lim y(k) = lim
z - 1
z
K0 =1 z — 1.2z + 0.52 z - 1
de donde se obtiene
Ko = 0.32 Por lo tanto, la función de transferencia pulso del sistema diseñado es:
Y(z) = 0.32 R (z ) z2 - 1.2z + 0.52 Un diagrama de bloques para el sistema diseñado se presenta en la figura 7-18. La respuesta al escaló." unitario del sistema diseñado se muestra en la figura 7-19.
www.FreeLibros.me
Capítulo 7
549
Problemas de ejemplo y soluciones
Figura 7-18
Diagrama de bloques del sistema diseñado en el problema A-7-6. Respuesta al escalón unitario
(5 0 o -....O' ......P
O o oc
p .... - -- -,
• i“
)OOQO(>e>o oo<
) 0-0Q-O-4
0
o
_i 0
Figura 7-19
5
10
15
20
25
30
35
40
Respuesta al escalón unitario del sistema diseñado en el problema A-7-6.
Problema A-7-7 En el problema A-6-17 se consideró el diseño de un sistema regulador donde la planta estaba definida por
x(k + 1) = Gx( k) + Hu( k)
(7-26)
y ( k ) = Cx( k)
(7-27)
donde
G =
0 0 -0 .5
1 0 - 0 .2
0 1 1.1
H =
0 0 1
www.FreeLibros.me
C = [0
1 0]
Enfoque de ecuaciones polinomiales para el diseño de sistemas de control
550
Capítulo 7
Se utilizó el enfoque de ubicación de polos para determinar la matriz de ganancia K de realimentación del estado tal que el sistema de regulación presente una respuesta del tipo de oscilaciones muertas para cualquier estado inicial. Se usó un observador de orden mínimo tal que la respuesta al error de observa ción fuera del tipo de oscilaciones muertas. Con el enfoque de ecuaciones polinomiales. diseñe un sistema de control equivalente para esta planta cusa configuración del diagrama de bloques sea la misma que la que se presenta en la figura 7-4. Obtenga la respuesta al escalón unitario y a la rampa unitaria del sistema diseñado. El período de muestreo T del sistema es de 0.2 segundos. Solución
En referencia al problema A-6-17. la ecuación característica deseada fue |zl - G + HK¡ = z3 = 0
Se define a
H {z) = z3 La ecuación característica del error de observación fue
Gbb + K ,G aí,|
¡zl -
= z2 = 0
Por lo tanto, se define a
F(z) = z2 A continuación se define la función de transferencia pulso Gp(z) de la planta
Gp(z) = C (z l - G ) [0
H
z 0] 0
1
0.5
= [0
1
O]-, zJ - 1. lz
1.
donde
-1 z 0.2
lz
0 -1 z - 1.1
-i
0 0 1
1 + 0.2z + 0.5
____________ B{z) + 0.2z + 0.5 A (z)
A (z) = z3 - l . l z 2 + 0.2z + 0.5 B(z) = z En consecuencia. a¡ = -1.1,
b0 = 0,
02 = bi = 0,
0.2,
a 3 = 0.5
¿>2=1,
¿3 = 0
En referencia a la figura 7-4, el diagrama de bloques para el presente sistema se puede dibujar como se muestra en la figura 7-20. El polinomio característico para el sistema completo (sistema con realimentación del estado ob servado) es
D (z) = H (z )F(z ) = z3 ■z2 = z5 Por lo tanto. d„ = 1 ,
d, = 0,
d 2 = 0,
d, = 0,
www.FreeLibros.me
d i = 0,
d5 = 0
Capítulo 7
Problemas de ejemplo y soluciones
551
Del diagrama bloques de la figura 7-20. la ecuación característica para el sistema es
a{z)A(z) + /3(z)B(z) = 0 En consecuencia, en el enfoque de ecuaciones polinomiales se tiene
a(z)A (z) + p(z)B(z) = H (z)F(z) o bien a (z )(z 3 - l . l z 2 + 0.2z + 0.5) + /3(z)z = z5 Para determinar la función de transferencia pulso /3(z)'a(z) del controlador, se resuelve esta ecuación Diofantina. Para el presente problema, n = 3 y la matriz de Sylvester E de 2n * 2n es de 6 - 6 como sigue: 0.5 0.2 -1.1 1 0 0
0 0.5 0.2 -1.1 1 0
0 0 0.5 0.2 -1.1 1
0 1 0 0 0 0
0 0 1 0 0 0
0 0 0 1 0 0
E 1se puede obtener fácilmente mediante M A T LA B. como se muestra a continuación. E = 0 .5 0 0 0
0
0
0
0
0
0 .2000
0 .5000
0
1.0000
0
0
- 1 .1 0 0 0
0 .2000
0 .5000
0
1.0000
0
1.0000
- 1 .1 0 0 0
0 .2000
0
0
1.0000
0
1.0000
- 1 .1 0 0 0
0
0
0
0
0
1.0000
0
0
0
2.0000
0
0
0
0
0
0
0
0
0
1.0000
1.1000
inv(E) ans =
0
0
0
0
0
1.0000
- 0 .4 0 0 0
1.0000
0.0000
0
- 0 .5 0 0 0
- 0 .5 5 0 0
2 .2000
0
1.0000
0
- 0 .2 0 0 0
- 0 .7 2 0 0
- 2 .0 0 0 0
0
0
1.0000
1.1000
1.0100
Para determinar a(z) y ¡3(z). primero se define
www.FreeLibros.me
Enfoque de ecuaciones polinomiales para el diseño de sistemas de control
552
Capítulo 7
ff(z)
Figura 7-20
Diagrama de bloques del sistema de control considerado en el problema A-7-7.
y entonces M se determina como M = E 'D la cual se puede calcular Fácilmente con M A T LA B como sigue: D = [0 ;0 ;0 ;0 ;0 ;1 ]; M = (¡n v(E))*D M = 0 1.1000
1.0000 - 0 .5 5 0 0 - 0 .7 2 0 0
1.0100 Ahora se determinan a(z) y ¡¡(:) como sigue: a (z ) = a0z1 + a¡z + a 2 = z2 + l . l z
P(z) = Poz2 + Piz +
p 2 =
1.01 z2 - 0.72z - 0.55
Por lo tanto, el controlador diseñado es
m
1.01 z2 - 0.72z - 0.55
a(z)
z2 + l . l z
Observe que esta función de transferencia pulso es la misma que la de la ecuación (6-283), la función de transferencia pulso del controlador observador obtenido cn el problema A-6-17. En referencia a la figura 7-20, la función de transferencia pulso en lazo cerrado es:
Y(z) R (z)
B {z ) A {z) 1 , P (z) B (z ) a{z ) A (z) K„
K 0a (z )B (z) H (z )F(z )
K 0a (z )B (z) + P(z )B (z )
K 0( z 2 + 1Az ) z z5
www.FreeLibros.me
K 0( z + 1.1) _
z3
Capítulo 7
Problemas de ejemplo y soluciones
553
Observe que la cancelación de z2 ocurre entre a(z)¡ 3(z) y // ( z) F( z) y el sistema es de tercer orden. [El sistema podría haber sido de orden (2« - 1) (o de quinto orden) si no hubiera cancelación.] Para determinar la ganancia A',h se impone la condición de que la salida en estado estable}-)30) a ia entrada escalón unitario sea igual a uno, es decir. ,i m y W , „ 1
z
, 2 .1K l = ,
Z
2 - 1
Por lo tanto.
K 0 = 0.4762 y la función de transferencia pulso en lazo cerrado es
Y ( z ) _ 0.4762(z + 1.1) R(z) z3
0.4762z + 0.5238 z3
El sistema es de tercer orden. La respuesta del sistema diseñado al escalón unitario se muestra en la figura 7-21. Observe que en la respuesta al escalón unitario la salida alcanza la unidad en tres períodos de muestreo. La respuesta del sistema diseñado a la rampa unitaria se presenta en la figura 7-22. El error al seguir la entrada rampa unitaria se puede calcular como sigue:
Y(z)
£ (z ) = R ( z ) - Y ( z )
R(z)
R(z )
0.4762z + 0.5238 \ . . = [ 1 ----------------p ------------- l £ ( z ) (z - l ) ( z 2 + z + 0.5238)
R(z)
_3 Respuesta escalón unitario
1.6
1.4
1.2
•o©o-oe oo ©OO 0-0
O O O OO o O Oo
OOO0OOOO©COt>-OO«
0.6 0.4 0.2 l_________ 1_
_ J ______________I__
10
Figura 7-21
15
20
25
30
35
40
Respuesta al escalón unitario del sistema diseñado en el problema A-7-7.
www.FreeLibros.me
554
Enfoque de ecuaciones polinomiales para el diseño de sistemas de control
Capítulo 7
R e s p u e s t a e s c a l ó n u n it a r io
\
4 ------------------------ p - --------------------- ,------------------------ ,--------------------
\
3.5
y / / 0
\
3 \
\
0
2.5 /
0
/ 0
0
\ \
'6
\
0
\
2
:
1
........
\
O
\
1.5
\
O
\ \
O
\ V
0.5 /
/ 0
✓ / -O .--0 --o ------------1
-1
10
5
20
15
k
Figura 7-22 Respuesta a la rampa unitaria del sistema diseñado en el problema A-7-7.
L a entrada rampa unitaria R ( z ) está dada por
R (z) =
Tz~1 (1 - z )
0.2z (2 - l )2
En consecuencia, .. ... z - 1 (z - l ) ( z 2 + z + 0.5238) 0.2z lim e{k) = hm ----------------- 5--------- -5 Z-1 z z (z - 1 ) = 0.5048 Por lo tanto, el error al seguir la entrada rampa unitaria es 0.5048, como se puede observar en la figura 7-22. Problema A-7-8 En referencia al problema A-7-7, considere la misma planta dada por las ecuaciones (7-26) y (7-27). (También refiérase al problema A-6-17.) Suponga que los polinomios H ( z ) y F ( z ) son los mismos que los utilizados en el problema A-7-7. AI emplear el enfoque polinomial, diseñe un sistema de control para la planta cuyo diagrama de bloques sea el mismo que el de la figura 7-5. Entonces obtenga la respuesta al escalón unitario y a la rampa unitaria del sistema diseñado. El período de muestreo T del sistema es 0.2 segundos. Solución
Para este problema
H (z)
__
3
F(z)
—
En referencia al problema A-7-7, la función de transferencia pulso G p(z) de la planta es
GP(z) =
z z3 - l . l z 2 + 0.2z + 0.5
www.FreeLibros.me
_ B {z ) A (z )
Capítulo 7
Problemas de ejemplo y soluciones
555
El diagrama de bloques para el presente sistema se muestra en la figura 7-23. La ecuación Diofantina para este problema es
a (z)A (z) + p (z )B (z ) = H (z )F{z ) o bien a (z )(z 3 - 1.1z2 + 0.2z + 0.5) + P(z)z = z5 Esta ecuación Diofantina se resolvió enel problema A-7-7 y el resultado fue
a(z) = z2 + l . l z P(z) = l.O lz 2 - 0.72z - 0.55 Por lo tanto, en referencia a la ecuación (7-12), la función de transferencia pulso Y(z)/R(z) está dada por
Y (z} = KoB{z)
R(z)
H{z)
o bien y (z )
KoZ
Ko
R (z)
z3
z2
Para determinar la ganancia Ka, se impone la condición de que la salida en estado establey(x) a la entrada escalón unitario sea igual a uno, es decir, l i m y ( & ) = lim - —
z
- ^
z z- 1
=
K0 =
1
En consecuencia,
K0 = 1 Por lo tanto, Y(z)/R(z) es n *)
R (z)
i z2
El sistema diseñado es de segundo orden. La respuesta al escalón unitario del sistema diseñado se mues tra en la figura 7-24. Observe que en la respuesta al escalón unitario la salida alcanza la unidad en dos períodos de muestreo.
Figura 7-23
Diagrama de bloques del sistema de control considerado en el problema A-7-8.
www.FreeLibros.me
Enfoque de ecuaciones polinomiales para el diseño de sistemas de control
556
Capítulo 7
R espu e sta a la ram pa unitaria
-
,------ 1 ---- .— i----- 1 ------ 1 -----1.6-------p ~r----------- 1 --------- 1 1.4
1.2
-
- ................
; .................... i ............................................i ............................................- ...................-
1 - o o o ó o a o o ó o o o o ó o o o o ó )o0 o0 -0-0 o m co >o noooooo ó n o o e é o e - o o a )
0 .6
-
0.4 ............
-
o.2 -.......... 0 i-e 0
;...........i........... .............
-
1 ------ 1 ------ 1 ------ i------ 1 ------ 1 ------ 1 -----5
10
15
20
25
30
35
40
k Figura 7-24
Respuesta al escalón unitario del sistema diseñado en el problema A-7-8.
La respuesta a la rampa unitaria se presenta en la figura 7-25. El error al seguir a la entrada rampa unitaria se puede calcular como sigue:
E (z ) = R(z) - Y(z) =
Y{z)
1■
(z - l)(z + 1) 1 1 - - J R (z ) = R(z)
= La entrada rampa unitaria R(z) es
R (z) =
Tz
0.2z
(1 - z- 1) 2
(z - l ) 2
En consecuencia, .
Z
lim e(k) = lim - ' ' z—1
- 1 (z - l) ( z + 1) z
z2
0.2z (z - 1):
= 0.4
Por lo tanto, el error al seguir a la rampa unitaria es 0.4, como se puede observar en la figura 7-25. Al comparar los sistemas diseñados en los problemas A-7-7 y A-7-8, el último sistema que utiliza la configuración del diagrama de bloques de la figura 7-5 presenta un desempeño superior. Problema A-7-9
Considere una planta definida por G (z ) =
z + 0.5 r* - z 2 + O.Olz + 0.12
www.FreeLibros.me
Capítulo 7
Problemas de ejemplo y soluciones
557
R espu e sta al e scalón un;tano
4
3.5
3
y ✓
2.5
£
^ y
X:
y
1.5 y
y ^
...............o ......................... o'
3'
o
y y y
y
o
y '"
■ o
y y
1
y y
0.5
0'
o
y
y
y o’
■
/ ............ y .............. y o y / o' y
0
5
10
15
20
k Figura 7-25
Respuesta a la rampa unitaria del sistema disertado en el problema A-7-8.
El período de muestreo T es de un segundo. Suponga que en el presente problema es importante tener error de seguimiento cero a una entrada rampa unitaria. Se quiere diseñar un controlador tal que el sistema de control tenga un comportamiento como el del sistema modelo cuya función de transferencia es 0.64c-0.512 (--2-1.2c + 0.52)(c-0.6) 0.64:-0.512
: 3-1.8;2+l.24~—0.312
(7-28)
(E l período de muestreo para este sistema también es un segundo.) Las respuestas al escalón unitario y a la rampa unitaria del sistema modelo G modclo se presentan en la figura 7-26 y 7-27, respectivamente. (El error en estado estacionario al seguir una rampa unitaria es cero, y el sobrepaso máximo en la respuesta al escalón unitario es de alrededor de 70%.) Solución Se va a suponer que el diagrama de bloques del sistema es el mismo que el de la figura 7-9. Para la planta dada.
A (z) = z3 - z2 + 0.012 + 0.12 B (z ) = z + 0.5 Por lo tanto.
a, = —1, ¿>0 = 0,
a2 = 0.01, ¿>, = 0,
a3 = 0.12
¿>2=1,
www.FreeLibros.me
¿>3 = 0.5
Enfoque de ecuaciones polinomiales para el diseño de sistemas de control
558
Respuesta al escalón unitario
2
1
!
!
!
!
1
-----1
1.8
-
a
(5
o 1 . 6 ....................° •...........................! ........................... : ............................ : oO
; ............................I ....................... -
1.4 -..........(........... i .......... i............i
-............ ......... -
o O
o o
-i
i
................... : ...................
O 0 0 0 o
O O o 0
............Ó " 3o °
: .................... ; .................. -
ó 0 0 0 ......... A ............
1 .2
3 o o o o < !t O o 0-0 4
0 .8 0.6
-
0 -
°
-
0.4 .........................................................
0.2 ...........
:........... i
I......... -
0é-9---- 1 ------ 1 ------ i------ i------ 1 ------ 1 ------ 1 -----0
5
10
15
20
25
30
35
40
k Figura 7-26
Respuesta al escalón unitario del sistema modelo GmoJclodado por la ecuación (7-28).
Respuesta a la rampa unitaria
//
/
/ /£ / .............
............ /* / /* y ................ yJ y.............. y/
V \ . \\ ; \
............. /
¿
0
^
___
5
10
15
20
k
Figura 7-27
Respuesta a la rampa unitaria del sistema modelo
www.FreeLibros.me
dado por la ecuación (7-28).
Capítulo 7
Capítulo 7
Problemas de ejemplo y soluciones
559
Es claro que no hay factores comunes entre A(z) y B(z). En este problema se puede seleccionar H t(z) como
H , { z ) = z2 - 1.22 + 0.52 Aquí se selecciona H¡(z) para cancelar una parte del denominador de G moddo. [Pero esto no es necesario. El requisito sobre H x(z) es que debe ser un polinomio estable de grado n -1 (en este problema n = 3). Existe una infinidad de selecciones posibles para H x(z).] Se define
H(z) = = (z + 0.5)(z 2 - 1.2z + 0.52) =
0 . 722 - 0.082
23 -
0.26
+
Ahora se escoge a F(z) como
F(z) = z2 [F ( 2) debe ser un polinomio estable de grado n - 1. En este caso, existe un sinnúmero de opciones.] Entonces D{z) es como sigue:
D ( z ) = F ( z ) H ( z ) = F ( z ) B ( z ) H i(z) =
0 . 724 - 0 . 0823 + 0 . 2622
25 -
Por lo tanto. = 1,
= -0.7,
di = 0.26,
dt = 0 ,
d o
d 2
= -0.08,
di =
0
Ahora se necesita resolver la ecuación Diofantina siguiente:
a(z)A(z) + P(z)B(z) = F(z)B(z)H¡(z) o bien
a(z)(z3 - z2 +
0 . 0 1 2 + 0.12) +
/3(z)(z + 0.5) =
2 5 - 0.724 - O.O8 2 3 + 0 .2 6 2 2
La matriz Sylvester de E de 6 x 6 para este problema es
ai 0 0 a2 ai 0 ai a2 Oi 1 a 1 a2 0 1 a1
0
b o
b
0
0
0
6 0_
0
1
b i
0
0
b 2
b i
0
6,
b 2
b i
b o
b x
b 2
1
0 12
0
0
0.5
0
0 01
0.12
0
1
0.5
0 .12
0
1
-1
0 .0 1
0 0
0.5
1
0 .0 1
0
0
1
0
1
-1
0
0
0
0
0
0
0
0
1
-
1
www.FreeLibros.me
Enfoque de ecuaciones polinomiales para ei diseño de sistemas de control
560
Capítulo 7
Mediante el uso de M A T LA B, E 1se puede obtener como sigue. E = 0.1200
0
0
0 .5000
0
0 .0100
0 .1 2 0 0
0
1.0000
0.5000
0 0
- 1 .0 0 0 0
0.0100
0.1200
0
1.0000
0 .5 0 0 0
1.0000
- 1 .0 0 0 0
0.0100
0
0
1.0000
0
1.0000
- 1 .0 0 0 0
0
0
0
0
0
1.0000
0
0
0
- 3 .8 4 6 2
1.9231
- 0 .9 6 1 5
0.4808
0.2596
0.3702
0
0
0
0
1.0000
1.0000
0
0
0
0
0
1.0000
2.9231
- 0 .4 6 1 5
0 .2308
- 0 .1 1 5 4
- 0 .0 6 2 3
- 0 .0 8 8 8
- 5 .7 6 9 2
2.8846
- 0 .4 4 2 3
0.2212
- 0 .1 2 0 6
- 0 .0 6 9 7
0.5192
0 .7404
0 .6198
inv(E) ans =
3.8462
0.9615
-1 .9 2 3 1
Se definen
ds dt di = d2 d¡ A Entonces ei vector M se puede obtener de
0 0 0.26 -0.08 -0.7 1
M =
«2 ai a0 02 0. 00
M = E ’D Los cálculos en M A T L A B de esta ecuación se muestran a continuación. D = [0 ;0 ;0 .2 6 ; —0 .0 8 ;—0 .7 ; 1]; M = (in v (E))*D M = -
0.1000 0.3000 1.0000 0 .0240
- 0 .1 1 8 0 0 .3100 Del vector M se obtiene los valores de las a y de las j3. a(z) y (3(z) se determinan como
a(z) = a0z2 + at z + a2 = z2 + 0.3z — 0.1 ¡3(z) = ¡3oz2 + /3tz + #> = 0.31z2 - 0.118z + 0.024
www.FreeLibros.me
Capítulo 7
Problemas de ejemplo y soluciones
561
Al usar estos polinomios a(z) y /3(z), Y(z)!V(z) es:
Y(z) _ F {z )B (z ) V{z) F(z )B (z )H ¡(z)
1
H ^z)
z2 - 1.2z + 0.52
Como l'(z)/R(z) es (0.64z- 0.5I2 )(z : - I.2z + 0.52) nu'.lclo
R (:)
l(- ) '
'
(r - 1.2z + 0.52 )(z - 0.6)
0.64z- 0.512 z-0.6 La función de transferencia pulso Y(z)/R(z) es
Y(z) R(=)
1.2z + 0.52
0.64z-0.512 z - 0.6
El sistema de control mediante la igualación a un modelo diseñado tiene el diagrama de bloque que se presenta en la figura 7-28o). Este diagrama de bloques se puede simplificar como se muestran en las figuras 7-28b) y c). fl(z)
Hz)/
(0.64z- 0.512)(z2- 1.2z +0.52)
LHz)
* (
z2
+0.3z -0.1 z2
2+ 0.5 z - z +0.01z +0.12
0.31z2- 0.118z +0.024 z2
(a)
(b)
W(z>
0.64z- 0.512 (z2- 1.2z +0.52)(z - 0.6)
Hz)
(c)
Figura 7-28 a) Diagrama de bloques del sistema de control mediante la igualación a un modelo diseñado; b) y c) diagramas de bloques simplificados.
www.FreeLibros.me
Ylz)
Enfoque de ecuaciones polinomiales para el diseño de sistemas de control
562
Capítulo 7
Como se estableció antes, G moddo //,(z) debe ser físicamente realizable. El grado del polinomio numerador de G modclo H¡(z) debe ser igual o menor que el grado del polinomio denominador de G moddo //¡(z). Esto significa que para
Y(z)
B(z)
polinomio en z de grado m
U(z)
A(z)
polinomio en z de grado n
donde A(z) y B{z) no tienen factores en común, y
modc'°
Bm(z)
polinomio en z de grado m
Aw(z)
polinomio en z de grado n
se debe tener
n' — m' > n - m Si esta condición no se cumple, lo mejor es modificar G modc,0 para que esta condición se cumpla y se pueda aplicar el presente enfoque.
P R O B LEM A S Problema B-7-1 Considere los polinomios A(z) y B(z) definidos por
A(z) = z2 + a, z + a2 = (z - Ai)(z - A2) = z 2 - (Ai + A2)z + Ai A2 B(z) = b-iZ + b2 = b(z - A3) = bz - b \ 3 donde b = b,. La matriz de Sylvester E se define como
E =
a2 0 b2 0 fli a2 b\ b2 1 ai 0 bt 0
1 0
0
Muestre que el determinante de E se puede obtener por
|E| = b (Ai — A3)(A2 — A3) Problema B-7-2 Considere la ecuación Diofantina siguiente:
a(z)A(z) + /3(z)B(z) = 1 donde
A(z) = z2 - 0.7z + 0.1 B(z) = z 2 + 0.2z - 0.24 a(z) =
ato z
+ ai
¡3(z) = |3oZ + /3i Resuelva esta ecuación Diofantina para a(z) y /3(z) y determine los coeficientes a 0, a,, ¡i0y /3,.
www.FreeLibros.me
Capítulo 7
Problemas
563
Problema B-7-3 Considere la planta Y(z)/U(z), donde r(* )
U(z)
B(z ) A (z)
Suponga que A(z) es un polinomio mónico en z de grado n y que B(z) es un polinomio en z de grado m. Suponga también que no hay factores comunes entre A(z) y B(z)\ esto es, la planta es de estado comple tamente controlable y completamente observable. Considere la siguiente ecuación Diofantina:
y(z)A(z) + p(z)B(z) = F(z )[H (z ) - A (z)} donde H(z) es el polinomio característico deseado para la parte de ubicación de polos y que F(z) es el polinomio característico deseado para el observador de orden mínimo. [ H(z) es un polinomio mónico de grado m y F(z) es un polinomio de grado (n - 1).] Muestre que esta ecuación Diofantina se resuelve para /3(z) y y(z), entonces al utilizar
se completará el sistema de regulación con realimentación del estado observado. Problema B-7-4 En el ejemplo 7-3 se diseñó un sistema de control tal que la ecuación característica para la parte de ubicación de polos era
H (z) = (z — 0.6 - ;0.4)(z - 0.6 + /0 .4) = z 2 - 1.2z + 0.52 y el polinomio característico deseado para el observador de orden mínimo era
F(z) = z La ecuación Diofantina dada por la ecuación (7-13) se resolvió y a(z) y ¡3(z) se determinaron como sigue:
a(z) = z + 0.32
0 (z ) = 24z - 16 La constante K0se determinó como 8. La figura 7-6a) muestra el sistema diseñado. Muestre que la señal de control u(k) puede estar dada por
u( k) = -0.32u( k - 1) - 24y ( k ) + 16y { k - 1) + 8r{k), ¡
k = 1 ,2 ,3 ,...
«(0) = -2 4 y (0 ) + 8r(0) Dibuje una gráfica de u(k) contra k cuando la entrada r(k) es una secuencia de escalón unitario. Problema B-7-5 Considere una planta definida por
x(k + 1) = G x(k) + Hu(fc) y(A:) = Cx(&) donde
G =
0 0 -0.16
1 0 0.84
0 1 0
H =
0 0 1
www.FreeLibros.me
C = [1
0
0]
Enfoque de ecuaciones polinomiales para el diseño de sistemas de control
564
Capítulo 7
La función de transferencia pulso para la planta se puede escribir como
Y(z) U(z)
B(z) A (z)
Determine los polinomios A(z) y B(z). A l emplear el enfoque de ecuaciones polinomiales, diseñe un sistema de control para la planta. Se desea que el diagrama de bloques del sistema diseñado sea el mismo que el de la figura 7-4. A l resolver la ecuación Diofantina
a(z)A (z) + (i(z)B(z) = F(z)H (z) suponga que H(z) y F{z) son, respectivamente, como sigue
H(z) = z \
F(z) = z2
Obtenga la respuesta al escalón unitario y a la rampa unitaria del sistema de control diseñado. E l período de muestreo T es de 1 segundo.
Problema B-7-6 Considere la misma planta que la del problema B-7-5. Al emplear el enfoque de ecuaciones polinomiales. diseñe un sistema de control para la planta. Utilice el diagrama de bloques de la figura 7-5. Suponga los siguientes H(z) y F(z):
F(z) = z2
H(z) = z3,
Obtenga la respuesta al escalón unitario y a la rampa unitaria del sistema de control diseñado. Suponga que el período de muestreo es 1 segundo.
Problema B-7-7 Considere la planta definida por
x(k + 1) = Gx(k) + Hu(k) y(k) = Cx(k) donde 0
G =
0 1 0 0 1
-0 .255 ] -0 .2
[ 1
0 0.5
H =
0 1
C = [1
0
0]
Diseñe un sistema de control para la planta. Para la parte de ubicación de polos, se desea tener tres polos de lazo cerrado en el origen, es decir,
H (z) = z3 y para la ecuación característica del observador de orden mínimo, se desea tener
F{z) = z2 Utilice el enfoque de ecuaciones polinomiales para el diseño.
Problema B-7-8 Considere la planta definida por
Y(z) U{z)~
0.6 z + 0.5 (z-1)2
www.FreeLibros.me
Capítulo 7
Problemas
565
Al usar el enfoque de ecuaciones polinomiales, para diseñar un sistema de control tal que el sistema se comporte como el modelo Gnlodclosiguiente:
Obtenga la respuesta al escalón unitario y a la rampa unitaria del sistema diseñado (que es el mismo que el modelo Gnloddo). El período de muestreo T es 1 segundo. Problema B-7-9 Considere la planta definida por
Y(z) 0.01873(2 + 0.9356) U(z) ~ (z - 1)(2 - 0.8187) Al utilizar el enfoque de ecuaciones polinomiales, diseñe un sistema de control tal que el sistema se comporte como el modelo G moddo siguiente: 0-32 modelo
_2_ p2z+ 0.52
Obtenga la respuesta al escalón unitario y a la rampa unitaria del sistema de control (que es el mismo que el modelo G moddo. El período de muestreo T es 0.2 segundos.
www.FreeLibros.me
8 Sistem as de control óptimo cuadrático
IN TRO D U CC IÓ N Los problemas de control óptimo son de gran interés para los ingenieros de control. Un sistema ce control óptimo — un sistema cuyo diseño “óptima” (minimiza o maximiza, según sea el casoi e. valor de una función seleccionada com o el índice de desempeño— difiere de uno ideal en que el primero es más alcanzable en presencia de restricciones físicas, mientras que el último bien puede ser un objetivo inalcanzable.
índices de desempeño. Al diseñar un sistema de control óptimo o un sistema regulador óp timo, se necesita encontrar una regla para determinar la decisión de control presente, sujeta a cieñas restricciones, para minimizar alguna medida de la desviación de un comportamiento ideal. Dicha medida es provista, generalmente, por el índice de desempeño seleccionado que es una función cu> c valor se considera una indicación de qué tanto se parece el desempeño del sistema real al desempeñe deseado. En la mayoría de los casos, el comportamiento del sistema se hace óptimo al escoger el vector de control u (k) de tal forma que el índice de desempeño se minimice (o maximice, dependien do de la naturaleza del índice de desempeño seleccionado). La selección de un índice de desempeñe apropiado es importante porque, en alto grado, determina la naturaleza del sistema de control óptime resultante. Esto es, que el sistema resultante sea lineal, no lineal, estacionario, o variante en el tiem po, dependerá de la forma del índice de desempeño. Por lo tanto, el ingeniero de control formula este índice en base a los requisitos que el sistema debe cumplir y lo toma en cuenta para determinar A naturaleza del sistema resultante. Los requisitos de diseño por lo regular no sólo incluyen especifica ciones de desempeño, sino también, para asegurar que sea físicamente realizable, restringen la forma del control a utilizar.
566
www.FreeLibros.me
Sección 8-1 introducción
567
El proceso de optimación no sólo debe proveer leyes de control óptimo y configuraciones de los parámetros, sino también debe predecir la degradación en el desempeño debido a cualquier des vío del valor mínimo (o máximo) de la función del índice de desempeño que resulta cuando se aplican leyes de control no óptimas. El escoger el índice de desempeño más apropiado para un problema dado es muy difícil, especialmente en sistemas complejos. El uso de la teoría de optimación en el diseño de sistemas ha sido problemático debido al conflicto entre la factibilidad analítica y la utilidad práctica al seleccio nar el índice de desempeño. Es preferible que el criterio para un control óptimo se origine desde un punto de vista práctico y no matemático. En general, sin embargo, la selección de un índice de desempeño implica un compromiso entre una evaluación útil del desempeño del sistema y un pro blema matemático. F o rm u la ció n de los p ro b le m a s d e optim ización. El problema de optimización de un sistema de control se puede formular si se tiene la siguiente información: 1. Ecuaciones del sistema 2. Clase de vectores de control permitidos 3. Restricciones en el problema 4. índice de desempeño 5. Parámetros del sistema La solución de un problema de control óptimo consiste en determinar el vector de control óptimo u (¿ ) dentro de la clase de vectores de control permitidos. Este vector u(/r) depende de 1. La naturaleza del índice de desempeño 2. La naturaleza de las restricciones 3. El estado inicial o salida inicial 4. El estado deseado o salida deseada Excepto en algunos casos, el problema de control óptimo puede ser muy complicado para obtener una solución analítica por lo que se tiene que obtener una solución por computadora. C u e stio n es co n c ern ien te s a la existen cia de las so lu c io n e s a los p ro b le m a s d e co n tro l óptim o. Se ha establecido que el problema de control óptimo, dada una condición inicial x(0), consiste en encontrar un vector de control permitido u(£) que transfiera al estado a la región deseada del espacio de estados y para el cual el índice de desempeño se minimiza. Es importante señalar que a veces una combinación particular de planta, estado deseado, índi ce de desempeño y restricciones, hacen que un control óptimo sea imposible. Esto es cuestión de requerir un desempeño más allá de las capacidades físicas del sistema. Las cuestiones que tienen que ver con la existencia de un vector de control óptimo son impor tantes, ya que sirven para informar al diseñador si un control óptimo es posible o no para un sistema determinado y dado un conjunto de restricciones. Dos de las cuestiones más importantes son aque llas acerca de la controlabilidad y observabilidad, que fueron presentadas en el capítulo 6.
www.FreeLibros.me
Sistemas de control óptimo cuadrático
568
Capítulo 8
C o m entarios acerca de los sistem as de control óptim o. El sistema cuyo diseño minimiza (o maximiza) el índice de desempeño seleccionado es, por definición, óptimo. Es evidente que el índice de desempeño, en realidad, determina la configuración del sistema. Es muy importante apuntar que un sistema de control que es óptimo bajo un índice de desempeño es, en general, no óptimo bajo otro índice de desempeño. Además, la realización en hardware de una ley de control óptimo en particular puede ser algo difícil y costosa. Así, puede ser inútil dedicar demasiados recursos para implantar un controlador óptimo que es el mejor en solamente algún sentido individual limitado. A menudo, un sistema de control se diseña para realizar una sola tarea que se especifica completamente de antema no. En vez de esto, se diseña para realizar una tarea seleccionada en forma aleatoria a partir de un repertorio de tareas posibles. Entonces, en los sistemas prácticos, puede ser mejor buscar una ley de control óptimo aproximada que no esté atada rígidamente a un solo índice de desempeño. Estrictamente hablando, se debe tratar que un sistema de control óptimo obtenido en forma matemática dé, en la mayoría de los casos, el desempeño mas alto posible bajo el índice de desempe ño dado y es más una herramienta de medición que un objetivo práctico. Además, antes de decidir s; se construye un sistema de control óptimo o algo inferior más simple, se debe evaluar con cuidaba U grado en el que el desempeño del sistema de control óptimo complejo excede al del subóptimo simple. Sólo si se puede justificar, no se debe construir un sistema de control óptimo extremadamen te complicado y costoso. Una vez que el grado de desempeño máximo se encuentra mediante el uso de la teoría de control óptimo, se debe hacer un esfuerzo para diseñar un sistema simple que se acerque al óptimo. Con esto en mente, se construye un sistema físico prototipo, se prueba, y se modifica hasta que se obtiene un sistema satisfactorio que tenga características de desempeño cercanas a las del sistema de control óptimo que se ha trabajado en teoría. Los problemas de control óptimo que se pueden resolver en forma analítica, dan una buena visión de las estructuras y algoritmos óptimos que se pueden aplicar a casos prácticos. Un ejemplo de un problema de control óptimo con solución analítica es el problema de control óptimo de siste mas lineales basados en índices de desempeño cuadrático. Los índices de desempeño cuadrático har sido muy utilizados en sistemas de control práctico com o una medida del desempeño del sistema. C o ntrol ó ptim o cuadrático.
Se considera un sistema de control definido por x ( k + 1) = G x ( k ) + H u (/t)
donde x(k) = vector de estado (vector-«) u(A) = vector de control (vector-r)
G = matriz de n x n H = matriz d e n x r En el problema de control óptimo cuadrático se desea determinar una ley para el vector de control u(&) tal que un índice de desempeño cuadrático se minimice. Un ejemplo de un índice de desempeño cuadrático es 1
1N ~ '
J = = -x *( N) Sx (N ) + - X [ x * ( k ) Q x ( k ) + u*(A t)Ru(A :)] www.FreeLibros.me 2 2 k={]
Sección 8-2 Control óptimo cuadrático
569
donde las matrices S y Q son matrices Hermíticas definidas positivas o semidefinidas positivas y R es una matriz Hermítica definida positiva. El primer término del lado derecho de esta última ecuación toma en cuenta la importancia del estado final. El primer término dentro de los corchetes de la sumatoria toma en cuenta la importancia relativa del error durante el proceso de control, y el segun do término toma en cuenta el gasto de energía de la señal de control. Se supone que el vector de control u (k) no está restringido. En la sección 8-2 se demostrará que la ley de control óptimo está dada por:
u(Jt)
= —K ( k ) x ( k )
donde K(k) es una matriz de r x n variante en el tiempo. Si N = entonces K(&) es una matriz constante de r x n. El diseño de sistemas de control basado en dichos índices de desempeño cuadrático depende de obtener la matriz K(/i). La característica principal de una ley de control óptimo basada en un índice de desempeño cuadrático es que es una función lineal del vector de estados x(k). Dicha realimentación del estado requiere que todos los estados estén disponibles para realimentación. Por lo tanto es ventajoso repre sentar al sistema en términos de las variables de estado medibles. Si no todas las variables de estado se pueden medir, se requiere estimar u observar las variables de estado no medibles. Entonces se utilizan las variables de estado estimadas u observadas para generar las señales de control óptimo. La ventaja de utilizar el esquema de control óptimo cuadrático es que el sistema diseñado será asintóticamente estable, excepto para algunos casos muy especiales. (Véase los problemas A -8-6 y A -8-7.) Existen diferentes enfoques para resolver los problemas de control óptimo cuadrático. En este capítulo se presenta un enfoque utilizado en general basado en la técnica de minimización emplean do multiplicadores de Lagrange. Para el problema de control óptimo cuadrático en estado estaciona rio, se presenta el enfoque de Liapunov. En la sección 8-3 se mostrará que existe una relación entre las funciones de Liapunov y los índices de desempeño cuadrático. Observe que cuando un sistema de control óptimo se diseña en el espacio de estados es impor tante verificar las características de respuesta en frecuencia. Algunas veces, se necesita una com pen sación específica para efectos de ruido. Entonces llega a ser necesario modificar la configuración óptima y aceptar una configuración subóptima, o puede llegar a ser necesario modificar el índice de desempeño.
Resumen del capítulo. La sección 8-1 presentó material introductorio. La sección 8-2 trata el problema de control óptimo cuadrático básico y su solución. La sección 8-3 se ocupa del problema de control óptimo cuadrático en estado estacionario. Aquí se incluye el enfoque de Liapunov para resolver el problema de control óptimo cuadrático. La sección 8-4 discute el control óptimo cuadrático de un sistema de seguimiento.
8-2 CO N TRO L Ó PTIM O CUADRÁTICO Los problemas de control óptimo cuadrático se pueden resolver mediante muchos enfoques diferen tes. En esta sección se resolverá el problema de control óptimo cuadrático básico mediante el m éto do convencional de minimización empleando los multiplicadores de Lagrange.
www.FreeLibros.me
Sistemas de control óptimo cuadrático
570
Capítulo 8
Problema de control óptimo cuadrático. El problema de control óptimo cuadrático se puede enunciar com o sigue. Dado un sistema de control lineal de tiempo discreto x(k + 1) = Gx(/c) + H u (/:),
x (0 ) = c
(8-1)
donde se supone que es de estado completamente controlable y donde
x(k) = vector de estado (vector-//) u(A) = vector de control (vector-/;) G = matriz no singular de n x n H = matriz de n x r encuentre la secuencia de control óptima u(0), u (l), u(2), . . . , u(N - 1) que minimiza un índice de desempeño cuadrático. Un ejemplo de índice de desempeño cuadrático para un proceso de tiempo finito (0 < k < N) es 1
1 N~l
J = r x *( N) Sx (N ) + - 2 [x*(fc)Qx(/c) + u*(& )Ru(/c)]
(8-2)
¿ k= 0
donde Q = matriz Hermítica (o matriz real simétrica) definida positiva o semidefinida positiva de n x n R = matriz Hermítica (o matriz real simétrica) definida positiva de r x r S = matriz Hermítica (o matriz real simétrica) definida positiva o semidefinida positiva de n x n Las matrices Q, R y S se seleccionan para valorar la importancia relativa de la contribución en el desempeño debida al vector de estado x(k) (k = 0, 1, 2 ,. . . , N - 1), a! vector de control u(k) (k= 0, 1, 2, . . . , N - 1), y al estado final x(N), respectivamente. El estado inicial del sistema está en un valor arbitrario x(0) = c. El estado final x((V) puede ser fijo, en cuyo caso el término ^x*(N)Sx(N) se elimina del índice de desempeño de la ecuación (8-2) y en su lugar se impone la condición terminal x(N) = xf, donde x¡ es el estado terminal fijo. Si el estado terminal x(N) no es fijo, entonces el primer término en la ecuación (8-2) representa el peso de la contribución en el desempeño debida al estado final. Observe que en el problema de minimización, la inclusión del término \ x*(N)Sx(N) en el índice de desempeño J implica que se desea que el estado final x(Afi esté tan cerca del origen com o sea posible.
Solución mediante el método convencional empleando multiplicadores de Lagrange. El problema de control óptimo cuadrático es un problema de minimización que involucra una función de varias variables. Por lo tanto, se puede resolver por el método de minimización convencional. El problema de minimización sujeto a restricciones se puede resolver al añadir dichas restricciones a la función a minimizar mediante el uso de los multiplicadores de Lagrange. En el problema de minimización presente, se minimiza J que está dado por la ecuación (8-2), repetida como: 1
1
^
^ k =0
J = - x * ( N ) S x ( N ) + - 2 [x*(A:)Qx(A:) + u*(/c)R u(fc)]
www.FreeLibros.me
(8-3)
Sección 8-2 Control óptimo cuadrótico
571
c u an d o e stá su je ta a re s triccio n es e sp e c ifica d a s p o r la ec u a c ió n (8 -1 ),
x(k + 1) = G x(k) + Hu(£:)
(8-4)
donde k = 0, 1, 2 , . . . , N - 1, y donde la condición inicial del vector de estado se especifica como x(0) = c
(8-5)
Ahora, al emplear un conjunto.de multiplicadores de Lagrange A( 1), A( 2) , . . . , A(Aj, se define un nuevo índice de desempeño L como: 1
1 N~l
4
2 k=o
L = - x * ( N ) S x ( N ) + - 2 {[x*(A:)Qx(A:) + u*(fc)Ru(£:)] + k*( k + l)[G x (£ ) + H u (£ ) - x(k + 1)] + [G x(£) + H u(/c) - x(k + 1)]*A(& + 1)}
(8-6)
La razón para escribir los términos que involucran el multiplicador de Lagrange en la forma en que se muestra en la ecuación (8-6) es para asegurar que L = L*. (L es una cantidad escalar real.) Observe que A *(0)[c - x(0)] + [c - x(0)]*A (0) se puede sumar al índice de desempeño L. Sin embargo, no se hará esto, para simplificar la presen tación. Es bien sabido el hecho de que minimizar la función L definida por la ecuación (8-6) es equivalente a minimizar a J definida por la ecuación (8-3) cuando está sujeta a las mismas restriccio nes definidas por la ecuación (8-4). Para minimizar la función L, se necesita diferenciar L respecto a cada uno de los componentes de los vectores x(k), u(A) y X(k) e igualar los resultados a cero. Sin embargo, desde el punto de vista computacional, es conveniente diferenciar a L respecto a
( k),
( k), y
( k), donde y, ( k), j,¡ ( k ) y
( k ) son los com plejos conjugados de x¡(k), u:(k), y A,{k), respectivamente. (Observe que la señal y su com plejo conjugado contienen la misma información matemática.) Por lo tanto, se tiene f)í dXj(k)
= 0,
dL = 0, dU¡(k) dL = 0, dkt{k)
i = 1 , 2,
k = 1,2,... ,N
i = l , 2, . . . , r ; k = 0,1 ,..., N - 1 i = 1 , 2 , . . . ,n; k = 1 , 2 , . . . , N
Estas ecuaciones son condiciones necesarias para que L tenga un mínimo. Observe que las expresio nes simplificadas para las derivadas parciales anteriores son
dL
=
0,
k = 1,2,..., N
dL = dü(k)
0,
k =0
0,
k = 1,2,...,N
r)I dL = 7 tt = dk(k)
,
www.FreeLibros.me
(8-7)
—1
(8-8)
(8-9)
Sistemas de control óptimo cuadrático
572
Capítulo 8
En referencia al Apéndice A (véanse los problemas A -7 y A -8) para la diferenciación parcial de formas cuadráticas complejas y bilineales con respecto a variables vectores, se tiene —L x * A x = Ax <9x
y
-^rx*A y = Ay
dx
Entonces, las ecuaciones (8-7), (8-8) y (8-9) se pueden obtener como:
- ^ ¡ r = 0:
Qx(fc) + G *X (* + 1) - X (*) = 0,
O X (K j
= 0:
Sx( N) - A(N) = 0,
^ - = 0:
R u (* ) + ü * \ { k + 1) = 0,
dL = 0: d\(k)
Gx{k - 1) + Hu(Jfc - 1) - x{k) = 0 ,
^
y
k = 1,2,... ,N - 1
(8-10)
(8-11)
k = 0 ,í,...,N -l
(8-12)
Jfc = 1, 2, . . . , AT
(8-13)
La ecuación (8-13) es simplemente, la ecuación de estados del sistema. La ecuación (8-11) especifica el valor final del multiplicador de Lagrange. Observe que el multiplicador de Lagrange \(k) se llama a menudo covector o vector adjunto. Ahora se simplificarán las ecuaciones obtenidas. D e la ecuación (8-10) se tiene
\ ( k ) = Qx(k) + G* k (k + 1),
k = 1,2,3,..., N - 1
(8-14)
con la condición final A(7V) = Sx(jV). Al resolver la ecuación (8-12) para u(k) y al observar que R"1existe, se obtiene u(&) = - R -1 H*X(& + 1),
k = 0,1,2,... ,N — 1
(8-15)
La ecuación (8-13) se puede rescribir como
x ( k + 1) = Gx(k) + Hu(k),
k = 0,1,2,..., N - 1
(8-16)
que es simplemente la ecuación de estado. Al sustituir la ecuación (8-15) en la ecuación (8-16) resulta en
x ( k + 1) = Gx(k) -
+ 1)
(8-17)
con la condición inicial x(0) = c. Para obtener la solución al problema de minimización, se necesitan resolver las ecuaciones (8-14) y (8-17) en forma simultánea. Observe que para el sistema de ecuaciones, la ecuación (8-16), la condición inicial x(0) está especificada, mientras que para la ecuación del multiplicador de Lagrange. la ecuación (8-14), la condición final X(N) está especificada. Por lo tanto, el problema se convierte en un problema con dos puntos de valores en la frontera. Si el problema de dos puntos de valores en la frontera se resuelve, entonces el valor óptimo para el vector de estado y para el vector de multiplicadores de Lagrange se pueden determinar y el vector de control óptimo u(k) se puede obtener en la forma de lazo abierto. Sin embargo, si se emplea la ecuación de Riccati, el vector de control óptimo u(¿) se puede obtener en la forma de lazo cerrado o realimentado:
www.FreeLibros.me
Sección 8-2 Control óptimo cuadrótico
573
u(Jfc)
=
- K (k)x(k)
donde K (k) es la matriz de realimentación de r * n. A continuación, se obtendrá el vector de control óptimo u (k) en la forma de lazo cerrado obteniendo, primero, la ecuación de Riccati. Al suponer que A(£) se puede escribir en la forma siguien te:
\ ( k ) = P (k)x(k)
(8-18)
donde P(£) es una matriz Hermítica de n x n (o una matriz simétrica real de n x ri). Al sustituir la ecuación (8-18) en ia ecuación (8-14) resulta en P (k)x(k) = Qx(k) + G*P(fc + 1)x(k + 1)
(8-19)
y al sustituir la ecuación (8-18) en la ecuación (8-17) da
x(k + 1) = G x(k) - H R 1H*P(/c + l) x ( £ + 1)
(8-20)
Observe que la ecuación (8-19) y (8-20) no involucra a 2fk) y, por lo tanto, se ha eliminado A(k). El proceso empleado aquí se llama transformación de Riccati. Dicha transformación es de una importan cia extrema para resolver el problema de valores en la frontera con dos puntos. De la ecuación (8-20) se tiene [I + H R 1H*P(/c + l)]x(/c + 1) = G x (k )
(8-21)
Para sistemas de estado completamente controlable, se puede demostrar que P(£ + 1) es definida positiva o semidefinida positiva. Para una matriz P(k + 1) al menos semidefinida positiva se tiene |I„ + H R
H *P (¿ + 1)| = |I, + H*P(& + 1 )H R -‘| = |Ir + R M H *P(/t + 1)H| = |R"'| |R + H*P(A: + 1)H| í 0
donde se utilizó la relación |I„ + AB| = - | I r+ BA|,
A = matriz de n * «, B = matriz de r x n
(Véase el apéndice A.) Así, la inversa de I + H r H * P ( í : + 1) existe. En consecuencia, la ecuación (821) se puede escribir como:
x{k + 1) = [I + H R - ‘ H*P(A: + lJJ-'G xO t)
(8-22)
Al sustituir la ecuación (8-22) en la ecuación (8-19), se obtiene P(*)xOfc) = Q x(k) + G*P(k + 1)[I + H R -1 H*P(& + 1 )]M G x(k)
o bien {P (k) - Q - G*P(A: + 1)[I + H R -1 H*P(/c + l ) ] “'G }x(lc) = 0 Esta última ecuación se debe cumplir para toda x(k). Por lo tanto, se debe tener P (k) = Q + G*P(k + 1)[I + H R 1H*P(/c + 1 )]_1 G La ecuación (8-23) se puede modificar. Al utilizar el lema de inversión de matrices
(A + BD) 1 = A 1 - A
B (I + DA
www.FreeLibros.me
B)
DA 1
(8-23)
Sistemas de control óptimo cuadrático
574
Capítulo 8
y al hacer las sustituciones A = I,
B = HR
D = H*P(& + 1)
se obtiene [I
+ H R 1 H*P(& + 1)]-' = I - H R ~‘[I + H *P (le + lj H R - ' J - ' H * ? ^ + 1) = I - H [R + H*P(A: + l ) H ] _1H*P(jt + 1)
En consecuencia, la ecuación (8-23) se puede modificar a P (k) = Q + G *P (k + 1)G
~ G * P ( k + 1)H [R + H*P(A: + l ) H ] ' ‘ H*P(/c + 1)G
(8-24)
La ecuación (8-24) o su equivalente [tal como la ecuación (8-23)] se denomina ecuación deRiccati. En referencia a la ecuación (8-11) y (8-18), al observar que k = N se tiene
P{N)x{N) = \ ( N ) = Sx(N) o bien P(/V) = S
(8-25)
Por lo tanto, las ecuaciones (8-23) y (8-24) se pueden resolver hacia atrás desde k = Nhastak = 0. Esto es, se pueden obtener P(/V), P(N - 1 ) , . . . , P(0) al comenzar desde P(N), el cual es conocido. En referencia a las ecuaciones (8-14) y (8-18), el vector de control óptimo u(£), dado por la ecuación (8-15), se escribe como u (* ) = - R
H *k(k + 1) = - R ^ H ^ G * ) " 1! ^ ) - Qx(k)]
= - R _1 H * (G * )“'[P(/c) - Q]x{k) = -K (Jt)x(Jt)
(8-26)
donde K(/c) = R _1 H * (G * )_1[P(/c) - Q]
(8-27)
La ecuación (8-26) proporciona la forma en lazo cerrado, o forma realimentada, para el vector de control óptimo u(¿). Observe que el vector de control óptimo es proporcional al vector de estado. N ote que el vector de control óptimo u(k) se puede escribir de varias formas. En referencia a las ecuaciones (8-18) y (8-22), u(¿) se puede escribir como u(Jfc) = —R
H * \ ( k + 1) = - R
H *P (k + 1)x(k + 1)
= —R 1H*P(fc + 1)[I + H R '1H*P(A: + l ) ] 1Gx(A:) = —R ' 1H *[P _1(/c + 1) + H R '1H *]”1Gx(k) = - K (k)x(k)
(8-28)
donde
K(k) = R ' 1H *[P _1(^c + 1) + H R '1 H * ] '1G Una forma ligeramente diferente del vector de control óptimo u(£) se puede dar com o
www.FreeLibros.me
(8-29)
Sección 8-2 Control óptimo cuadrático
575
u ( * ) = - [ R + H *P(A : + 1 ) H ] -1H * P ( & + l)G x (Jfc)
(8-30)
= - K (* )x (* )
donde K (A :) = [ R + H *P(/c + 1 ) H ] _1H * P ( * + 1 )G
(8-31)
La equivalencia entre las expresiones para el vector de control óptimo u(Át) que están dadas por las ecuaciones (8-26), (8-28) y (8-30), se puede mostrar fácilmente; véase el problema A -8-1. Las ecuaciones (8-26), (8-28) y (8-30) indican claramente que la ley de control óptimo requiere la realimentación del vector de estado a través de la ganancia variable en el tiempo K(k). La figura 8-1 muestra el esquema de control óptimo del sistema regulador basado en el índice de desempeño cuadrático. Es importante apuntar que la ganancia variante en el tiempo K(&) se puede calcular antes de que el proceso comience, una vez que la matriz de estados del sistema G, la matriz de control H, y las matrices de peso Q, R y S estén dadas. En consecuencia, K (k) se puede precalcular fuera de línea y almacenarse para su uso posterior. Observe que el estado inicial x(0) no entra en los cálculos para K(A). El vector de control óptimo u(£) en cada etapa se puede determinar inmediatamente al premultiplicar el vector de estado x(k) por -K(A). Observe que una propiedad de la matriz de ganancia de realimentación K (k) es que casi es constante, excepto cerca del fin del proceso en k = N. (Véase el ejemplo 8-1 y el problema A -8-3.)
Evaluación del índice de desempeño mínimo.
A continuación se evaluará el valor mínimo
del índice de desempeño:
Al premultiplicar ambos lados de la ecuación (8-19) por \*(k), se tiene x * ( * ) P ( * ) x ( * ) = x * ( k ) Q x ( k ) + x * ( k ) G * P ( k + í ) x ( k + 1)
Precálculo de K (k)
x(Ar) í>
-K(Ar)
Figura 8-1
= £ >
H
í>
z 'l
Sistema regulador óptimo basado en un índice de desempeño cuadrático.
www.FreeLibros.me
c>
S istemas de control óptimo cuadrático
576
Capítulo 8
Al sustituir la ecuación (8-21) en esta última ecuación, se obtiene x*(&)P(&)x(A:) = x*(k)Qx(k) + x*(k + 1)[I + H R ' H * P ( / c + 1)]*P(A: + l)x (/c + 1) = x*(k)Qx(k) + x*(k + 1)[I + P(k + 1 )H R _1 H*]P(& + l)x(A: + 1) Por lo tanto,
x*(k)Qx(k) = x*(k)P(k)x(k) — x*(k + 1)P(& + 1 )x(/c + 1) - x * ( k + l)P(>t + 1)HR 1H*P(& + l)x (tt +
1)
(8-32)
También, de las ecuaciones (8-15) y (8-18) se tiene
u(k) = —R-'H*P(A: + l)x(A: + 1) Por lo tanto,
u*(k )Ru(k ) = [ - x * ( k + 1)P(A: + 1 )H R 'I] R [ - R ' 1H*P(& + 1 )x(k + 1)] = x*(k + l)P(k + 1)HR 'H*P(A: + l)x ()t + 1)
(8-33)
Al sumar las ecuaciones (8-32) y (8-33), se tiene
x*(k)Qx(k) +
u*(A :)R u(fc) =
x*(k)P(k)x(k) - x*(k + l)P(fc + l)x(/c + 1)
(8-34)
Al sustituir la ecuación (8-34) en la ecuación (8-3), se tiene 1
1 N~1
¿
¿ *=0
Jmin = ~ x*(N)Sx(N) + - E = | x*(N)Sx(N)
+ |[x * ( 0 )P ( 0 )x ( 0 ) - x * ( l ) P ( l ) x ( l ) + x * ( l ) P ( l ) x ( l )
- x * (2 )P (2 )x (2 ) = |x * ( A ) S x ( N )
[x*(k)P(k)x(k) - x*(k + 1)P(& + l)x(fc + 1)]
+ • • • + x*(N - l)P (iV - í ) x ( N - 1) - x *( N) P( N) x( N )] + |x * ( 0 ) P (0 ) x (0 ) - ^ x * ( N ) P ( N ) x ( N )
(8-35)
Observe que de la ecuación (8-25) se tiene P(N) = S. En consecuencia, la ecuación (8-35) es /m,n = |x * ( 0 ) P (0 ) x (0 )
(8-36)
Así, el valor mínimo del índice de desempeño J está dado por la ecuación (8-36). Éste es función del P(0) y del estado inicial x(0). Ejemplo 8-1 Considere el sistema de control de tiempo discreto definido por
x(k + 1) = 03679x(k) + 0.6321 u(k),
x(0) = 1
Determine la ley de control óptimo que minimiza el índice de desempeño siguiente:
J = ~ [*(1 0 )]2 + \ 2 [x2(k) + u\k)\ 4-
¿ k =U
www.FreeLibros.me
Sección 8-2 Control óptimo cuadrótico
577
Observe que en este ejemplo S = l , ( ? = l y / ? = 1 . También determine el valor mínimo del índice de desempeño J. En referencia a la ecuación (8-23), P(k) se obtiene como sigue:
P(k) = 1 + (0.3679 )P(k + 1)[1 + (0.6321)(1)(0.6321)P(Á: + 1)] “^O.SÓTQ) que se puede simplificar a
P(k) = 1 + 0.1354P(A: + 1)[1 + 0.3996 P(k + l) ] ’ 1 La condición de frontera para P(k) está especificada por la ecuación (8-25), y en este ejemplo
P(N) = />(10) = 5 = 1 Ahora se calcula P(k) de atrás hacia adelante desde k = 9 hasta k = 0:
P{9) = 1+ 0.1354 x 1(1 + 0.3996 x 1)“' = 1.0967 P(8) = 1+ 0.1354 x 1.0967(1 + 0.3996 x 1.0967)“' = 1.1032 P( 7) = 1+ 0.1354 x 1.1032(1 + 0.3996 x 1.1032)“' = 1.1036 P (6) = 1+ 0.1354 x 1.1036(1 + 0.3996 x 1.1037)“' = 1.1037
P(k) = 1.1037,
k = 5, 4, 3, 2, 1, 0
Observe que los valores de P(k) se aproximan rápidamente al valor en estado estacionario. E l valor en estado estacionario Pss se puede obtener de
Pss = 1 + 0.1354P„(1 + 0.3996P„)“' o bien
0 . 3 9 9 6 + 0.4650P„ - 1 = 0 Al resolver esta última ecuación para P „, se tiene P y,= 1.1037
o
-2.2674
Como P(k) debe ser positiva, se encuentra que el valor en estado estacionario de P(k) es 1.1037. La ganancia de realimentación K(k) se puede calcular de la ecuación (8-27):
K(k) = (1)(0.6321)(0.3679)~'[P(A:) - 1] = 1.7181[P(A:) - 1] Al sustituir los valores de P(k) obtenidos, se obtiene
K(10) = 1.7181(1 - 1) = 0 /C(9) = 1.7181(1.0967 - 1) = 0.1662 /¡f(8) = 1.7181(1.1032 - 1) = 0.1773
K{1) = 1.7181(1.1036 - 1) = 0.1781 K{ 6) = K{ 5) = • • • = K{Q) = 0.1781 La ley de control óptimo está dada por
u(k ) = - K(k)x(k ) Yaque
x( k + 1) = 0.3679;t(fc) + 0.6321«(A:) = [0.3679 - 0.6321A:(/c)]*(fc)
www.FreeLibros.me
Sistemas de control óptimo cuadrátíco
578
Capítulo 8
se obtiene
*(1) = [0.3679 - 0.6321A:(0)]x(0) = (0.3679 - 0.6321 x 0.1781) x 1 = 0.2553
x(2) = (0.3679 - 0.6321 x 0.1781) x 0.2553 = 0.0652 x(3) = (0.3679 - 0.6321 x 0.1781) x 0.0652 = 0.0166 *(4) = (0.3679 - 0.6321 x 0.1781) x 0.0166 = 0.00424 Los valores de x(k) para k= 5, 6 , . . . , 10 se aproxima a cero rápidamente. Ahora, la secuencia de control óptimo u(k) se obtiene como sigue:
w(0) = -K (0 )x (0 ) = -0.1781 x 1 = -0.1781 u (l)
= - t f ( l ) x ( l ) = -0.1781 x 0.2553 = -0.0455
u(2) = -K(2)x{2) = -0.1781 x 0.0652 = -0.0116 k(3) = -K(3)x(3) = -0.1781 x 0.0166 = -0.00296 w(4) = —A2(4)jc(4) = -0.1781 x 0.00424 = -0.000756
k = 5,6, . . . , 1 0
w(£) = 0,
Las gráficas de los valores de P(k), K(k), x{k) y u(k) se dibujan en la figura 8-2. Observe que los valores de P(k) y K(k) son constantes excepto para las etapas finales. Por último, el valor mínimo del índice de desempeño J se obtiene a partir de la ecuación (8-36 ■
/m,n = i**(0 )P (0 )x (0 ) = i ( l X 1.1037 x 1) = 0.5518
m ij
1.0 0.5 J
I
I
I
I
I
I
L 8
10
*(*)
1. 0 ' 0.5
-L-«
4 4-4 ¿ 4 4 6
8
10
Figura 8-2 Gráficas de P(k) contra k, x(k) contra k, y u(k) contra k K(k) contra k para el sistema considerado en el ejemplo 8-1.
www.FreeLibros.me
Sección 8-2 Control óptimo cuadrático
579
Enfoque de M A T L A B a la solución de este problema ejemplo. Un programa de M A T L A B se puede escribir fácilmente para resolver este problema ejemplo. E l programa 8-1 de M A T L A B muestra un posible programa. [En este programa se utilizó la ecuación (8-24) para el cálculo de P(¿).]
Programa de M ATLAB 8-1 C = 0.3679; H = 0.6321; Q = 1; R = 1; s = 1; xO = 1; N = 11; p (NI) = S; x(1) = 1; Pnext = S; for i = N-1: -1: 1, P = Q + G'*Pnext*G - G'*Pnext*H*inv(R+H'*Pnext*H)*H'*Pnext*G; P( ) = P; Pnext = P; end for i N: -1:1, K = inv(R)*H'*inv(G')*(p(¡) - Q); k( t = Kend for i = 1:N-1, xnext = (G-H*k(i))*x(i); x( + 1) = xnext; end for i = 1:N, u( ) = -k(i)*x(¡); end
Para imprimir los valores de PO, P I , . . . , PI O [que corresponden a p(1), p( 2) , . . . , p(l 1)], KO, K l, . . . , K10 [que corresponden a k(1), k(2), . . . , k(11)], xO, x l, . . . , x l0 [que corresponde a x(1), x(2), . . . , x(11)], y uO, u1, . . . , ulO [que corresponden a u(0), u (1), . . . , u (1 0 )u (9 ), u(2). . . , u (1 1 )]. se introduce el comando de impresión como sigue.
% ***** Impresión de P, K, x y u *****
I!
x'
u']
I 1.1037
0.1781
1.0000
-0 .1 7 8 1
1.1037
0.1781
0.2553
- 0 .0 4 5 5 - 0 .0 1 1 6
1.1037
0.1781
0.0652
1.1037
0.1781
0 .0166
- 0 .0 0 3 0
1.1037
0.1781
0.0042
- 0 .0 0 0 8
1.1037
0.1781
0.0011
- 0 .0 0 0 2
1.1037
0.1781
0.0003
- 0 .0 0 0 0 - 0 .0 0 0 0
1.1036
0.1781
0.0001
1.1032
0.1773
0.0000
- 0 .0 0 0 0
1.0967
0.1662
0.0000
- 0 .0 0 0 0
1.0000
0
0 .0 0 0 0
0
www.FreeLibros.me
Sistemas de control óptimo cuadrático
580
Capítulo 8
La primera columna de la matriz, M proporciona desde arriba hacia abajo los valores de PO, P l, . . ., P l 0. De la misma manera, la segunda, tercera y cuarta columnasproporcionan los valores de K0, K1, .. . ,K10; xO, x 1 , . . ,, x l 0; y uO, u1, . . . , u 1 0; respectvamente. Probl e ma de control óptimo cuadrático discreto. A continuación se considera el control óptimo cuadrático de un sistema de control discreto. Considere el sistema de control en tiempo continuo x = Ax + Bu
(8-37)
donde u (t) = u(kT),
k T ^ t < { k + 1)7'
y el índice de desempeño a minimizar es 1 z
J = -x * (tf)Sx(tf)
1 ('/ + - [x * (í)Q x (í) + u * (í)R u (í)] dt
¿J0
(8-38)
Se supone que el sistema de control de tiempo continuo está aproximado por su equivalente discreto. La ecuación del sistema discretizado es x ((* + 1 ) 7 ) = G (T )x (kT ) + H (T )u (kT ) y el índice de desempeño discretizado cuando tf = NT se escribe como sigue:
J = |x * (;V 7 )S x * (A T ) l" - 1
+ r l [x*(/c7)Q , x(kT ) + 2 x*(kT )M [ u ( k T ) + u*(A:7)R1u(A:7)] 2 k=0
(8-39)
Se observa que el término integral en la ecuación (8-38) no se reemplaza por 1 ,v~'
- X [x*(kT)Qx(kT) + u * (/c7 )R u (/c7 )] 2 k=u pero se modifica para incluir un término cruzado que involucra a x(kT) y u(kT). También se modifican las matrices Q y R . A continuación, se considerará el problema de control óptimo discreto mediante el empleo de un ejemplo simple. Considere el sistema de tiempo continuo definido por
x(t) = ax(t) + bu(t) donde a y
b
(8-40)
son constantes y
u(t) = u(kT),
kT
s / <
(k + 1 ) 7
El índice de desempeño a minimizar es 1
1f NT
¿
¿ jo
J = ~ x 2(N T) + -
[Q x \ t ) + R u \ t )] dt
www.FreeLibros.me
(8 4 !)
Sección 8-2 Control óptimo cuadrótico
581
Se va a discretizar la ecuación del sistema y el índice dedesempeño y se enunciará el problema de control óptimo cuadrático discreto. La ecuación (8-40) se puede discretizar como x { { k + 1)7) = G ( T ) x ( k T ) + H { T ) u { k T ) donde
G{T) = eaT H ( T ) = \ TeaTb d T = - ( e aT - 1)
o
•'o
o bien x ( ( k + 1 ) 7 ) = eaTx ( k T ) + ^ (e°T - l ) u ( k T )
(8 4 2 )
El índice de desempeño Jd ado por la ecuación (8-41) se puede discretizar. Primero, ./s e rescribe así I 1 N ~ lf(k+l)T Ji = - x 2( N T ) + - S Z Z k =0 J k T
[ Q x 2{t) + R u 2(t)] dt
Al observar que la solu ción x(t) para k T < t< { k + 1 ) 7 se puede escribir de la siguiente manera
x ( t ) = eai‘~kT)x ( k T ) + í
ea(,~T) b u ( r ) d r
kT
= £{t - kT)x(kT) +
- kT )u {k T)
donde ¿f t - k T ) = e a(,- kT) V (t ~ k T ) =
f {( t - x ) b d T JkT
= - [ * * - « 0 - 1] a
el índice de desempeño J, se puede escribir com o sigue: 1 7 = xx\N T )
1^ +- 2
f (k+1)r { Q[ { ( t - k T ) x ( k T ) + T)(t - k T ) u ( k T ) ] 2
¿ l¡=0 J k T
X
+ Ru\kT)}dt 1
= - x 2(N T ) z
1N~ l + - E
r(k+l)T
m \ t - kT )x \k T )
x k=0 J k T
+ 2Q{( t - k T ) v (t - kT)x(kT)u{kT) + Q v 2(t - k T ) u \ k T ) + R u \ k T ) ] d t 1 1 " _1 = x x \ N T ) + - 2 [ Q \ X 2{ k T ) + 2 M }x ( k T ) u ( k T ) + R x u \ k T )] L
¿
*=0
www.FreeLibros.me
^8‘43)
Sistemas de control óptimo cuadrático
582
Capítulo 6
donde f(k+I)T
Q\ =
Q e (t- k T )d t kT (k+l)T
M\ =
Q i(t - kT)r¡(t ~ k T ) d t kT (k+\)T
^
1
[QV2(t - k T ) + R ]d t
= kT
Observe que
M t y 7 , se pueden simplificar com o sigue: f(k+i)T
Q x =
kr
f<*
R
O
Qe2a(t~kT) dt = ^ ~ { e 2aT - 1) 2a
+ i)T
[
f k
1-
Q \ - { e ai,- kT) - 1] Kt
L
(8-441
+ R dt
Ia
^ [ ( e aT - 3)(eaT - 1) + 2aT] + R T
(8-46
En resumen, el problema de control óptimo cuadrático discreto se puede enunciar com o sigue, dada la ecuación de un sistema discretizado
x ( ( k + 1 ) 7 ) = G (T )x (k T ) + H (T )u ( k T ) donde
encuentre la secuencia de control óptima u(0), u(T) , . . . , u((N- 1)7) tal que el índice de desempeñe siguiente se minimice:
Tal índice de desempeño que incluye un término cruzado que involucra los términos x(kT) y u(kT puede ser modificado a otra forma que no los incluya, y la solución del problema de control óptimo discreto se puede obtener de una manera similar a la del problema de control óptimo cuadrático presentada anteriormente en esta sección. Esta cuestión se presenta a continuación.
índice de desempeño que incluye un término cruzado que involucra a \(k) y u (k). Ahora se considera el problema de control óptimo cuadrático en donde el sistema es com o el dado por ia ecuación (8-1), el cual fue x(k + 1) = G x(k) + Hu(A:),
x (0 ) = c
y el índice de desempeño está dado por 1
1 N~l
2
2 k={)
J = ~ x*(N )Sx(N ) + - S [x*(A:)Qx(A:) + 2x*(*)M u(fc) + u*(k)Ru(k)]
www.FreeLibros.me
(8~r
Sección 8-2 Control óptimo cuadrótico
583
donde Q y S son matrices Hermíticas definidas positivas o semidefmidas positivas de n x n, R es una matriz Hermítica definida positiva de r x r, y M es una matriz de n * r tal que la matriz
Q M*
M R
es positiva definida. Esto significa que
[x*(&)
u*(&)]
Q
M
M*
R
'x(ky u(k)
= x*(k)Qx(k) + x*(k)Mu(k) + u*(k)M*x(k) + u*(k)Ru(k) = x*(A:)Qx(A:) + 2x*(fc)Mu(&) + u*(A:)Ru(&) es definida positiva. Observe que el índice de desempeño J dado por la ecuación (8-47) incluye un término cruzado que involucra a x(¿) y u(A). Para obtener el vector de control óptimo u(£), se define a
Q = Q - M R 1 M*
(8-48)
y al eliminar Q del índice de desempeño J . Entonces, la ecuación (8-47) es 1
1 N~1
¿
¿ * =0
J = rx*(A0Sx(JV) + - X {x*(/c)[Q + M R -‘ M *]x(i) + 2x*(fc)Mu(fc) + u*(fc)Ru(fc)} 1
1 N~l
2
2 k=0
= -x*(A0Sx(A0 + ; 2
[x*(A:)Qx(A:) + x*(i)M R -‘M *x(i)
+ 2x*(/:)Mu(/r) + u*(A:)Ru(A:)] 1
1 A'~1
1
¿ *=0
= ^x*(N)Sx(N) + - 2 {x*(k)Qx(k) + [x*(it)MR- 1 + u*(A:)]R[R-1 M*x(£) +
u(Ar)]}
(8^ 9)
Se define
v(fc) = R_1 M*x()t)
4-
u(k)
(8-50)
Entonces la ecuación (8-49) se puede escribir com o sigue: 1
1 W_1
J = j X*(N)Sx(N) + - X [x*(£)Qx(/r) + v*(A:)Rv(Á:)]
(8-51)
Observe que la ecuación (8-51) ya no involucra el término cruzado. Efectivamente se ha eliminado el término cruzado que involucra a x(k) y u(&). Al sustituir la ecuación (8-50) en la ecuación del sistema, la ecuación (8-1), se obtiene x ( k + 1) = G x ( k ) + H[v(*) - R- 1 M*x(&)]
= (G - HR“'M*)x(A:) + Hv(Jfc) = Gx(fc) + Hv(/r)
www.FreeLibros.me
(8-52)
Sistemas de control óptimo cuadrático
584
Capítulo 8
donde
G = G-HR'M*
(8-53)
Observe que elcontrol óptimo cuadrático del sistema dado por la ecuación (8-1) con el índice de desempeño dado por la ecuación (8-47) es equivalente al control óptimo cuadrático del sistema dado por la ecuación (8-52) con el índice de desempeño dado por la ecuación (8-51). Por lo tanto, el vector de control óptimo \(k) que minimiza el índice de desempeño dado por la ecuación (8-51) se puede dar com o sigue. En referencia a las ecuaciones (8-26), (8-28) y (8-30), se tiene v(Jfc) = —R 1 H*(G* ) _1 [P(/c) - Q ]x(k)
(8-54)
\ ( k ) = - R _1 H*[P“’(A: + 1) + H R -'H *]-! Gx()c)
(8-55)
v(/t) = - [ R + H*P(Ar + 1)H]_1H*P(& + l)G x (i)
(8-56)
o
o sea
donde P ( k) es una versión modificada de la ecuación (8-23), es decir,
H k ) = Q + G *P (ít + 1)[I + HR
H*P(A: + 1 )]“'G ,
P (N ) = S
(8-57)
Entonces, el vector de control óptimo u(k) se puede dar como u (k) = v(fc) - R '1 M*x(/c)
(8-58i
donde v(k) está dada por la ecuación (8-54), (8-55) y (8-56). Cualquiera que sea la expresión que se use para v(k), la ecuación (8-58) se puede reducir a la siguiente forma:
u(k) = - [ R + H*P(fc + l)H ]- 1[H*P(/c + 1)G + M*]x(A:)
(8-59.
(Para detalles, véase el problema A -8-2.) Ejemplo 8-2 Considere el sistema de control continuo
x(t) = -x{t) + u(t),
x(0) = 1
(8-60.
donde
u{t) = u(kT),
k T ^ t < ( k + 1)T
y el índice de desempeño 1
1
Í NT
J = ± x 2(NT) + ¿Jo [x\t) + u \t)\d t
(8-61»
donde T = 1 segundo y N = 10. Discretice la ecuación del sistema y el índice de desempeño. Entonces determine la secuencia de control óptimo u(kT) para k = 0, 1, 2 ,..., 9; ésta será la secuencia de control parí la cual el índice de desempeño es mínima. También, obtenga el valor mínimo ded. En referencia a las ecuaciones (8-40) y (8-42), la ecuación del sistema discretizado es
x((k + 1)T) = eaTx{kT) + ~a {eaT - l)u(kT)
www.FreeLibros.me
ión 8-2 Control óptimo cuadrático
585
donde a = -1. ó = 1 y L = 1. Por lo tanto, la ecuación del sistema se convierte en
x(k + 1) = 0.3679x(/t) + 0.6321 u(k),
x(0) = 1
(8-62)
La discretización del índice de desempeño es 1
l " -1
Z
2 * =0
J t = -x2(N) + - £ [Q iX\ k ) + 2M tx(k)u(k) + R ¡ u2(k))
(8-63)
donde O,. A/, y R, se obtienen al sustituir O = I y R = 1 en las ecuaciones (8-44). (8-45) y (8-46). respectivamente, como sigue:
Q'
=Ya ^
~
1} =^ 2 (e ~2 ~
1) =
°'4323
M, = -£-2(e°T - l ) 2 = h e - 1 - l ) 2 = 0.1998 L.U ¿ b2 R ' = 2 ^ [(e° r “ 3^ e“T ~ = 2 ( Z ij5 K e "
+ 2aT] + T
“ 3) ( ^ ‘ " 1) - 2] + 1 = 1.1681
Así. el índice de desempeño dado por la ecuación (8-63) se puede escribir como sigue: 1
1 9
2
2 k=0
h = ~jt2(10) + - 2 [0.4323x2(&) + 0.3996x(k)u(k) + 1.1681 w2(/t)]
(8-64)
Por lo tanto, este problema se convierte como sigue. Dada la ecuación del sistema, ecuación (8-62). encuentre la secuencia de control óptimo u(k). donde k = 0. 1.2........9 tal que el índice de desempeño dado por la ecuación (8-64) sea mínimo. Ahora al comparar las ecuaciones (8-47) y (8-64). se tiene S = l,
M = 0.1998.
<2 = 0.4323,
« = 1.1681
Observe que
' Q M*
M R
0.4323 0.1998
0.1998 1.1681
es positiva definida. El siguiente paso es modificar J, dada por la ecuación (8-64) a la forma dada por la ecuación (8-51), ya que Q = O- MR~' M* = 0.3981.
1
19
2
2¡t_0
Ji = ~x2(10) + - 2 [0.398lT2(/t) + 1.1681v2(/:)]
(8-65)
La señal de control óptimo u{k) se puede encontrar de la ecuación (8-58):
u(k) = v(k) - R~ 'M *x {k ) la cual se puede escribir en la forma dada por la ecuación (8-59):
u(k)
=
- [R +H * P (k + l)H ]~ '[H * P (k
+
1)G +M *]x {k )
donde
C = 0.3679
y
H= 0.6321
La ecuación (8-66) se puede reescribir como sigue:
www.FreeLibros.me
(8-66)
Sistemas de control óptimo cuadrático
586
Capítulo 8
u(k) = -[1.1681 + 0.3996P (k + l j r ^ O ^ S P , * + 1) + 0. 1998]jc(át) = _ 0.2325P(fe ± _l ) ! 0_1998
^
=
+ 0.3996P(k + 1)
1.1681 donde
= 0.2325P(fc + 1) | 0.1998 1.1681 + 0.3996P(fc + 1) Observe que P(k) está dada por la ecuación (8-57), o bien,
P {k ) = Q + G *P(k + 1)[1 + H R ~ 'H *P (k + l ) ] ” 1Ó
(8-69)
donde P(N)= P(\Q) = 1 y
Q = Q - M R -'M * = 0.3981 Ó = G - H R 'M * = 0.3679 - 0.1081 = 0.2598 La ecuación (8-69) se puede simplificar en la siguiente forma:
P(k ) = 0.3981 +
Q-°6750^ + 1 + 0.3421P(A: + 1)
,8-70)
Ahora se calculará P(k) con la condición de frontera /J (10) = 1. Al utilizar la ecuación (8-70). se encuentra P{k) hacia atrás desde k = 9 hasta k = 0. Los resultados se presentan en la tabla 8-1. Al utilizar los valores de P(k ) así obtenidos, se calcula K(k) a partir de la ecuación (8-68). Los resultados también se presentan en la tabla 8-1. Ahora se calcula.x(k). A l sustituir la ecuación (8-67) en la ecuación (8-62) y al eliminar u(k) de estas dos ecuaciones, se obtiene 0.3035
,,,
x(k + 1) = --------------- ; 1.1681
Tabla 8-1
x(k),
+ 0.3996P(k + 1) w
^ „ x(0) = 1
*
VALORES DE P{k), K{k), x{k), Y u{k] PARA EL SISTEMA
C O NSID ERAD O EN EL EJEMPLO 8-2
x(k)
u(k)
k
P{k)
K(k)
0
0.4230
0.2230
1.0000
-0.2230
1
0.4230
0.2230
0.2270
-0.05062
2
0.4230
0.2230
0.05152
-0.01149
3
0.4230
0.2230
0.01169
-0.002607
4
0.4230
0.2230
0.002653
-0.0005916
5
0.4230
0.2230
0.000602
-0.0001342
6
0.4230
0.2230
0.0001366
-0.0000304
7
0.4231
0.2231
=0
=0
8
0.4243
0.2257
=0
=0
9
0.4484
0.2758
=0
=0
www.FreeLibros.me
(8-71)
K
Sección 8-3 Control óptimo cuadrático en estado estacionario
587
A l comenzar con x(0) = 1, los valores de.x(L) se pueden calcular a partir de la ecuación (8-71) al utilizar los valores de (k) ya obtenidos. Los resultados se muestran en la tabla 8-1. Una vez que se obtienen los valores de K(k) y x(k). la señal de control óptimo u(k) se puede obtener de la ecuación (8-67), o bien
u{k) = -K (k)x(k) Estos resultados también se muestran en la tabla 8-1. Finalmente, en referencia a la ecuación (8-36). el valor mínimo de
•A.min = |
p
se puede obtener como sigue:
(0).x2(0) = | x 0 .4230 x l 2 = 0.2115
Comentarios. El enfoque presentado aquí es útil para resolver un problema de control óptimo cuadrático de tiempo finito de un sistema de tiempo continuo mediante simulación en computadora. A menos que el índice de desempeño cuadrático de tiempo continuo dado se especifique claramente por alguna razón, es mejor definir un índice de desempeño cuadrático de tiempo discreto una vez que las ecuaciones del sistema se han discretizado. (Véase la sección 8-4.) Observe que en la mayoría de los casos las matrices S, Q y R en el índice de desempeño no son fijas, pero en “cierto sentido” son matrices definidas positivas escogidas en forma arbitraria; la minimización de un índice de desempeño arbitrario no tiene mucho sentido. Como se apuntó antes, la razón principal por la que el esquema de control óptimo cuadrático sea útil y se utilice con frecuencia es que produce un sistema de control asintóticamente estable, excepto en algunos casos académicos. (Véanse los problemas A - 8 - 6 y A-8-7.)
CO NTRO L Ó PTIM O CUADRÁTICO EN ESTADO ESTACIO N ARIO Se ha visto que cuando el proceso de control es finito (cuando N es finita), la matriz de ganancia de realimentación K(£) se convierte en una matriz variante en el tiempo. Ahora se considera el problema de control óptimo cuadrático cuando el proceso continúa sin limitaciones, o donde N = x (esto es, cuando el proceso es uno de etapas infinitas). Como N se aproxima a infinito, la solución de control óptimo se convierte en una solución de estado estacionario, y la matriz de ganancia variante en el tiempo K(¿) se convierte en una matriz de ganancia constante. Dicha matriz de ganancia constante K (í) se llama matriz de ganancia en estado estacionario y se escribe com o K. A continuación, se considerará el control óptimo cuadrático en estado estacionario de un sistema regulador. La ecuación de la planta está dada por
x{k + 1) = Gx(k) + Hu(fc) Para N =
(8-72)
el índice de desempeño se puede modificar a / = x 2 [x*(A:)Qx(/c) + u*(fc)Ru(&)]
(8-73)
2*=o
El término 7 x*(/V)Sx(/V), que aparece en la ecuación (8-2), no está incluido en esta representación de Esto se debe a que, si el sistema regulador óptimo es estable de tal forma que el valor de J converge a una constante, x(°c) se hace cero y 7 x* ( 3C)S x (3C) = 0 .
www.FreeLibros.me
Sistemas de control óptimo cuadrático
588
Capítulo 8
Ahora la matriz en estado estacionario P(A) se define com o P. Con referencia en la ecuación (823), la matriz P se puede determinar como sigue: P = Q + G *P(I + HR 'H * P ) 1G = Q + G * ( P '1 + H R ’ H ^ 'G
(8-74)
Es claro que la matriz P es determinada por la matrices G, H, Q y R. Una expresión ligeramente diferente para P se puede obtener de la ecuación (8-24): P = Q + G *PG - G *P H (R + H *PH ) 1 H *PG
(8-75)
La matriz de ganancia en estado estacionario K se puede obtener en términos de P com o sigue: De la ecuación (8-27), K = R “1H * (G * )“1(P - Q)
(8-76)
K = R ' 1H * (P “1 + H R _1H * )_1G
(8-77)
De la ecuación (8-29),
Todavía es posible otra expresión para K. De la ecuación (8-31), K = (R + H *PH ) 1H *PG
(8-78)
La ley de control óptimo para la operación en estado estacionario está dada por
u(/c) = -K x (/c ) Si por ejemplo, la ecuación (8-78) se sustituye en esta última ecuación, se obtiene
u(k) = - ( R + H *P H )
H *PG x(k)
(8-79)
y el sistema de control se convierte en un sistema regulador óptimo:
x(k + 1) = [G - H (R + H * P H )_1 H *PG ]x(A) = (I + HR *H*P) donde se ha utilizado el lema de inversión de matrices,
G x (£ )
(8-80)
(A + B C )~' = A -1 - A _1B (I + C A _1 B ) _1 CA con A = I, B = H y C = R 1 H'P. (Remítase al apéndice A.) El índice de desempeño J asociando la ley de control óptimo en estado estacionario se puede obtener de la ecuación (8-36) al sustituir P por P(0):
4 in = | x * ( 0)Px(0)
(8-8D
En mucho sistemas prácticos, en lugar de utilizar una matriz de ganancia variante en el tiempo K(A), se aproxima dicha matriz mediante la matriz constante K. Las desviaciones del desempeño óptimo debidas a la aproximación aparecerán sólo cerca del fin del proceso de control.
Ecuación de Riccati en estado estacionario. Al implantar el controlador óptimo en estado estacionario (o invariante en el tiempo), se requiere la solución en estado estacionario de la ecuación de Riccati. Existen varias formas para obtener dicha solución.
www.FreeLibros.me
Sección 8-3 Control óptimo cuadrótico en estado estacionario
589
Una forma es resolver la ecuación de Riccati en estado estacionario dada por la ecuación (8-75), P = Q 4 G *PG - G *P H (R + H * P H ) 'H * P G es comenzar con la ecuación de Riccaii en estado no estacionario, que fue dada en la ecuación (8-24):
P (/t) = Q + G*P(& 4 1)G - G * P ( * 4 1)H [R 4 H *P (¿ 4 l) H ] - ‘ H*P(fc 4 1)G
(8-82)
Al invertir la dirección del tiempo, se puede modificar la ecuación (8-82) a P(/c 4 1) = Q 4 G*P(A:)G - G*P(A:)H[R 4 H*P(jk)H ]_1H *P (it)G
(8-83)
y comenzar la solución con P(0) = 0, e iterar la ecuación hasta obtener una solución en estado estacionario. Al calcular la solución numérica, es importante notar que la matriz P es una matriz Hermítica o real simétrica y es definida positiva. A continuación, primero se presentará un enfoque de MATLAB para resolver el problema de control óptimo cuadrático en estado estacionario. Después se estudiará otro enfoque basado en el método de Liapunov.
Enfoque de MATLAB para resolver el problema de control óptimo cuadrático en estado estacionario. Ahora se considera un problema de ejemplo del control óptimo cuadrático en estado estacionario de un sistema regulador que se resuelve con MATLAB. Considere el sistema
x{k 4 1) = G x(k) 4 H u (* ) donde "0.2 0
0 " , 0 .4
H -
Y i
El índice de desempeño J está dado por
J = l i [x'(k)Qx(k) 4 u'(k)Ru(k)] ¿k=0
donde
Q =
i
o
0
0.5
R = 1
La ley de control que minimiza a ./puede estar dada por
u(k) = -K x (& ) Determine la matriz de ganancia en estado estacionario K. El programa 8-2 de MATLAB resuelve este problema. Observe que MATLAB lleva a cabo la solución iterativa de P = Q 4 G 'P G - G 'P H (R 4 H 'P H )-1 H 'PG
www.FreeLibros.me
Sistemas de control óptimo cuadrático
590
Programa de MATLAB 8-2 %
Control óptim o cu ad rático en estado estacionario-----
% ***** Se resuelve la ecu ació n de Riccati en estado estacionario y se encuentra la matriz de ganancia de realim en tació n óptim a K***** % *****M atrices C, H, Q y R ***** G = [0.2
0;0
0.4];
H = [1 ;1 ]; Q = [1
0;0
0.5];
R = [i ]; % ***** Se co m ien z a con la solución de la e cu ació n de R iccati en estado estacio n ario
% cuando P = [0 P = [0
0;0
0;0
o]****»
0];
P = Q + G '* P * G - G '* P * H * in v ( R + H '* P * H * ) * H '* P * G ; % ***** La solución P se revisa cada 10 o 20 pasos de iteración. La iteración se detiene cu an d o P p erm an e c e constante. ***** para ¡ = 1:10, P = Q + G '* P * G - G '* P * H * in v ( R + H '* P * H ) * H '* P * G ; end P P = 1.0252
-0.0189
-0 .0 1 8 9
0 .5 7 24
para / = 1:10, P = Q + G '* P * G - C '* P * H * in v (R + H '* P * H ) * H '* P * G ; end P P = 1.0252
- 0.0189
-0.0189
0 .5724
% ***** La matriz P p erm an e c e constante. Po r lo tanto, se ha alcanz ad o el estado estacionario. La matriz P en estado estacionario e s ***** P P = 1.0252
- 0.0189
-0.0189
0 .5 7 24
www.FreeLibros.me
Capítulo 8
Sección 8-3 Control óptimo cuadrático en estado estacionario
591
La matriz de ganancia de realim entación óptim a K se o btiene de
K = 0 .0786
0
.0865
con la condición límite
hasta que la solución alcance el estado estacionario. Entonces el programa 8-2 de MATLAB calcula la matriz de ganancia de realimentación óptima K empleando la ecuación siguiente: K = (R + H 'P H )
H 'PG
Enfoque de Liapunov para resolver el problema de control óptimo cuadrático en estado estacionario. A continuación se presentará el enfoque de Liapunov para resolver el problema de optimación de parámetros y el problema del regulador óptimo cuadrático en estado estacionario. Como se verá, existe una relación directa entre las funciones de Liapunov y los índices de desempeño cuadrático. Se considera el sistema
x(k + 1) = G x(k)
(8-84)
donde la matriz G involucra uno o más parámetros ajustables y cuyos valores propios están dentro del circulo unitario, o el origen x = 0 es asintóticamente estable. Se supone que se desea minimizar el índice de desempeño siguiente mediante el ajuste de un parámetro (o parámetros):
J =
x*(k)Qx(k)
(8-85)
donde Q es una matriz Hermítica (o real simétrica) definida o semidefinida positiva. Ahora se mostrará que una función de Liapunov se puede utilizar para resolver este problema. Para el sistema de la ecuación (8-84), una función de Liapunov puede estar dada por
(8-86) O b se rve que la ecu ació n (8-86) se puede rescrib ir com o:
www.FreeLibros.me
Sistemas de control óptimo cuadrático
592
Capítulo 8
x*(k)Q x(k) = -{[G x (* )]* P [G x (fc )] - x*(fc)Px(A:)} = -x*(A :)[G *P G - P]x(fc) Por el segundo método de Liapunov, se sabe que para una matriz dada Q existe una matriz P definida positiva, y com o la matriz G es estable, entonces G *PG - P = - Q
(8-87)
En consecuencia, se puede determinar P a partir de esta ecuación. El índice de desempeño J se puede evaluar com o sigue:
/ = \ 2 x*(k)Q x(k) = x X [x*(/c)Px(fc) - x*(A: -I- l)P x(fc + 1)] ¿ k= o
= |x * ( 0 ) P x ( 0 )
(8-88)
donde P es una función del parámetro(s)ajustable(s). Al obtener la ecuación (8-88) se utilizó la condi ción que x(*0 —> 0, ya que todos los valores propios de G están dentrodel círculo unitario.Por lo tanto, el índice de desempeño J se puede obtener en términos del estado inicial x(0) y de la matriz P, la cual está relacionada con las matrices G y Q mediante la ecuación (8-87). La minimización del índice de desempeño J se puede realizar al minimizar x*(0)Px(0) con respecto al parámetro en cuestión. Es importante notar que el valor óptimo del parámetro depende, en general, de la condición inicial x(0). Sin embargo, si x(0) involucra sólo un componente no cero, por ejemplo, si x,(0) A 0 y las otras condiciones iniciales son cero, entonces el valor óptimo del parámetro no depende del valor numérico dex,(0).
Enfoque de Liapunov para resolver el problema de control óptimo cuadrático en estado estacionario. Ahora se considera el problema de control óptimo donde, dada la ecuación de la planta
x (k + 1) = G x(k) + H u(/c)
(8-89)
se desea determinar la matriz K de la ley de control óptima u (* ) = —K x(/c)
(8-90)
= x I [x * (* )Q x (* ) + u * (* )R u (* )]
(8-91)
tal que el índice de desempeño /
¿
k= 0
se minimice, donde Q es una matriz Hermítica (o real simétrica) definida positiva o semidefmida positiva y R es una matriz Hermítica (o real simétrica) definida positiva. Al sustituir la ecuación (8-90) en la ecuación (8-89), se obtiene
x{k + 1) = Gx(k) - HKx(fc) = (G - HK)x(lfc) Al sustituir la ecuación (8-90) en la ecuación (8-91) da
www.FreeLibros.me
(8-92)
Sección 8-3 Control óptimo cuadrático en estado estacionario
593
1 X
J = ~ 2 [x*(& )Q x(() + x*(£)K *R K x(& )] ¿
k =0
= \ 2 X*(^)(Q + K * R K )x (¿ )
(8-93)
z *=o
7
En el análisis siguiente, se supone que la matriz G - HK es estable, es decir, los valores propios de G - H K están dentro del círculo unitario.(Si el sistema es completamente controlable y observable, se puede probar que G - HK es una matriz estable. Refiérase al problema B-8-6.) Entonces, existe una función de Liapunov que es definida positiva y cuya derivada es definida negativa. Siguiendo la discusión dada al resolver el problema de optimación de parámetros, se tiene x*(¿:)(Q + K * R K )x (() = —[x*(A: + l)Px(A: + 1) - x*(/t)P x(tt)]
(8-94)
En referencia a la ecuación (8-92), la ecuación (8-94) se puede modificar a x*(A:)(Q + K*RK)x(A:) = - [ ( G - H K )x(fc)]*P [(G - HK)x(Kc)] + x*(/c)Px(fc) = —x*(A:)[(G - H K )*P (G - H K ) - P ]x (¿ )
(8-95)
Al comparar los dos lados de la ecuación (8-95) y al notar que esta ecuación permanece verdadera para cualquier \(k), se requiere que Q + K *R K = - ( G - H K )*P (G - H K ) + P
(8-96)
Observe que mediante el segundo método de Liapunov, para una matriz estable G - HK, existe una matriz P definida positiva que satisface la ecuación (8-96). La ecuación (8-96) se puede modificar como sigue: Q + K *R K + (G* - K *H *)P (G - H K ) - P = 0 o bien Q + G *PG - P + K *(R + H *P H )K - (K *H *PG + G *PH K ) = 0 Esta última ecuación se puede modificar com o sigue: Q + G *PG - P + [(R + H * P H )1/2K - (R + H *P H )_12 H *PG ]* [(R + H * P H )‘ 2K - (R + H *PH ) 12H *PG] - G *P H (R + H *P H ) 'H ^ P G = 0
(8 97)
La matriz K que minimiza a J s e puede obtener al minimizar la parte izquierda de la ecuación (8-97) con respecto a K. (Véase el problema A -8-5.) Ya que [(R + H * P H )1/2K - (R + H *PH ) 12H *P G ]*[(R + H * P H )12K - (R + H *PH )"'/2H*PG] no es negativa, el mínimo ocurre cuando es cero, o cuando (R + H *P H )1/2K = (R + H *P H ) 12H *PG Por lo tanto, se obtiene
K = (R + H *P H ) 'H *P G i '•:< 1' t ! ' .
www.FreeLibros.me
(8-98) '
' ’
Sistemas de control óptimo cuadrático
594
Capítulo 6
A l sustituir la ecuación (8-98) en la ecuación (8-97) se obtiene
P = Q + G *PG - G *P H (R + H *PH ) *H*PG
(8-991
L a matriz P debe satisfacer la ecuación (8-99), la cual es la misma que la ecuación (8-75). L a ecuación (8-99) se puede m odificar y obtener
P = Q + G *P[I - H (I + R ' 1H * P H )-1R _1H *P]G
(8-100)
Mediante el uso del lema de inversión de matrices
(I + H R _1H * P )_1 = I - H (I + R _1 H *P H )~‘ R _1 H *P la ecuación (8-100) se puede m odificar a
P = Q + G *P (I + H R 1H *P) 1G
(8-1011
L a matriz P se puede determinar de la ecuación (8-101). Por último, el valor mínimo de J s e puede obtener como sigue. En referencia a las ecuaciones (893) y (8-94) y al notar que x (^ ) = 0, el valor mínimo del índice de desempeño J s e obtiene como sigue::
4 ,„ =
x * ( ( ) ( Q + K * R K )x (() ¿ * =0
= \ X [x*(k)Px(k) — x*(k + l ) P x ( ( + 1)] ¿ k=a
= |x * ( 0 ) P x ( 0 ) Ejemplo 8-3 Considere el sistema X i{k + 1 )
"l
1
x, ( k )
x 2( k + 1 )
a
—1
x 2( k )
’
*i(0) *2(0)
Y 0
donde -0.25
7 = ^ 2 x*(k)Qx(k) 2 k=o donde Q = I. De la ecuación (8-88), el índice de desempeño J en términos del parámetro a está dado por / = |x *(0 )P x (0 ) donde P involucra el parámetro a. Ahora se determina P de la ecuación (8-87) G *PG - P = -Q o bien
1 1
a
-1
Pn P\2 ’ l p 12 Pl2 a
1 -1
la cual se puede simplificar a
www.FreeLibros.me
Pn pn
Pn P l2
1 o" 0 1
Sección 8-3 Control óptimo cuadrático en estado estacionario
595
2apu + a2p22 p n + (a - 2)pu - ap22 pn + (a - 2)p,2 - ap22 P n ~ 2p\2
i 0
o’ -1
Esta última ecuación resulta en las tres ecuaciones siguientes: 2 a p xl + a 2p 22 = - 1
+(a -
pn
2 ) p ¡2 p ii -
a p 22
=0
2 p u = -1
A l resolver estas tres ecuaciones para los p , se obtiene 1 + 0.5a2
0.5(a - 1)
’ a ( l + 0.5a) 0.5(« - 1)
a ( l + 0.5a) 1.5
a ( l + 0.5a)
a( 1 + 0.5 a)
Ya que -0.25 < a < 0, P es definida positiva. El índice de desempeño J se convierte en 7 = |x *(0 )P x (0 ) = | [ l
0]
Pn
P 12
PX2
P22_
1 0 - 2Pn
1 + 0.5a2 2 a (l + 0.5a) El mínimo de J ocurre en el punto final a =-0.25. Por lo tanto, el valor mínimo de J se encuentra como 1 + 0.5(-0.25)2 2 (- 0 .2 5 )(l - 0.5 x 0.25)
= 2.3571
Ejemplo 8-4 Considere el sistema
X\(k + x2(k +
1) 1)
1 1
1 0
xi (k) x2(k)
x,(0) « (* )] .
* 2(0 )
y el índice de desempeño
J =\
¿ [x*(A:)Qx(fc) + u *(k )R u (k )]
donde Q = I y R = 1. De la ecuación (8-98), la ley de control óptimo que minimizad índice de desempeño .7 está dada por
u(k) = - K x (k ) = - ( R + H*PH)_I H*PGx(C) donde la matriz P se puede obtener de la ecuación (8-101):
P = Q + G*P(I + HR~‘ H*P)“’G Se determina la matriz P para el presente sistema. Observe que
www.FreeLibros.me
(8-1021
Sistemas de control óptimo cuadrático
596
Capítulo S
que es no singular, se puede modificar la ecuación (8-102) a
(P - Q)G
(I + HR
(8-103)
H*P) = G*P
La matriz P en este problema es una matriz real simétrica. En consecuencia, la ecuación (8-103) se puede escribir como: Pn
pn
Pn
P 22
1 0 0 1 1 1 0 + 1 [1][1 0] 1 |_u i j J 1 - 1 l Lu [ \ |_uj
1 1 1 0
P n p 12 Pn
P 22
P
11
Pn
P
12
P 22
o bien PnO- + P n ) ( P 22 -
p ]2 + p n ~ 1 - p n
1)(1 + p n )
P u + p 12
( P 22 - l) p i 2 + P n - P 22 +
1
Pn
p 12 + P 22 p
12
Esta última ecuación produce cuatro ecuaciones escalares. Observe sin embargo, que sólo tres de ellas sor linealmente independientes. Las cuatro ecuaciones escalares son: P n { 1 + P 11 ) = P n + P n Pn + P
11
— 1 ~ P n — P n + P 22
(P 22 - 1)(1 + P n ) = P 11 (P 22 - l)P i 2 + P n - P 22 + 1 = p n De la primera de estas cuatro ecuaciones, se obtiene (8-104'
P 12 = 1 y de la segunda de estas cuatro ecuaciones
(8-105
P 22 — p 11 — 2 Entonces, de la tercera de las cuatro ecuaciones se tiene P n - 3pn - 3
= 0
(8-1Ü6
[Al sustituir las ecuaciones (8-104) y (8-105) en la última de estas cuatro ecuaciones, se encuentra que ¿su siempre se satisface.) Al resolver la ecuación (8-106), se encuentra que j»,, = 3.7913
o
-0.7913
ya que la matriz P debe ser definida positiva, se escoge que p,¡ = 3.7913. Entonces
P 22 = p „ - 2 = 3.7913 - 2 = 1.7913 En consecuencia, la matriz P es
"3.7913 1.0000
1.0000 1.7913
CO NTRO L O PTIM O CUADRATICO DE UN SISTEM A DE SEG U IM IEN TO En esta sección se discutirá el control óptimo cuadrático de un sistema de seguimiento. La planta considerada es el péndulo invertido mostrado en la figura 8-3. Se diseñará un esquema de control para este sistema de control de péndulo invertido. El péndulo invertido es inestable ya que puede caer en cualquier momento y hacia cualquiedirección a menos de que se le aplique una fuerza de control. Solamente se considera el problema en dos dimensiones en el cual el péndulo sólo se mueve en el plano de la página. Se supone que la masa
www.FreeLibros.me
Sección 8-4 Control óptimo cuadrático de un sistema de seguimiento
597
del péndulo se concentra al final de la varilla, com o se presenta en la figura. (La varilla no tiene masa.) La fuerza de control u se aplica al carro. Es preferible mantener el péndulo invertido en posición vertical tanto com o sea posible y mantener el control de la posición del carro, por ejemplo, mover el carro en forma de escalón. Para controlar la posición del carro, se necesita construir un sistema de seguimiento tipo 1. El sistema del péndulo invertido montado sobre un carro no tiene un integrador. Por ello, se alimenta la señal de posición y (la cual indica la posición del carro) de regreso a la entrada y se inserta un integrador en la trayectoria directa, com o se muestra en la figura 8-4. (Observe que son posibles otras configuracio nes.) Se escoge el periodo de muestreo T com o 0.1 segundos.
Figura 8-4
Diagrama de bloques del sistema de seguimiento.
www.FreeLibros.me
Sistemas de control óptimo cuadrático
598
Capítulo 8
El sistema de control a diseñar incluirá realimentación del estado y un ¡ntegrador en el lazo cerrado. Las variables de diseño son la constante K, y la matriz de ganancia de realimentación K. Por lo tanto, el diseñar el esquema de control significa determinar la constante K, y la matriz K. Se resolverá este problema de diseño y se obtendrá la respuesta al escalón del sistema diseñado con ayuda de MATLAB. Para resolver este problema de diseño, primero se definen las variables de estado x¡, x2, x} y .y^ com o sigue: Xi = 6 x2 = 6 X3 = X X4 = X
En este sistema se quiere mantener el ángulo 0 tan pequeño com o sea posible cuando el carro es movido en forma de escalón. Se considera que el desplazamiento del carro es la salida del sistema. Asi. la ecuación de salida es
y = [0
0
1
0]
Se suponen los siguientes valores numéricos parar M, m y /. M = 2 kg,
m = 0.1 kg,
/ = 0.5 m
Para diseñar el sistema de control, se utilizará el modelo discretizado. La ecuaciones de estado y de salida discretas para la planta se pueden obtener como se muestra a continuación. (Refiérase al problema A -8-10 para obtener estas ecuaciones.)
x (k + 1) = G x (* ) + H u(k) y ( k ) = C x(k) + D u ( k ) donde
G =
1.1048 0.1035 2.1316 1.1048 - 0 .0 0 2 5 - 0 .0 0 0 1 - 0 .0 5 0 8 - 0 .0 0 2 5
0 0 ' 0 0 , 1 0.1 0 1
'- 0 .0 0 5 1 ' - 0 .1 0 3 5 H = 0.0025 0.0501
C = [0 0 1 0],
D = [0]
De la figura 8-4 la representación en el espacio de estado para el sistema de control completo está dada por
x(k + 1) = G x(k) + H u(k) y ( k ) = Cx(k) v(k) = v(k - 1) + r ( k ) - y ( k ) u (k ) = -K x (& ) + K ¡v{k) donde K = [ki
k 2 k 3 k 4]
www.FreeLibros.me
Sección 8-4 Control óptimo cuadrático de un sistema de seguimiento
599
Yaque
v(k + 1) = v(k) + r(k + 1) - y ( k + 1) = v(k) + r(k + 1) - C[Gx(&) + Hw(*)] = -CGx(fc) + v{k) - CHu(fc) + r(k + 1) se tiene H x(k + 1) G 0 x(A)' + -C H CG 1 v(k) v (k + 1) Se supone que la entrada r es una función escalón, es decir,
« (* ) +
r(k + 1)
m ( ° o)
r( oo)
r(k) = r(k + l) = r Entonces, cuando k se aproxima a infinito, x(°°)
G -C G
v (°°)
0 1
x(°°) v(o°)
H CH
+
+
Se define
x e(k) = x(k) - x(oo) ve( k ) = v(k) - v(oo) Entonces la ecuación del error se convierte en x e(k + 1) ve(k + 1)
G -C G
0 1
x e(k) ve(k)
H ue(k ) -C H
+
Observe que
ue(k) = - K x f(A:) + K¡ve(k) = - [ K
- K ¡]
X e(k )
M k ).
Ahora se define G -C G
0 1
H -C H
H
K = [K
-K ,},
w (k) = ue(k)
x le(k) ¿ (k )=
x e( / : ) l =
_jr5c(A:)_
donde x 5e(k) = ve(k). Entonces se tiene {(A: + 1) = G & k) + H w (k) W{k ) = - k m
Hay que señalar que com o el sistema es continuo, se debe considerar un índice de desempeño cuadrático también continuo. Sin embargo, la discretización de un índice de desempeño continuo genera un término cruzado que involucra a £ y w.(Véase la sección 8-3.) Para simplificar el proceso de
www.FreeLibros.me
Sistemas de control óptimo cuadrático
600
Capítulo 8
diseño, es mejor definir un índice de desempeño cuadrático discreto. Por lo tanto, el problema se convierte en determinar la matriz K tal que minimice al siguiente índice de desempeño cuadrático:
¿ k=0 donde Q y R se deben escoger en forma apropiada para que la respuesta del sistema sea aceptable. (El propósito de utilizar el índice de desempeño cuadrático es asegurar la estabilidad del sistema.) Se escoge a Q y a R com o sigue:
10 0 0 0 0
0 0 0 1 0 0 0 100 0 0 0 1 0 0 0
0 0 0 0 1
El énfasis está en las variables de estado x3e y x h„ (Observe que se pueden utilizar diferentes valores de Q y R.) En el programa de MATLAB para resolver este problema, se utiliza la siguiente notación G1 = G ,
H1 = H,
KK = K
El programa 8-3 de MATLAB da la solución P para la ecuación de Riccati en estado estacionario, la matriz de realimentación K, y la constante de ganancia integral K,.
Program a de M A T L A B 8-3 %
D iseño de un sistema de co ntrol de p én d u lo invertido
basado en la m inim ización de u n índice de d esem p e ñ o c u a d r á t ic o ----% ***** El siguiente program a resuelve la e cu ació n de R iccati en estado estacionario y da la matriz de ganancia de realim entación óptim a K ***** % * ' * * * M a trice s G , H, C y D ***** G = 11.1048
0.1035
0
0
2 .1 3 1 6
1.1048
0
0
-0.0025
-0.0001
1
0.1
-0.0 5 0 8
-0.0025
0
1
H = [-0.0051 -0.1035 0 .0025 0 .0 5 01 ]; C = [0
0
1
0];
D= [0]; % ***** Matrices G1, H1, Q y R *****
www.FreeLibros.me
Sección 8-4 Control óptimo cuadrático de un sistema de seguimiento
G1 = [C zeros(4, 1); -C* G
601
1];
H1 = [H ; -C * H ]; Q = (10
0
0
0
0
0 0
0
0 100
o o
0
010
0
0
0
1
0
0
0
0 1];
R = [i ] ;
% ***** Se co m ienz a a resolver la e cu ació n de Riccati en estado estacionario % para P cu an d o P = diag(0, 4) ***** P = diag(0, 4); P = Q + G1 '* P * G 1 - G1 '* P * H 1 * in v (R + H1 ' *P*H1 )*H1 '* P * G 1 ;
% ***** Se revisa la solución de P cada 20 iteraciones. % La iteración se detiene cu an d o P p e rm a n e c e constante *****
para í = 1:20, P = Q + G1 '* P * G 1 - G1 '* P *H 1 *inv(R + H1 '* P *H 1 )*H 1 '* P * G 1 ; en d P P = I.O e + 003* 9.6887
2.1677
3.4319
2.4341
-0.1 741
2.1677
0.4876
0.7743
0 .5490
-0.0393
3.4319
0.7743
2.2988
1.1 788
-0.1312
2.4341
0.5490
1.1 788
0 .7824
-0.0625
0.1741
-0.0393
-0.1312
-0.0625
0.0185
para i = 1:20, P = Q + G1 '* P * G 1 - G1 '* P *H 1 *inv(R + H1 '* P * H 1 )* H 1 '* P * G 1 ; en d P P = I.O e + 004 * 1.0707
0 .2397
0.3996
0.2772
-0.0 2 2 0
0.2397
0.0539
0.0902
0.0625
-0.0 0 5 0
0.3996
0.0902
0 .2617
0 .1367
-0.0 1 5 8
0.2772
0.0625
0 .1367
0.0895
-0.0 0 7 8
0 .0220
-0.0 0 5 0
-0.0 1 5 8
-0.0 0 7 8
0.0021
p ara i = 1:20, P = Q + G1 '* P * G 1 - G1 '* P *H 1 *inv(R + H1 '* P * H 1 )* H 1 '* P * G 1 ; end P
www.FreeLibros.me
Sistemas de control óptimo cuadrático
602
P =
I.Oe + 004* 1.0724
0.2401
0.4006
0.2778
-0.0221
0,2401
0 .0540
0.0904
0 .0 6 27
-0 .0 0 5 0
0 .4006
0.0904
0.2623
0.1371
-0.0 1 5 8
0.2778
0,0627
0.1371
0 .0897
-0.0 0 7 8
■0.0221
-0.0 0 5 0
-0.0158
-0.0078
0.0021
para i = 1:20, P = Q + G1 " P * G 1
- C1 '* P * H l* in v (R + H1 '* P *H 1 )*H 1 '* P * C 1 ;
end P P = 1.03 + 004* 1.0724
0.2401
0.4006
0.2778
-0.0221
0.2401
0 .0540
0.0904
0 .0 6 27
- 0 .0 0 5 0
0.4006
0 .0904
0.2623
0.1371
-0.0 1 5 8
0.2778
0 .0627
0.1371
0.0897
-0.0 0 7 8
-0.0221
-0.0 0 5 0
-0.0158
-0.0 0 7 8
0.0021
% ***** La matriz P p erm an e c e constante. Po r lo tanto, se ha alcanz ad o el estado estacionario. La matriz P en estado estacionario es *****
P = I.Oe + 004* 1.0724
0.2401
0.4006
0.2778
-■0.0221
0.2401
0.0540
0.0904
0 .0 6 2 7
--0.0050
0 .4006
0.0904
0.2623
0.1371
■0.0158
0 .2778
0.0627
0.1371
0 .0 8 97
--0.0078
-0.0221
-0.0 0 5 0
-0.0158
-0.0078
0.0021
*** La matriz de ganancia de realim en tació n óptim a KK es ’ =inv(R + H1 '* P *H 1 )*H1 '* P *G 1
64 .9346 [K K (1 )
-64.9346
-1 4 .4819 KKf 2)
K K (3 )
-1 4 .4819
-10.8475
-9.2871
K K (4 )J
-10.8475
-9.2871
www.FreeLibros.me
0.5189
Capítulo 8
Sección 8-4 Control óptimo cuadrático de un sistema de seguimiento
603
Kl = —KK(5) Kl = -0.5189
Por lo tanto, la matriz de realimentación K y la constante de ganancia integral K , se determinan com o sigue: K = [ - 6 4 .9 3 4 6
- 1 4 .4 8 1 9
-1 0 .8 4 7 5
- 9 .2 8 7 1 ] ,
/C, = - 0 .5 1 8 9
El diseño matemático está completo.
Respuesta al escalón unitario del sistema diseñado.
Para obtener la respuesta al escalón
unitario, se procede com o sigue: ya que
x(k + 1) = Gx(Jfc) + H[ —K x(/t) + K ,v(k)] = (G - HK)x(Jfc) + Htf,v(A:)
v(k + 1) = v{k) + r(k + 1) - y ( k + 1) = v ( k ) + r(k + 1) - C[Gx(A:) + Hu(A:)] = ( - C G + C H K )x(tt) + (1 - C H K ,)v ()t) + r se obtiene
x(k + 1)' v(k + 1) # )
G - HK -C G + CHK = [C
x(k)
0]
V(*).
H/G 1 - C H K,
\{k) v{k)
+ [0]r
+
(8-107)
(8-108)
donde r = 1. Para determinar la respuesta al escalón unitario y(k) (la posición del carro), primero se define GG =
HH =
G - HK - C G + CHK
HK;
1 - CH/G
0 1
CC = [C
0] = [0
0
1
0
0]
D D = [£>] = [0] y entonces las ecuaciones en el espacio de estado [ecuaciones (8-107) y (8-108)] se convierten a la función de transferencia pulso Y(z)/R(z) mediante el uso del siguiente comando de MATLAB: [num ,den] = ss2tf(G G ,H H ,C C ,D D ) Entonces se utiliza el comando filter. y = filter(num ,den,r)
www.FreeLibros.me
Sistemas de control óptimo cuadrático
604
Capítulo 8
donde r = entrada escalón unitario. Para obtener la respuesta *,(&), se observa que
Xl( k ) = [1
0
0
0
0] * ( ^
Se define FF = [1
0
0
0
0]
Entonces (8-109) Las ecuaciones en el espacio de estado [ecuaciones (8-107) y (8-109)] se convierten a la función de transferencia p ulso X^(z)IR{z) mediante el comando [núm 1, den 1] = ss2 tf(G G , H H , FF, D D )
Entonces se utiliza el comando filter xl
= filter(núm 1, den 1, r)
De forma similar, para obtener la respuesta de x2(k), se observa que * 2( * ) = [0
1
0
0
o j* ^
( 8- 110)
Se define
J J = [0
1
0
0
0]
Entonces las ecuaciones en el espacio de estado [ecuaciones (8-107) y (8-110)] se convierten a la función de transferencia pulso X 2(z)/R(z) mediante el comando [núm2,den2] = ss2tf(GG,HH,JJ,DD) Entonces se utiliza el comando filter x2 = fiiter(num2,den2,r) De igual manera, al definir LL = [0
0
0
1
0]
M M = [0
0
0
0
1]
las respuestas x4(k) y x 5(¿) = v(k) se pueden obtener empleando los comandos [núm 4, den 4] = ss2 tf(G G , H H , LL, D D )
x4 = filter(num4,den4,r) y
www.FreeLibros.me
Sección 8-4 Control óptimo cuadrático de un sistema de seguimiento
605
[num 5,den5] = ss2tf(G G ,H H ,M M ,D D ) x5 = filter(num 5,den5,r) El programa 8-4 de MATLAB proporciona y(k), escalón unitario (r = 1).
x2(k), x4(k) y x5(k) cuando la entrada es un
Program a de M A T L A B 8-4 %
Respuesta al escalón del sistema d is e ñ a d o -----
% ***** Este program a calcula la respuesta del sistema cu an d o está sujeto a una entrada de un escalón unitario. Los valores q ue se usan para K y K1 se calcularo n en el program a de M A T L A B 8-3. La respuesta se o b tie n e al usar el m étod o de co n vertir las la form a de
ecu acio n e s de estado en tiem p o discreto
en
lafunción de transferencia de pulso. La respuesta se encuen tra
co n el co m a n d o 'filter' co n ve n cio n a l ***** % ***** M a trice s K, K1, G G , H H , C C , FF, JJ, LL, M M , D D ***** K = [-6 4 .9 3 4 6
-14.4819
-10.8475
-9.2871];
Kl = -0.5189; G G = [C-H *K
H*KI;-C*G + C * H * K
1-C*H*KI];
H H = [0; 0; 0; 0; 1 j; C C = [0
0
FF = [1 JJ = [0
1
0 1
LL = [0
0
0
M M = [0
0
0];
0 0 0
0]; 0];
0 1 0
0
0]; 0
1];
D D = [0]; % ***** Para o b ten er y(k) las ecu acio n e s en el esp acio de estado se co n vie rte n a la función de transferencia pulso X 3 (z)/R (z) ***** [num, den] = ss2tf(G G , H H , C C , D d); % ***** Se introduce el co m an d o para o b ten er la respuesta al escalón unitario**** r = ones (1, 101); axis ([0
100
-0.2
1.2]);
k = 0:100; y = filterfnum, den, r); plot(k, y, 'o', k, y, '- ') grid title('Position of Cart : y(k) = x3(k)') x label('k') yla b e l('y(k ) = x3(k)') % ***** Para o b ten er x1 (k) las e cu acio n e s en el e sp acio de estado se co n vie rte n a la función de transferencia pulso X I (z)/R(z) ***** [num 1, d e n l ] = ss2 tf(G G , H H , FF, D D );
www.FreeLibros.me
Sistemas de control óptimo cuadrático
606
% ***** Se introduce el co m an d o para o b ten er la respuesta al escalón unitario ***** axis ([0
100
-0.1
0.2]);
x l = fíller(num 1, d en 1, r); plot (k, x l, 'o ', k, x1, '- ') grid titlef'D esplazam iento angular Theta; x l (k)') x label('k') ylabel('x1 (k)') % ***** Para o b ten er x2(k) las e cu acio nes en el esp acio de estado se co n vierten a la función de transferencia pulso X 2 (z)/R (z) ***** [num 2, den 2] = ss2 tf(C G , H H , ]J, D d); % ***** Se introduce el co m an d o para o b te n e r la respuesta al escaló n unitario ***** axis([0
100
-0.5
0.5]);
x2 = filter(num 2, den 2, r); plot (k, x2, 'o ',
k,
x2, '- ')
grid title ('V e lo c id ad angular Theta punto: x2(k)') xlabel('k') ylabel('x2(k)') % * ’ *** Para o b ten er x4(k) las ecu acio n e s en el esp acio de estado se co n vierten a la función de transferencia pulso X4 (z )/R (z) ***** [num 4, den 4] = ss2 tf(G G , H H , LL, D D ); % ****‘ Se introduce el co m a n d o para o b te n e r la respuesta al escalón unitario ***** axis([0
100
-0.5
1]);
x4 = filter(num 4, den 4, r); plot(k, x4, 'o', k, x4, grid title ('V e lo c id ad del carro: x4(k)') xlabel ('k') ylabel('x4 (k)') % ***** Para o b te n e r x5(k) las ecu acio n e s en el esp acio d e estado s e co n vie rte n a la función d e transferencia pulso X 5 (z)/R (z) ***** [num 5, den 5] = s2 tf(C G , H H , MM, D D ); % ***** Se introduce el co m an d o para o b te n e r la respuesta al escalón unitario ***** axis ([0
100
-5
30]);
x5 = filterfnum 5, den 5, r); plot(k, x5, 'o ', k, x5, '- ') grid titlef'Salida del integrador: x5(k) = v(k)') xlabel('k') ylabel('x 5 (k) = v(k)')
www.FreeLibros.me
Capítulo 8
Sección 8-4 Control óptimo cuadrático de un sistema de seguimiento
607
Con base en los cálculos de MATLAB, la posición del carro \y(k) contra k\ se puede obtener com o se muestra en la figura 8-5. (Nótese que el movimiento inicial de carro es en la dirección negati va.) La figura 8-6 dibuja la gráfica del desplazamiento angular del péndulo, x,(&) = 6{k), en función de Posición del carro: y(k) = x3(k)
Figura 8-5 Gráfica de la posición del carro y y(k) contra k.
Figura 8-6
Gráfica del desplazamiento angular .v,(A) contra k.
www.FreeLibros.me
Sistemas de control óptimo cuadrático
608
Capítulo 8
k. La figura 8-7 muestra la gráfica de la velocidad angular del péndulo, x2(k), en función de k. La figura 8-8 presenta la gráfica de la velocidad angular del carro, x4(k), en función de k. La salida del integrador. v(k) contra k, se presenta en la figura 8-9. Velocidad angular theta punto: x2(k)
Figura 8-7 Gráfica de la velocidad angular x2(k) contra k.
Velocidad del carro: x4(k)
k Figura 8-8
Gráfica de la velocidad del carro xt(k) contra k.
www.FreeLibros.me
C a p ítu lo 8
609
Pro b lem as de e je m p lo y so luciones Salida del integrador: x5(k)= : v(k)
k Figura 8-9 Gráfica de la salida del integrador v(k) contra k.
Como en el sistema presente el periodo de muestreo T es 0.1 segundos, toma alrededor 6 segundos alcanzar el estado estacionario.
P R O BLEM A S EJEM PLO Y SO LU CIO N ES Problema A-8-1 Considere el sistema de control de tiempo discreto
x(k + 1) = Gx(fc) + Hu(fc) donde
x(k) = vector de estado (vector-r?) u(A) = vector de control (vector-r)
G =matriz no singular de n * « H = matriz de n x r Se desea encontrar un vector de control óptimo tal que minimice el índice de desempeño siguiente: 1
1N 1
2
2
j _ - x *(A í)Sx(/V) + - 2 lx*(k)Qx(k) + u*(/c)Ru(/c)] donde Q y S son matrices Hermíticas definidas positivas o semidefinidas positivas de n x n y R es una matriz I lermítica definida positiva de r x r.
www.FreeLibros.me
Sistemas de control óptimo cuadrático
610
Capítulo 8
En la sección 8-2 se obtuvo el vector de control óptimo u(&) en la forma dada por la ecuación (8-26)
u(fc) = —R “' H*(G*)-1[P(£) - Q]x(/fc)
(8-111)
donde P(k) está dada por las ecuaciones (8-23) y (8-25):
Q + G*P(A: + 1)[I + H IT 1H*P(A: + l) ] ^ 1G,P (N) = S
P(fc) =
(8-112)
1. Muestre que el vector de control óptimo u(k) se modifica a
u (k) = - R 1H*[P"'(/t + 1) + HR 1H*]_1 Gx(k)
(8-113)
donde
P(Ar) = Q + G*[P_,(tt + 1) + HR 1H*]_1 G,
P (N ) = S
(8-114)
2. Muestre que el vector de control óptimo u(k) también puede estar dado por
u(&) = - [ R + H*P(/fc + 1)H]_1 H*P(/c + l)Gx(it)
(8-115)
donde
P(/c) = Q + G*P (k + 1)G —G*P(k + 1)H[R + H*P(fc + 1)H]_1H*P(A: + 1)G,
P(N) = S
(8-116)
3. Muestre que las tres expresiones paraP(A) dadas por las ecuaciones (8-112), (8-114) y (8-116) son equivalentes. So lu ció n
1. Primero se mostrará que las ecuaciones (8-111) y (8-113) son equivalentes. Con referencia a la ecuación (8-23)
(G *r'[P(fc) - Q] = (G *r'G *P(fc + 1)[I + HR 1H*P(£ + 1)]_1G = P (k + 1)[I + HR-1 H*P(A: + 1)]_1 G = [P~'(fc + 1) + HR 1H*] 1G Por lo tanto.
u (k) = - R , H*(G*)^'[P(Á:) - Q]x(A:) = —R“‘ H*[P”'(£ + 1) + HR-1 H*]_1 Gx(k) y se ha mostrado que las ecuaciones (8-111) y (8-113) son equivalentes. 2. Para mostrar que las ecuaciones (8-113) y (8-115) son equivalentes, observe que
[R + H*P(/fc + 1)H]-1 H*P(fc + 1)[P J(A: + 1) + HR 1H*] = [R + H*P(tfc + 1)H]’ ’ H*[I + P (k + 1)HRH*] = [R + H*P(/fc + 1)H]~'[R + H*P(¿ + 1)H]R_1 H* = R
H*
Por lo tanto
R- i H*[p-i(^ + 1) + HR-1 H*]~' = [R + H*P(/fc + 1)H]_1 H*P(A: + 1) y en consecuencia
www.FreeLibros.me
Capítulo 8
Problemas ejemplo y soluciones
u(k)
= -R
1 H * [ P ~ l (/c + 1) + H R ^ ' H * ] “ 'G x ( Á :)
= - [ R + H*P(/t + l)H ]- , H*P(/t + l)Gx(ifc) De esta manera, se ha mostrado que las ecuaciones (8-113) y (8-115) son equivalentes. 3. A continuación, se probará que las ecuaciones (8-112) y (8-114) son equivalentes. Si se observa que
P(/fc + 1)[I + HR 'H*P(fc + 1)]-' = [p-'(fc + 1) + HR
H*] 1
entonces la equivalencia entre las ecuaciones (8-112) y (8-114) es aparente. Para mostrar que las ecuaciones (8-114) y (8-116) son equivalentes, observe que
[P - \ k + 1)
+ HR~'H*]{P(fc + 1) - P(k + 1)H[R + H*P {k + l)H ]_1H*P(Jt+
1)}
= I + HR 1H*P(fc + 1) - H[R + H*P(/c + 1)H]_1 H*P(/c + 1) - HR 1H*P(fc + 1)H[R + H*P(Jt + 1)H]~'H*P(A: + 1) = I - H {-R ’ + [R + H*P(/t + 1)H]- ’ + R ’ H*P(A: + 1)H[R + H*P(tt + 1)H]_1}H*P(A: + 1)
= I - H{[I + R H*P(/fc + 1)H][R + H*P(¿ + 1)H]-1 - R_1}H*P(/fc +1) = I - H{R '[R + H*P(tfc + 1)H][R + H*P(fc + 1)H]~* - R _1}H*P(/t + 1) = I - H[R~' - R ']H*P(/t + 1) = I Por lo tanto.
[P_1(* + 1) + HR~’H*] 1 = P(k + 1) - P(k + 1)H[R + H*P(tfc + l)H]-'H*P(fc + 1) y se tiene
P(fc) = Q + G*[P“'(fc + 1) + HR 1H*] 1G = Q + G*P(k + 1)G - G * P (* + 1 )H [R + H*P(A: + l ) H ] _1H *P(Jt + 1)G Por lo tanto, se ha mostrado que las ecuaciones (8-114) y (8-116) son equivalentes. Problema A-8-2 Para el problema de control óptimo cuadrático donde el sistema está dado por la ecuación (8-1) y el índice de desempeño está dado por la ecuación (8-47), se encontró en la sección 8-2 que el vector de control óptimo u(k) puede estar dado por la ecuación
u(¿) = v(k) - R - ‘ M*x(A:)
(8-117)
donde v(k) está dada por la ecuación (8-54). (8-55) y (8-56) como sigue:
\(k) = -R -'H * (G * ) '[P(tt) - Q]x(/fc) o
\{k) = - R - l n*[p-\k + 1) + H R '! H*] 'Gx(lt) o
v(*) = - [ R + H*P(¿ + l)H pH *P(ifc + l)Gx(tt) donde
P{k) = Q + G*P(k + 1)[I + HR 'H*P(Á: + 1)] 'G ,
www.FreeLibros.me
P (N) = S
(8-118)
Sistemas de control óptimo cuadrático
612
G = G - H R 1M*
Q
y
Capítulo 8
Q-MRM*
Muestre que el vector de control óptimo u(k) se puede expresar como sigue: (8-119)
u(/t) = - [ R + H*P(fc + l)H ]~ ’[H*P(fc + 1)G + M *]x(& )
Solución La equivalencia entre los lados derechos de las tres expresiones de \(k) se demostró en el problema A-8-1. De donde, se puede obtener la ecuación (8-119) si se emplea, por ejemplo, la ecuación (8118) De las ecuaciones (8-117) y (8-118). se tiene u (k) = \(k) - R ~ ‘ M*x(fc) = - [ R + H*P(fc + 1)H] 1H*P(/c + l)G x(fc) - R _1M * x ( t ) = —{[R + H * P (k + 1)H ]^ 1H*P(/c + 1)[G - H R 1M *] + [R + H * P (k + 1 )H ]~ '[R + H*P(A: + 1 )H ]R -1 M*]x(fc) = - [ R + H*P(A: + l)H ]''[H * P (f c + 1)G - H*P(/c + 1 )H R ~ ' M * + M * + H * P (k + 1)H R 1M *]x (£ ) = - [ R + H * P ( ¿ + 1)H]~'[H*P(A: + 1)G + M*]x(fc) que es la ecuación (8-119) Problema A-8-3 Considere el sistema de control de tiempo discreto definido por
\(k + 1) = G x(k) + H u(k) donde G =
1
1
1
0
H =
1
1
x(0) =
0
0
Determine la secuencia de control óptimo u(k) que minimiza el índice de desempeño siguiente 1
i 7
¿
¿ lr = ()
J = ;rx*(8)Sx(8) + - E [x*(/c)Qx(/c) + u*(k)Ru(k)] donde
Q Solución
1 0
0 1
R = 1,
1 0
S =
0 1
Con referencia a la ecuación (8-23), se tiene
P (k) = Q + G*P (k + 1)[I + HR-1 H*P(k + 1)]’ 'G ~1 0 *f
0
1
1 1 p 1 (* + 1) Pi Á k 1 0 -P' i(k + 1) P n ( k
1 o" + 1
1 0
1 o" P Ák + 1) 0 _P Á k + 1)
0
+ 1) +
1)_
p n (k
+
r
P 2 i(k
+
J
1 1
1 0
La condición de frontera para P (k) está especificada por la ecuación (8-25) y está dado por
P (N) = P(8 ) = S =
www.FreeLibros.me
J
i
Capítulo 8
Problemas ejemplo y soluciones
613
’i 0
o" " l 0
l" 0
o"
+
1
0
o' 1_
°J
1 2 = " 2.5 3 0.5 2_
P(6) =
O
1 1
_TL
1
" 1
o
1
0
’l
O
P(7) =
i
1
Ahora se calcula P{k) de atrás hacia adelante desde P(7) hasta P(0): 1
0
1 1
1 0
0.5 1.5 1
2.5 0.5
1 0
0.5 1.5
1 o l 2.5 0 24 7
0
3.4286 0.8571
7
12
7
7
1 1
0.5
6
6
1
1 0
0 1
1 0
0.8571 1.7143
De forma similar, se pueden calcular P(5), P ( 4 ) , . . . , P(0) como se presenta en la tabla 8-2. A continuación se determinará la matriz de ganancia de realimentación K (k). Con referencia a la ecuación (8-27), la matriz K(&) puede estar dada por:
K{k) = R~l H*(G*) '[P(fc) - Q] 1 1
1 0
[P(¿0 - Q]
TABLA 8-2 TABLA QUE MUESTRA P(k), K(k), x(k) Y u(k) PARA k = 0, 1, 2.......... 8, RESPECTIVAM EN TE, PARA E L SISTEM A CONSIDERADO EN EL PROBLEM A A-8-3
k
P (k)
K(fc)
*(*)
u(k)
0
"3.7913 1.0000
1.0000] 1.7913]
[1.0000 0.7913]
1
"3.7911 0.9999' 0.9999 1.7913
[0.9999 0.7913]
2
"3.7905 0.9997] 0.9997 1.7911J
[0.9997 0.7911]
3
"3.7877 0.9986' 0.9986 1.7905
[0.9986 0.7905]
4
"3.7740 0.9932" 0.9932 1.7877j
[0.9932 0.7877]
5
"3.7097 0.9677" 0.9677 1.7742
[0.9677 0.7742]
"0.0003" 0.0437
-0.0342
6
"3.4286 0.8571" 0.8571 1.7143
[0.8571
0.7143]
"0.0099" 0.0003
-0.0087
7
r 2.5000 [0.5000
0.5000 1.5000
[0.5000 0.5000]
r 0.0015" 0.0099
-0.0057
r 1.0000
0.0000"
[o.oooo
1.0000
[0.0000 0.0000]
"0.0057] 0.0015J
0.0000
8
'1.0000"
0.0000^ '0.0000' 1.0000 ' 0.20871
0.0000 "0.0001" 0.2087 "0.0437"
0.0001
www.FreeLibros.me
-1.0000 -0.7913
-0.2087
-0.1651
-0.0435
614
Sistemas de control óptimo cuadrático
= [0
P u (k ) -
1]
1
Capítulo 8
p i 2{ k ) P 2 2 (k ) -
P u (k )
1
= [ p U k ) p 22(k) - 1] Por lo tanto,
K(8) = [p 12(8) p22{ 8) - 1] = [0.0000
0.0000]
K(7) = [p u( 7)
0.5000]
p22( l) - 1] = [0.5000
De forma similar, se pueden calcular K(6), K(5), . . . , K(0) para dar los valores que se presentan en la tabla 8- 2 .
A continuación, se calculará x(k). Se escribe
K(k) = [kl(k)
k2(k)]
Entonces
x(k + 1) = G x(k) + Hu(fc) = [G - HK {k)]x(k) "l - *,(*) 1
1 - k2(k) 0
x,{k) x2(k)
Ya que el estado inicial es
x(0) =
Y 0
x(k), donde k = 1, 2 , . . . , 8, se puede obtener como sigue:
x (l) =
1 -1 1
1 - 0.7913 0
x(2) =
1 - 0.9999 1
1 0
’o.oooo’ 1.0000
1 - 0.7913 ’ o.oooo’ 0 1.0000
0.2087 0.0000
De igual manera, se pueden calcular x(3), x(4), . . . , x(8). Estos resultados se muestran en la tabla 8-2. Finalmente, la secuencia de control óptimo u{k) se puede obtener de la ecuación (8-28):
u{k) = -K(tt)x(A:) Esto es.
u(0) = -K (0)x(0) = - [ 1 k ( 1)
0.7913]
= —K (l)x (l) = -[0.9999
= -1.0000
0.7913]
= -0.7913
De forma similar, se pueden calcular u(2), u{3 ) , .. ., u{8) para dar los valores mostrados en la tabla 8-2 Como se mencionó antes, la matriz de ganancia de realimentación K(&) es constante excepto para los últimos valores de k. Esto significa que si el número de etapas no es 8 sino 100 entonces K(0), K ( 1).. , K(93) serán constantes y K(94), K(95), . . . , K(100) variarán. Este hecho es importante, porque si e'. número de etapas N es suficientemente grande, entonces la matriz de ganancia de realimentación se convierte en una matriz constante y, por lo tanto, el diseñador es capaz de emplear una matriz de ganancia de realimentación constante para aproximar a la matriz de ganancia óptima variante en el tiempo. El valor mínimo d e Jse obtiene de la ecuación (8-36) como sigue:
= ix*(0)P (0)x(0) = i [ l
0]
3.7913 1.0000
= 1.8956
www.FreeLibros.me
1.0000 1.7913
l" 0
Capítulo 8
Problemas de ejemplo y soluciones
615
Problema A-8-4 Con referencia al problema A-8-3, resuelva el problema con M A T LA B. Escriba un programa en M A T L A B para encontrar P(£), K(£), x(k) y u(k). Imprima P(k), K(&), x(k) y u{k).
Solución
E l programa 8-5 de M A T L A B muestra una posibilidad para resolver el problema
Program a d e M A T L A B 8-5 %
C ontrol óptim o c u a d rá tic o ----
% ***** Se resu elve la e cu ació n de R iccati y se e n cu en tra la matriz de ganancia d e realim entación ó ptim a K ***** % ***** M a trice s C , H , S, Q y R ***** C = [1
1; 1 0];
H = [1; 0]; S = [I Q = [1
0; 0 0 ,0
1]; 1];
R - [il; % ***** x 0 = [1; 0], N = 9, p 1 1 (N ) = I , p 1 2 (N ) = 0, % p 2 2 (N ) = 1, x1(1) = 1, x2(1) = 0, Se introducen Pnext = S ***** xO = [1; 0]; N = 9; p l l ( N ) = 1; p 1 2 (N ) = 0; p 2 2 (N ) = 1; x l ( l ) = 1; x2(1) = 0; Pnext = S; % ***** C o m ie n z a la solución de la e cu ació n d e R iccati ***** for i N - 1: -1 : 1, P = Q
+ G '* P n e x t* in v (e y e (2 ) + H * in v (R )* H '* P n e x t)* G ;
p l 1 (i)
= P(1,
1);p12(i) =P(1, 2);p22(¡) =P(2, 2); Pnext = P;
end % ***** La matriz de ganancia de realim en tació n óptim a K se o b tie n e de ***** for i = N : - 1: 1, K = in v (R )* H '* in v (G ')* ([p 1 1 (¡)
p12(i); p12(i)
p 22(i)] - Q);
k1(i) = K(1); k2(i) = K(2); end % ***** El co ntrol u(k) se o b tie n e d e ***** for 1 = 1: N - 1, xnext = (G - H *[k1 (i)
k2(i)])*[x1 (i); x2(i)];
x1 (i + 1) = xnext(1); x2(i '1 ) = xnext(2); end for i = 1: N, u(i) = - [k l(i)
k2fi)]*[x1 (i); x2(i)];
end
www.FreeLibros.me
Sistemas de control óptimo cuadrático
16
Capítulo 8
Al emplear este programa, la matriz P. la matriz K, el vector x y el vector u se pueden obtener como se muestra a continuación
% ***** Impresión de P, K, x, y u ***** P = [p 1 1;p 1 2 ;p1 2 ;p2 2 ] P = C olu m n s 1 through 7 3.7913
3.7911
3.7905
3 .7877
3 .7 7 4 0
3 .7 0 9 7
3 .4 2 8 6
1.0000
0 .9 9 9 9
0 .9 9 9 7
0 .9 9 8 6
0 .9 9 3 2
0 .9 6 7 7
0.8571
1.0000
0 .9 9 9 9
0 .9 9 9 7
0 .9 9 8 6
0 .9 9 3 2
0 .9 6 7 7
0.8571
1.7913
1.7913
1.7911
1.7905
1.7877
1.7742
1.7143
0.2087 0.0000
0.0001 0.2087
0.0437 0.0001
0.0003 0.0437
0.0099 0.0003
C olu m n s 8 through 9 2.5000
1.0000
0 .5 0 0 0
0
0 .5 0 0 0
0
1.5000
1.0000
K = [k l;k 2 ]' K= 1.0000
0.7913
0 .9 9 9 9
0.7913
0 .9 9 9 7
0.7911
0 .9 9 8 6
0.7905
0 .9932
0 .7877
0 .9 6 7 7
0.7742
0.8571
0.7143
0 .5 0 0 0
0 .5000
0
0
x = [x l ;x2] x = C o lu m n s 1 through 7
1.0000 0
0.0000 1.0000
www.FreeLibros.me
Capítulo 8
Problemas ejemplo y soluciones
617
C olum ns 8 through 9 0 .0 0 1 5 0 .0 0 9 9
0 .0 0 5 7 0 .0 0 1 5
u = u' u = 1.0000 -0.7913 - 0 .2 0 8 7 -0.1651 - 0 .0 4 3 5 -0 .0 3 4 2 - 0 .0 0 8 7 - 0 .0 0 5 7 -
0
En esta impresión, P0, P1, . . ., P8 están dados como vectores columna. La primer columna de la matriz P da P0, la segunda da P I . y así sucesivamente. En cada columna el primer renglón da p11, el segundo y tercero dan p12. y el cuarto p22. K0, K1, . . ., K8 están dados como vectores renglón en la matriz K. El primer renglón corresponde a K0 y el último a K8. xO, x l , . . . , x8 están dados como columnas de la matriz x. La primer columna corresponde a xO y la última corresponde a x8. uO, u1, . . ., u8 están dados como el primero, segundo,. . . , noveno renglón del vector u.
Problema A-8-5 Considere el sistema de control escalar
x(k + 1) = gx(k) + hu(k)
( 8- 120)
y el índice de desempeño
¿ k=o donde q > 0 y r > 0. En la sección 8-3 se mostró que la ley de control óptimo que minimiza el índice de desempeño J puede estar dada por
u{k ) = —Kx(k)
( 8- 122)
A l sustituir la ecuación (8-122) en la ecuación (8-120), se obtiene,
x(k + 1) = (g - hK)x(k)
(8-123)
A l sustituir la ecuación (8-122) en la ecuación (8-121), se tiene
J = \ 2 {q + r K 2)x\k) A l emplear el enfoque de Liapunov y con referencia a la ecuación (8-94), se establece que
(,q + rK2)x2(k) = - [ p x \ k + 1) - px \k )]
www.FreeLibros.me
(8-124)
Sistemas de control óptimo cuadrático
618
Capítulo 8
A l sustituir la ecuación (8-123) en la ecuación (8-124). se obtiene
(q + rK 2)x2(k) = {-p(g - h K )2 + p ]x 2(k) O
[q + r K 2 + p(g - h K )2 - p ]x2(k) = 0 Esta última ecuación se debe mantener para cualquier x(k). De donde, se requiere que
q + r K 2 + p(g - h K )2 - p = 0
(8-125)
Muestre que la ley de control óptimo se puede dar por
u(k) = - Kx(k ) = -ghp(r + p h 2)~ 'x ( k ) 0
K = ghp(r + ph2)-'
(8-126)
También muestre que p se puede determinar como una raíz positiva de la siguiente ecuación: 9 Solución
P
+ g2rP
(r
+
P h 2) - '
=0
(8-127)
Con referencia a la ecuación (8-88), el índice de desempeño J se puede determinar como sigue:
J = \px\ 0) Para minimizar el valor de J para un valor dado .x(O) con respecto a K , se tiene
3K = 0
(8-128)
dondep está dado por la ecuación (8-125). Observe que en la ecuación (8-125) 1 - (g - hK)2 A 0. Por lo tanto, p puede estar dada por:
r '
<7+ rK2> 0. De donde.
(8- '291
Al diferenciar a p respecto a Ai y al igualar el resultado a cero, se obtiene
dp 3K
2rK[\ - (g - h K )2) ~ ( q + r K 2)[2(g - hK)h] [1 - (g - h K )2}2
queda
rK{ 1 - ( g - h K )2} - { q + rK 2)(g - hK)h = 0 De donde, se obtiene
q + rK 2
=
rK
1 - (g - h K )2 ~ h(g - hK)
(8-130)
De las ecuaciones (8-129) y (8-130), se obtiene
P
h(g - hK)
(8-131) ,2 -
Al resolver la ecuación (8-131) para K y observando que r + ph > 0, se tiene K = j f ^
2 = g h p { r + p h 2) '
que es laecuación (8-126) A l sustituir la ecuación (8-132) en la ecuación (8-125),
www.FreeLibros.me
(8-132)
Capítulo 8
Problemas ejemplo y soluciones
619
p = 0
(r + ph2)2 ' r \r + ph2 que se puede simplificar a
q - p + g2rp (r + ph2)-' = 0 que es la ecuación (8-127). El mismo resultado se puede obtener en la forma siguiente. Primero observe que la ecuación (8-125) se puede modificar como sigue:
q + (r + ph2)K 2 - 2ghpK + pg2 - p = 0
q + pg2 - p + V r + ph2)
\
- ¿ £ ¿ =0
(8-133)
r + Ph
Entonces, al considerar esta última ecuación como una función de K, el mínimo del lado izquierdo de esta ecuación con respecto a K ocurre cuando
Vr
ghp
+ ph2K
= 0
V i + ph' O
K = ghp(r + ph2y l
(8-134)
que es la ecuación (8-126). Al sustituir la ecuación (8-134)en la ecuación (8-133). se obtiene
que se puede simplificar como sigue:
q - p + g2rp(r + ph2) ' = 0 que es la ecuación (8-127). Problema A-8-6 Considere el sistema definido por
x,(k + 1) x2(k + 1)
-0.5 0
x, (k)
-0.5 1.5
x2(k)
Muestre que este sistema no puede ser estabilizado mediante el esquema de realimentación del estado:
u(k) = -Kx(Á:) cualquiera que sea el valor de la matriz K. Se define a K = [*,
Jt2]
-0.5 1.5
-
1
0 [*.
Por lo tanto, la ecuación característica se convierte en
k 2} =
www.FreeLibros.me
1
-0.5 0
°
G - HK =
1 P
1
Entonces
1
Solución
-0.5 - 0.5V 1.5
Sistemas de control óptimo cuadrático
620
\zl - G + HKl = =
z + 0.5 + k¡ 0
(z
+ 0.5 +
Capítulo 8
0.5 + 0.5k2 2-1.5
kt)(z -
1.5) = 0
Los polos de lazo cerrado están localizados en
2 = -0.5 — ki,
z = 1.5
Ya que el polo en z = 1.5 está localizado fuera del círculo unitario, el sistema es inestable, cualquiera que sea el valor de la matriz K . Por lo tanto, la técnica de control óptimo cuadrático no se puede aplicar a este sistema. (La solución del problema del control óptimo cuadrático no existe.) Problema A-8-7 Considere el sistema
Xi (k + 1)‘ x2(k + 1).
’o 1
o" 1
-j- Y u(k), 0
* i(* )
x2(k)
’ l" 1
* 2(0)
(8-135)
y el índice de desempeño
(8-136)
donde 1 0
0 0
R = 1
Determine la ley de control óptimo que minimiza el índice de desempeño. También determine el valor mínimo de J. Solución
De la ecuación (8-135) se tiene 0 1
G =
0 1
H =
La matriz P se puede determinar de la ecuación (8-101), o
P = Q + G*P(I + H /T 'H ’ P r ' G
(8-137)
Como las matrices Q, G, H y R son reales, la matriz P es una matriz real simétrica. A l sustituir las matrices dadas Q, G, H y R en la ecuación (8-137), se obtiene
Pn Pn
1 0
Pn P 22
o’ + ’ o 0 0
l" 1
Pu Pn
Pn ( ’ l P 22 \ 0
0" 1
i
0 0
’l’ [1 0
0]
Pu Pn
Pn y P 22 1
1 o’ + -----0 1 + Pu
Pn Pn
P 2 2 ~ P 12 P22¡ 1 + p n
1 1
Al simplificar esta última ecuación, se obtiene
Pn Pn
Pn P 22
’l 0
www.FreeLibros.me
—Pí2 1 + Pu
Problemas ejemplo y soluciones
621
+
+ P l l )
P > 2 (1
+ P l l )
P 22( l
+ P l l )
+
P
11)
P l l ( l P l 2( l
O
1
Capítulo 8
0
0
P l 2 + P 2 2 ( l + P\\)
P12 + ^22(1 + p n )
+ ^22(1 + p n )
~Pn + P2i(l + Pn)
~P
.
.2 12
Esta última ecuación es equivalente a las tres ecuaciones siguientes: Pn(
1 + P n ) = 1 + p n ~ P n + P 22( l + P 1 1 )
Pn(
1 + P n ) = - p n + P 22 O + P n )
P 2 2 (l + P 1 1 ) = ~Pn + P 22( l + P n ) A l resolver estas tres ecuaciones parapn,p |2y p 22, se requiere quepM > 0, se obtiene
Pn
=
1,
p
i2
=
0 ,
p 22
=
0
De donde
P =
1 0
0 0
(8-138)
La ecuación (8-13 8) da la solución requerida de la ecuación de Riccati en estado estacionario. Con referencia a la ecuación (8-79), se tiene
= - 2 ~ ’[0
0]
1
1 O
= - ( l + l)" '[l
0" 0
0
1
u(k) = - ( R + H*PH)"‘ H*PGx(/t) 0"
1
1
x(*) (8-139)
0]x(*) = 0
La ecuación (8-139) da la ley de control óptimo. El sistema en lazo cerrado se convierte en
x(k + 1) = Gx(k) + H u(k) =
0 1
0 1
x(k)
(8-140)
La ecuación (8-140) dala operación óptima en lazo cerrado del sistema. Los polos de lazo cerrado están en /u-i = 1 y /x2= 0. El sistema en lazo cerrado no es asintóticamente estable. E l valor mínimo de Js e obtiene de la ecuación (8-81), como sigue:
|x*(0)P x(0) = |[ 1 Aunque el sistema no es que u(k) = 0 para k = 0,
1]
1 0
0" 1 0
1
asintóticamente estable,el índice de desempeño es finito y mínimo. De hecho, ya 1,2 , . . . , la ecuación del sistema se convierte en X i ( k + 1) = 0 x 2( k + 1) = X i ( k ) + x 2( k )
x,(0) = 1,
x,(A:) = 0,
* = 1,2,3,...
x2(0) = 1,
x2(k) = 2,
* = 1,2,3,...
Observe que el índice de desempeño es finito, porque involucra en xt(k), pero no involucra a x2(k).
www.FreeLibros.me
Sistemas de control óptimo cuadrático
622
Capítulo 8
Este problema de ejemplo ha mostrado que en un caso académico pero no práctico, el control óptimo cuadrático no produce un sistema asintóticamente estable. Problema A-8-8 Si un sistema de control de tiempo discreto lineal de orden n de una entrada y una salida es de estado completamente controlable, se necesita al menos n periodos de muestreo para llevarlo desde un estado ini cial arbitrario a un estado final deseado, considerando que el vector de control no está limitado. Por lo tanto, si se permite que N (N > n) periodos de muestreo, entonces se tendrá libertad adicional para satisfacer especificaciones adicionales. La cantidad de energía de control que se necesita depende del intervalo de tiempo (número de periodos de muestreo) permitido para control. Si el número de periodos de muestreo permitido es n, el 'orden del sistema, entonces la secuencia de control de tiempo óptimo w(0), u( 1) ,. .., u(n - 1) es única. Sin embargo, si se permiten N periodos de muestreo (N > n), entonces es posible más de una secuencia de control. Cada secuencia de control posible requiere una cierta cantidad de energía de control. En muchas aplicaciones industriales, si son posibles muchas secuencias de control, es preferible lograr las tareas de control empleando la cantidad mínima de energía. En este problema, se trata de transferir el estado desde un estado inicial arbitrario al estado final deseado (que se supone es el origen del espacio de estado) en jV periodos de muestreo y al mismo tiempo usar la mínima cantidad de energía de control. Considere el sistema de control definido por
x(k + 1) = G x (* ) + H u ( * )
(8-141)
donde
x(k) = vector de estado (vector-n) en el instante de muestreo k u(k) - señal de control (escalar) en el instante de muestreo k G = matriz no singular de n x n H = matriz de n * 1 Determine la ley de control que llevará al estado del sistema desde un estado inicial arbitrario al origen en N periodos de muestreo (donde N >n) al usar la mínima cantidad de energía, donde la energía de control se mide con 1 * _1
? 2 u\k)
L *«0
Suponga que el sistema es de estado completamente controlable. Solución como
Con referencia a la ecuación (5-30), el estado x(N) de la ecuación (8-141) se puede escribir
x(N) = G "x (0 ) + G ^ -1 H u(0 ) + G ív_2Hm(1) + ••• + GHi/(7V - 2) + H u(N - 1) A l sustituir 0 por x(N) en esta última ecuación x(0) = - G -1H « (0 ) - G “ 2H m (1 )
G~n+1H u (N - 2) - G s Hu(N - 1)
(8-142)
Se define
f, = G “ ‘H Entonces la ecuación (8-142) se convierte en
www.FreeLibros.me
(8-143)
Capítulo 8
Problemas ejemplo y soluciones
623
- fN^ u ( N - 2) - f„u(N - 1)
(8-144)
Ya que el estado es completamente controlable, los vectores f,, f2, . . . , f„ son linealmente independientes. (Los N - n vectores restantes se pueden expresar como una combinación lineal de estos n vectores linealmente independientes.) La ecuación (8-144) se puede reescribir como
x(0) = -FU
(8-145)
donde
F=
U(0) u(l)
U=
u{N - 1) Ahora se encontrará la secuencia de control que satisface la ecuación (8-145) y al mismo tiempo minimiza la energía de control total. Observe que la matriz F es de n x N y tiene rango n. Ya que F no es una matriz cuadrada, la inversa de F no está definida. Observe que como N > n el número de señales de control desconocidas «(0), u(l), , u(N- 1) en la ecuación (8-145) es mayor que el número n de ecuaciones escalares. Un conjunto de ecuaciones escalares en esta situación se dice que es indeterminado y posee un número indefinido de soluciones. Sin embargo, en este caso se tiene una limitante que hace que un conjunto de N variables desconocidas u(0), u{\),..., u(N - 1) produzcan una norma mínima: 1 'v_1 2 u2(k) *-0
,
mínimum
Entonces, como se observa en el apéndice A (Sección A-8), existe una solución única. Dicha solución da la secuencia de control que lleva a un estado inicial arbitrario x(0) al origen en N periodos de muestreo y al hacer esto minimiza la energía de control total. La solución minimizante en dicho problema, donde el número de variables desconocidas es mayor que el número de ecuaciones, se puede obtener en términos de la pseudoinversa derecha (refiérase al apéndice A). La pseudoinversa derecha se define como sigue:
¥RM = F*(FFT
(8-146)
A l emplear la pseudoinversa derecha, la secuencia de control de energía mínima «(0), u{ 1),..., u(N - 1) que transfiere aun estado inicial arbitrario x(0) al origen está dada por U
=
- F
r m x
(0 )
= -F * (F F * )‘x(0)
(8-147)
Observe que F*(FF*) 1es una matriz de N x n. De donde, F*(FF*) 1posmultiplicada por x(0) es una matriz de N x 1. La ecuación (8-147) se puede rescribir como:
u(0) H(l)
= —F*(FF*)
x(0)
(8-148)
u(N - 1) La secuencia de control dada por la ecuación (8-148) llevará a un estado inicial arbitrario al origen en N periodos de muestreo y requerirá la mínima cantidad de energía entre todas las secuencias de control posibles que requieren N periodos de muestreo.
www.FreeLibros.me
Sistemas de control óptimo cuadrático
624
Capítulo
Problema A-8-9 Considere el sistema
\(k + 1) = G \(k) + Hu(Ac)
(8-149 ^
donde ’l
0.6321
0
0.3679
H =
0.3679' 0.6321 ’
5~
xi(0)
x2(0)
-5
Se desea llevar al estado inicial al origen en tres periodos de muestreo. (El periodo de muestreo se supone de 1 segundo.) Entre la infinidad de posibles opciones para la secuencia de control, determine la secuencia de control óptimo que minimizará la energía de control, o la que minimizará el siguiente índice de desem peño.
J = \ S U2(k) ¿
Solución
4-0
De la ecuación (8-144), el estado inicial x(0) se puede escribir como sigue: x(0) =
-f,u ( 0 ) - fc « (l) - f3u(2)
donde
fj = G
'H
'-0 .7 1 8 1 ' 1.7181
f2 = G 2H =
-3.6701 4.6701
f3 = G 3H =
-11.6939 12.6939
De donde, - r n\ Jfi(O)
_—0.7181 n tiqi 1.7181
x2(0)
k
(0) -
-0.7181 1.7181
*i(0 ) x:2(0)
¿am —3.6701 4.6701 « (1 ) -
-3.6701 4.6701
_-11.6939 11 t n i o u( 2) 12.6939
-11.6939 12.6939
«(0 ) m ( 1)
(8-150)
u(2)
Mediante el uso de la pseudoinversa derecha, se puede obtener la solución de la norma mínima de la ecuación (8-150) como «(0 ) «(1 ) u( 2)
donde
F =
= - F r m x (0) = - F * ( F F * ) _1
-0.7181 1.7181
-3.6701 4.6701
x¡(0) x2(0)
-11.6939 12.6939
La pseudoinversa derecha F"'wse determina como sigue:
jr
= F * (F F * )
-0.7181 -3.6701 -11.6939 0.7910 0.5000 -0.2910
1.7181 4.6701 12.6939 0.7191 0.4738 -0.1929
de donde,
www.FreeLibros.me
150.7326 -166.8147
-166.8147 185.8968
Capítulo 8
Problemas ejemplo y soluciones
625
0.7910 0.5000 -0.2910
11(0) «(1 ) «(2 )
0.7191 0.4738 -0.1929
C -5
=
-0.3598 -0.1310 0.4908
(8-151)
La secuencia de control dada por la ecuación (8-151) llevará al estado inicial al origen en tres periodos de muestreo y también minimiza la energía de control total. Al emplear la secuencia de control óptimo dado por la ecuación (8-151), el estado se puede transferir como: * i( l)
=
* 2 (1 ).
*i(2) *z(2). Xi(3) * 2 (3 )
1.7071 -2.0669
- 5
0
0.6321" 0.3679
1.7071 -2 .0 6 6 9
+
0.3679" [-0.1310] 0.6321
1 0
0.6321" 0.3679
0.3524 -0 .8 4 3 2
+
0.3679 [0.4908] = 0.6321
’ l
5
0.3679 0.6321
0.6321 0.3679
1
0
+
-0.3598] =
0.3524 -0.8432
La mínima cantidad de energía para este control es 1 1 1 /ni„ = ~ 2 U2(k) = - [u 2(0) + u2( l ) + u2(2)] = -[(-0.3598)2 + (-0.1310)2 + (0.4908)2] = 0.1937 Es interesante comparar la energía mínima obtenida aquí con la energía requerida para el sistema de control de tiempo óptimo. El sistema de control de tiempo óptimo requiere 2 periodos de muestreo. En el problema A-6-2, la secuencia de control de tiempo óptimo u(0) y u{ 1). donde el periodo de muestreo era de 1 segundo, se encontró como
u( 0) =
-1.5820x,(0) - 1.2433x2(0)
u ( l) = 0.5820x,(0) + 0.2433x2(0) [Refiérase a la ecuación (6-231).] Al tomar x,(0) = 5 y x2(0) = -5 y al sustituir estos valores en estas dos ecuaciones, se obtiene u(0) = -1.6935 y w(l) = 1.6935. Por lo tanto, para el control de tiempo mínimo la energía total requerida es 1
[w2(0) + tr2( l ) ] = -[(-1 .6 9 3 5 )2 + (1.6935)2] = 2.8679
Observe que al permitir que la duración del control sea de tres periodos de muestreo (3 segundos), en lugar de dos periodos de muestreo, la energía requerida se puede reducir notablemente. Problema A-8-10 Considere el sistema de péndulo invertido mostrado en la figura 8-10, donde un péndulo invertido está montado sobre un carro impulsado por un motor. En este caso se considera sólo el problema en dos dimensiones en que el péndulo se mueve únicamente en el plano del papel. El péndulo invertido es inestable ya que puede caer en cualquier momento a menos de que se aplique una fuerza de control adecuada. Suponga que la masa del péndulo está concentrada en el extremo de la varilla como se muestra en la figura. (Se supone que la varilla no tiene masa.) La fuerza de control u se aplica al carro. En el diagrama. 0esel ángulo de la varilla respecto a la línea vertical. Se supone que des pequeño por lo que el sen 8 y el eos 9 se puede aproximar a 9 y a 1 respectivamente, y también se supone 0 que es pequeño por lo que 00 2 =. (Bajo estas condiciones, las ecuaciones del sistema no lineal se pueden linealizar.)
www.FreeLibros.me
Sistemas de control óptimo cuadrático
626
Figura 8-10
Capítulo 8
Sistema de péndulo invertido.
Se desea mantener el péndulo en la posición vertical en respuesta a cambios escalón en la posición del carro. (La fuerza de control u se aplica al carro.) Primero obtenga el modelo en el espacio de estado en tiempo continuo. Después discretice dicho modelo y obtenga el modelo discreto. Suponga que el periodo de muestreo T es de 0.1 segundos. Suponga los siguientes valores numéricos para M, my I:
M = 2 kg,
m = 0.1 kg,
/ = 0.5 m
(En la sección 8-4 se diseñó un controlador digital para el sistema de péndulo invertido.) Solución Se define el ángulo de la varilla desde la línea vertical como 6. (Como se desea mantener al péndulo invertido en posición vertical, se supone que 6 es pequeño.) También se definen las coordenadas (x, z) del centro del gravedad de la masa como (x(h zG). Entonces
xG = x + / sen 0
z G = l eos 6 Al aplicar la segunda ley de Newton en la dirección z del movimiento se obtiene
t, d 2x dt2
d2xc dt2
M —r r + m —r-r- = u , . . , d 2x d2 . " ‘ —jjT + m ^ 2 (x + ‘ ser>0) = h Observe que
d_ sen# = (eos 0)0 dt £_ sen 0 dt2
= - ( s e n 0)0 2 + (e o s 0 )0
www.FreeLibros.me
(8-1521
Capítulo 8
Problemas e|emplo y soluciones
627
La ecuación (8-152) se puede escribir como
(M + m)x - m! (sen 0)0 2 + mi (eos (
(8-153)
La ecuación del movimiento de la masa m en la dirección r no se puede escribir sin considerar el movimiento de la masa men la dirección x. Por lo que. en lugar de considerar el movimiento de la masa m en la dirección r. se considera el movimiento rotacional de la masa m alrededor del punto P. Ai aplicar la segunda ley de Newton al mov imiento rotacional, se obtiene
d2xG, a d1zo , . . a m — l eos 6 — m —-v t sen 9 = mgl sen 9 dt' dt'
m ~dP^X + ^S£n ^
l eos 6 -
d ,, m-rs(l eos 9) l sen 9 = mgl sen 9 dt
que se puede simplificar como sigue:
m[x — l(sen0)¿2 + l(cos9)6]l eos 0 — m [-l(cos9)92 - l(send)9}l sin 6 = mgl sen 9 Una simplificación posterior resulta en
mx eos 9 + mié = mg sen#
(8-154)
Al sustituir el sen 9 + 0. eos 9 1. y 992 + 0. las ecuaciones (8-153) y (8-154) se pueden linealizar como sigue:
(M + m)x + mié = u mx + mié = mg9
(8-155) (8-156)
Estas ecuaciones lineal izadas son válidas mientras 9x0 sean pequeñas. Las ecuaciones (8-155) y (8-156) definen un modelo matemático del sistema del péndulo invertido. Las ecuaciones del sistema linealizado. ecuaciones (8-155) y (8-156). se puede modificar a
Mié = (M + m)g9 — u Mx = u — mgd
18-157) (8-158)
La ecuación (8-157) se obtuvo al eliminar x de las ecuaciones (8-155) y (8-156). La ecuación (8-158) se obtuvo al eliminar 0 de las ecuaciones (8-155) y (8-156). Las variables de estado .y,, .y,, .y, y ,y4 se definen como
Xi = 9 x2 = 6 Xj = X X4 = X Observe que el ángulo 6 indica la rotación de la varilla del péndulo alrededor del punto P. y x es la ubicación del carro. Se considera a.y como la salida del sistema, o
y = x = Xy Entonces, de la definición de las variables de estado y de las ecuaciones (8-157) > (8-158). se obtiene
www.FreeLibros.me
Sistemas de control óptimo cuadrático
628
Capítulo 8
Xl = x2
*2 =
1
M + m
mi
~8X'
Mr
x3 = x4 m 1 ~ M gX' + M “
Xi
En términos de las ecuaciones vector-matriz, se tiene
0 *1
Xl X3 Xi
1
0
0
0
M +m ---------- 2 MI 6
0
0
0
Xl x2
0
0
0
1
*3
m ~M 8
0
0
0
.
y = [0 0
MI
(8-159)
0 J_
Xi
M J
(8-160)
1 0]
Las ecuaciones (8-159) y (8-160) dan una representación en el espacio de estado del sistema de péndulo invertido. (Observe que la representación en el espacio de estado no es única. Existen una infinidad de esas representaciones.) A l sustituir los valores numéricos de M, n y /, se obtiene
M +m MI
- 20.601,
l „ .
0.4905,
± ¡ = 1,
¿ = 0.5
Entonces la ecuación de estado y de salida para el péndulo invertido con carro se convierte en:
x = Ax + Bm
(8-161)
y = Cx + Du
(8-162)
donde
0 20.601 0 -0.4905
1 0 0 0
0 0 0 0
0 0 , 1 0
D — o —
0 -1 0 0.5
C = [0
0
1
0],
D =0
Ahora, se discretiza la ecuación de estado, ecuación (8-161). La discretización se logra al emplear el siguiente comando de M A T LA B:
[G,H] = c2d(A,B,T) donde T es el periodo de muestreo involucrado en el sistema de control de tiempo discreto. En este problema T ■=0.1 segundos. Entonces el comando
[G,H] = c2d (A ,B ,0 .1 ) transformará la ecuación de estado en tiempo continuo en la ecuación de estado en tiempo discreto. Observe el siguiente comando y salida de M A T LA B.
www.FreeLibros.me
Capítulo 8
629
Problemas
A = [0
1
0
0
20.601
0
0
0
0
0
0
1
- 0 .4 9 0 5
0
0
0];
B = [0 ;- 1 ;0 ;0 .5 ]; [G ,H ] = c 2 d (A ,B ,0 .1 ) G = 1.1048
0.1035
0
2.1316
1.1048
0
0 0
- 0 .0 0 2 5
--0.0001
1.0000
0 .1000
- 0 .0 5 0 8 --0.0025
0
1.0000
H = -0 .0 0 5 1 - 0 .1 0 3 5 0.0025 0.0501 Por lo tanto, el modelo discretizado en el espacio de estado está dado como sigue:
x(k + 1) = Gx(&) + H u(k) y{k) = Cx(k) + Du(k) donde
0.1035 1.1048 -0.0001 -0.0025
1.1048 2.1316 -0.0025 -0.0508
C = [0 0
0 0 0 0 1 0.1 0 1
H =
-0.0051 -0.1035 0.0025 0.0501
D =0
1 0],
PROBLEMAS Problema B-8-1 Considere el sistema discreto
x(k + 1) = Gx(fc) + Hh(&) donde
G =
0 -0.5
1 , 1
H =
1
1
x(0) =
2 2
Determine la secuencia de control óptimo u (k) que minimiza el índice de desempeño siguiente:
www.FreeLibros.me
Sistemas de control óptimo cuadrático
630
Capítulo 8
J = ^x*(8)Sx(8) + r 2 [x*(k)Qx(k) + u*(k)Ru(k )] 2
2*_0
donde
Q =
i 0
o 1
R = 1,
1 0
S =
0 1
Problema B-8-2 Considere el sistema
x(k + 1) = G x(k) + H u (& ) donde 0 -0.5
G =
o" 1
H =
1
x(0) =
0
2 2
y el índice de desempeño
J = T 2 [x*(k)Qx(k) + u*(k)Ru(k )] donde 1 O O 0.5
Q
R =1
Determine la ley de control óptimo que minimiza el índice de desempeño. También determine el valor mínimo deJ. Problema B-8-3 Considere el sistema definido por
x¡ (k + 1) x2(k + 1)
"l
a
f -1
xi(k) _x2(k)_
x,(0) x2(0)
1 1
donde -1 < a < 0. Determine el valor de a tal que el índice de desempeño
J = \ 2 x*(k)Qx(k) ¿ k—
donde
Q =
1 0
0 0.5
se minimice. Problema B-8-4 Un sistema de control discreto está definido por la ecuación
x(k + 1) = 03619x(k) + 0.6321w(*) Determine la ley de control óptimo que minimice el siguiente índice de desempeño: 2 = ^ 1 \x2{k) + u2(k )] ¿ k=()
También determine el valor mínimo del Índice de desempeño J .
www.FreeLibros.me
Capítulo 8
Problemas
631
Problema B-8-5 Considere el mismo sistema tratado en el problema A-8-6. ¿Es posible determinar una matriz definida positiva P para este sistema? Utilice la ecuación (8-101) para determinar la matriz P. Problema B-8-6 Considere el sistema definido por las ecuaciones
x(k + 1) = Gx( k) + Hu(fc) y ( k) = Cx( k) donde x{k) es un vector n, ufk) es un vector r. y(k) es un vector-m. G es una matriz de n x n. H es una matriz de n * r . y C es una matriz de m x n. El índice de desempeño es
x*( k) Qx(k) + u*(/r)Ru(A:)] donde Q es una matriz Hermítica definida positiva de n * n y R es una matriz Hermítica definida positiva de r x r. La ley de control óptimo que minimiza al índice de desempeño está dada como u(A:) = -Kx(rt). Muestre que si el sistema es de estado completamente controlable y observable entonces la ecuación algebraica de Riccati P = Q + G P G * - G P C * (R + C P C * ) '1C P G * tiene una solución definida positiva única. Muestre también que el sistema en lazo cerrado óptimo es estable, o G - H K es una matriz estable. Problema B-8-7 Con referencia al problema A-8-9. resuelva el mismo problema con M A T LA B. Determine la secuencia de control óptimo n(0), u( 1) y u(2). Problema B-8-8 Considere el sistema X i ( k + 1)
x2(k + 1)
1 1
1 0
xi{k)
u(k),
x2{k)
*>(0) x2(0)
Se desea llevar el estado inicial al origen en n periodos de muestreo. Determine la ley de control óptima que minimiza la energía de control medida con
J = l ¿ u \k) ¿ k=0
Considere los valores de n\ n = 2, n = 3 y n = 4. Problema B-8-9 Considere el diseño del sistema de seguimiento mostrado en la figura 8-11. La planta no involucra un integrador, por lo que se incluye un controlador integral en el lazo. El periodo de muestreo T es de 0.1 segundos. Muestre que el sistema de ecuaciones se puede dar mediante las siguientes ecuaciones en el espacio de estado:
x(k
+ 1) = Gx(tfc) + H tv (/ t)
w(k) =
- K x (fc )
www.FreeLibros.me
Sistemas de control óptimo cuadrático
632
Capítulo 8
donde
x(k) =
x t(k) x2(k)
G=
0.5 -0.5
x ( k ) —at(oo) v(k ) - v(°°) 0 1
w(k) = u(k) — m(<») K = [k2 - * ,]
H
Problema B-8-10 Con referencia al problema B-8-9, se desea diseñar la matriz de ganancia de realimentación del estado K = [k2 -A',] tal que el sistema tenga una respuesta al escalón razonable. Se supone que se emplea el esquema de control óptimo cuadrático. Se supone el índice de desempeño siguiente:
/ = \ 2 [x(*)*Qx(*) + w(k)*Rw(k)] ¿ k-0
Si Q y R se escogen como definidas positivas, el sistema resultante es estable. Para este problema, se escogen
Q=
r 100 0
0 1
R
Observe que Q y R son sólo un conjunto posible. (Se pueden seleccionar otras Q y R definidas positivas. El sistema resultante es estable pero diferente para cada conjunto distinto de Q y R.) Empleando la representación en el espacio de estado del problema B-8-9, determine la matriz K con M A T L A B . Escriba un programa en M A T LA B . A l utilizar la matriz K así determinada, obtenga la respuesta al escalón del sistema diseñado con ayuda de M A T LA B. Dibuje la gráfica dey(k) contra k y v(k) contra K.
www.FreeLibros.me
Apéndice A Análisis vector-m atrices
A - I D EFIN IC IO N ES Las matrices que se encuentran con frecuencia en el estudio de la teoría de control moderna son la matriz simétrica, la matriz anti-simétrica, la matriz ortogonal, la matriz Hermítica, la matriz antiHermítica, la matriz unitaria y la matriz normal. Las siguientes ecuaciones definen estas matrices: A 7' = A
A es simétrica
A 7 = -A
A es anti-simétrica
A A 7' = A 7A = I
A es ortogonal
A* = A
A es Hermítica
A* =
A es anti-Hermítica
A
AA* = A *A = I AA* = A *A
A es unitaria o
A A r = A 7A
A es normal
donde el superíndice * denota la transpuesta conjugada y el superíndice T significa la transpuesta.
A-2 D ETERM IN A N TES
Determinantes de una matriz de 2 * 2, 3 * 3 y 4 * 4.
A
=
ai bi
Para una matriz A de 2 x 2, se tiene
a2 = ai b2 - b¡ a2 b2 633
www.FreeLibros.me
A nálisis
634
vector-matriz
A p én d ice
A
Para una matriz A de 3 x 3, |A
ai = b¡ Ci
a2 a¡ b2 b3 - a ib 2c2 + b {c2a2 + cxa2b3 - c ,b 2a3 - b l a2c3 - al b3c2 c2
c3
Para una matriz A de 4 x 4. |A! =
a2 a3 a4 bi b3 b4 c2 c3 c4 d2 d3 d4
ai b¡ ci ¿i
o2 'c3 c4 i b2\ d3 d4\
a,
bi ai di
b3 b4 \ c2\ d3 d4\
«2 j b¡ b4 4- b i d2i c3 c4 Ci
b ] bi\ «3 d t d2\ C.3 c4
ti
di
b2 a3 a4 c2 d3 d4 c2 \a¡ a4 d2 \b3 b4
( A - 1i
(Esta expansión se llama expansión de Laplace por menores.)
Propiedades del determinante.
El determinante de una matriz de n x n tiene las siguientes
propiedades: 1. Si dos renglones (o dos columnas) del determinante se intercambian, sólo el signo del determi nante se cambia. 2. El determinante es invariante bajo la suma de un escalar múltiplo de un renglón (o una colum na) a otro renglón (o columna) 3. Si una matriz de n x n tiene dos renglones (o columnas) idénticos, entonces el determinante es cero. 4. Para una matriz A de n x n,
¡A7] = |A|,
|A*| = |A|
5. El determinante de un producto de dos matrices A y B de n x n es el producto de sus determi nantes
|AB¡ = A B = BA 6. Si un renglón (o una columna) se multiplica por un escalar k , entonces el determinante se multiplica por k. 7. Si todos los elementos de una matriz de n x n se multiplican por k , entonces el determinante se multiplica por k', es decir,
|AA| = Ar"|A| 8. Si lo valores propios de A son A, (/ = 1 , 2 , . . . , n), entonces
¡A| = Ai A2 . . . A„ De donde, |Aj =A 0 implica que A, + 0 para i = 1 , 2 , . . . , n. (Para detalles de los valores propios, vea la sección A-6.)
www.FreeLibros.me
Sección A-3
9.
Inversión de matrices
635
Si las matrices A , B , C y D son de n * n, de n x m, de m x n y de m x ni, respectivamente, entonces A 0
B D
A C
0 D = |Aj|Dj,
A 0
B D
A C
0 D = 0,
si A| A 0 y ]D| A 0
(A-2)
si |A| = 0 o IDI = 0 o 1Al = !D| = 0
También,
A C
B D
¡A||D - CA-1 B|, |D||A - B D '1cj,
A¡ * D| *
0
(A-3)
0
(A-4)
[Para obtener la ecuación (A-2), vea el problema A-l . Para obtener las ecuaciones (A-3) y (A-4). refiérase al problema A-2.] 10.
Para una matriz A de n * m y una matriz B de m x n. se tiene.
|I„ +
AB|= |Im + BA|
(A' 5)
(Pa ra la prueba, vea el problema A-3.)En particular,para /;/ = 1, esdecir, para una matriz A de
n x 1 y una matriz B de 1 x n, se tiene,
|I„
+
AB|
= 1 +
BA
(A-6)
Las ecuaciones (A-2) hasta la (A-6) son útiles en el cálculo de los determinantes de matrices de orden grande.
A-3 IN V E R S IÓ N DE M A T R IC E S Matriz no singular y matriz singular.
Una matriz cuadrada A es una matriz no singular si
existe una m atriz B tal que BA = AB = 1. Si dicha matriz B existe, entonces se denota como A'"1.
A~' se llama la inversa de A. L a matriz inversa A~' existe si |A| no es cero. Si A~' no existe. A se dice ser singular. S i A y B son dos matrices no singulares, entonces el producto AB es una matriz no singular.
(AB)^I = B '1 A‘ 1 Asim ism o,
(A r) - ‘ = ( A - y y
(A* ) " 1 = (A"1)* Propiedades de la inversa de una matriz.
La inversa de una matriz tiene las siguientes pro
piedades. 1. S i k es un escalar no cero y A es una matriz de n x n no singular, entonces
www.FreeLibros.me
A nálisis
636
vector-matriz
A p é n d ic e
A
2. E l determinante de A 1es el inverso del determinante de A, o
| A " l = ¡x¡
Esto se puede verificar fácilmente com o sigue: JAA'1] = JA) ]A_1| = 1
Fórmulas útiles para encontrar la inversa de una matriz 1.
Para una matriz A de 2 x 2, donde A =
a c
b d
ad — be 4 0
la matriz inversa está dada por A '1 =
1 d ad — be - c
- b a
2. Para una matriz A de 3 x 3, donde a b e
d g
e f h i
IA|
4
0
la matriz inversa está dada por
A "1=
3.
e f h i
b h
c i
b c e f
d f g i
a g
c i
a c d f
d g
a g
b h
a d
e h
b e
Si A, B, C y D son, respectivamente, matrices de n x n, de n x m, de m x n y de m x m, entonces (A + B D C ) 1 = A -1 - A ' 1B (D 1 + C A “1B )”1CA^1
(A-7)
con la condición de que las inversas indicadas existan. La ecuación (A-7) se refiere común mente com o el lema de inversión de matrices. (Para la prueba, vea el problema A -4.) Si D = I„„ entonces la ecuación (A-7) se simplifica a (A + BC)~* = A ' 1 - A -1 B (Im + C A 1B ) ' 1C A -1 En esta última ecuación, si B y C son matrices de n x 1 y de 1 x «, respectivamente, entonces,
(A + B C )_1 = A “'
A BC A 1 1 + CA ’ B
(A -8)
La ecuación (A-8) es útil en que si una matriz X de n x n se puede escribir com o A + BC,
www.FreeLibros.me
Sección A-4
Reglas de operaciones con matrices
637
donde A es una matriz de n x n cuya inversa es conocida y BC es el producto de un vector columna y un vector renglón, entonces X~‘ se puede obtener fácilmente en términos de las matrices conocidas A-1, B y C. 4. Si A, B, C y D son, respectivamente, matrices de n x n, de n x m, de m x n y de m x m, entonces
A
B
c
D
-i
A 1 + A ‘ B(D - CA 1B) “‘ C A " 1 - A ' B ( D - C A ‘ B) 1 - ( D - CA B) CA 1 (D -C A B ) 1 (A -9)
con la condición de que |A¡ A 0 y |D - CA 1 B| A 0, o bien
A C
B D
-i
- ( A - BD C) ‘ BD 1 D ‘ C(A - BD-1 C) ~‘ BD-1 + D 1
( A - B D ’C ) 1 - D ' C ( A - BD ' C )
(A -10) con la condición de que |D| t» 0 y |A —B D -1 C| t>0. En particular, si C = 0 o B = 0, entonces las ecuaciones (A-9) y (A-10) se pueden simplificar como sigue:
A 0
A ' 1 - A 'B D 1 D 1 0
-1
0
(A -11)
(A -12)
t
... ,
A '1
1 Q
0 D
-1
T < u 1 Q 1
A C
B D
[Para obtener las ecuaciones (A-9) hasta (A -12), refiérase a los problemas A-5 y A-6.]
A 4 REGLAS DE OPERACIONES CON MATRICES En esta sección se revisarán algunas reglas de operaciones algebraicas con matrices y después se dará la definición de la derivada e integral de una matriz. Luego se presentarán las reglas de diferen ciación de matrices. Observe que el álgebra de matrices difiere del álgebra de números ordinarios en que la multi plicación de matrices no es conmutativa y la cancelación de matrices no es válida.
Multiplicación por un escalar. El producto de una matriz y de un escalar es una matriz en la cual cada elemento está multiplicado por el escalar. Es decir, kan ka2l
kai2 ■ ■ ka ka22 ■ ■ ka
kanl
kan2 ■ ■ ka
Multiplicación de una matriz por una matriz. La multiplicación de una matriz por una matriz es posible entre matrices cuyo número de columnas en la primera matriz es igual al número de renglones en la segunda. De otra forma, la multiplicación no está definida. Considere el producto de una matriz A de n x m y una matriz B de m x r.
www.FreeLibros.me
A nálisis
638
d2\
dí2 ■ d22
d\m d2m
bn b2\
bí2 b22
dnl
d„2
dnm
bm\
b„
du
AB
Cu
C\2
■
C2l
C22
■ c2r
Cnl
C„2 ■ '
vector-matriz
A p én d ice
A
b Ir
b2r
C ír
C„r_
donde
Por lo tanto, la multiplicación de una matriz de n x m por una de m x r da una matriz de n x r. Se debe notar que, en general, la multiplicación de matrices no es conmutativa; es decir, AB A BA
en general
Por ejemplo AB =
BA =
dn _d2\
d\2 b n d22_ b2\
bn bn_
du b\ i + dl2b2l du bn + dn b22 a21 b n d- £322 b2{ d2¡ b \2 + a22 b22
bn
bn d\\ b22_ _ a 2l
dn d22j
b ii «n + b\2d2\ bu dn + bn d22 b2i di i + b22a2¡ b2¡ d¡2 + b22d22_
¿>21
Así, en general AB A BA. De donde, el orden de la multiplicación es significativo y se debe preser var. Si A B = BA, las matrices A y B se dicen que conmutan. En las matrices A y B anteriores, si, por ejemplo, a n = a2] = b n = b2¡ = 0, entonces A y B conmutan. Para matrices diagonales A y B de n x n, cinbi
0
a22b22
AB = [auSiillbijSu] = 0
annb„
Si A, B y C son matrices de n * m, de m x r y de r * p, respectivamente, entonces la ley asociativa siguiente se cumple: (A B )C = A (B C ) Esto se puede probar com o sigue:
el elemento (/, k) de A B = 2 a„ b,,. I --1 'J > k el elemento (j, h) de BC = t bjk ckh
www.FreeLibros.me
Sección A-4
Reglas de operaciones con matrices
639
el elemento (/, h) de ( A B ) C = X
Xa,.*»
(aAtj blk)c¡ ujk)'~kh
c = H
r
2
2
j=lk=l
/(b/k
kh )
S
j- 1
^
bj kCkh
Lfc=l
= elemento (/, /;) de A ( B C ) Com o la asociatividad de la multiplicación de matrices se conserva, se tiene A B C D = (A B )(C D ) = A (B C D ) = (A B C )D A m+" = A m A ",
m ,n = 1 ,2 ,3 ,...
Si A y B son matrices de n * m y C y D son matrices de m x r, entonces la siguiente ley distributiva se cumple: (A + B )(C + D ) = A C + A D + B C Esto se puede probar al comparar elelemento
+ BD
(/', j ) de ( A + B ) (C + D ) con
el elemento (i, j ) de
(A C + A D + B C + BD )
C om entarios sobre la cancelación de m atrices.
La cancelación de matrices no es válida en
el álgebra de matrices. Considere el producto de dos matrices singulares A y B . Tome por ejemplo,
A =
2
1
6
3
* 0,
1
B
-2
-2
4
'2
f
1
-2'
6
3
4
0 O
AB =
I-1 t'O
Entonces
0
= 0
Es evidente que A B = 0 implica que A = 0 o que B = 0. De hecho, A B = 0 implica una de las siguientes tres: 1. A = 0 2.
B =0
3.
A y B son similares. Se puede ver fácilmente que, si A y B son matrices no cero y A B = 0, entonces A y B deben ser
singulares. Suponga que B no es cero y A es no singular. Entonces |A¡ + 0 y A~' existen. Entonces se obtiene A 1A B = B = 0 que contradice la suposición de que B no es cero. En esta forma se puede probar que A y B deben ser singulares si A 4 0 y B # 0. De forma similar, observe que si A es singular entonces tampoco A B = A C ni B A = C A implican que B = C . Sin embargo, si A es una matriz no singular, entonces A B = A C B = C y B A = C A implica que B = C .
www.FreeLibros.me
implica que
Análisis
640
D erivada e integral de u n a m atriz.
vector-matriz
A p é n d ic e
A
L a derivada de una matriz A (t) de n x m se define como
la matriz cuyos elementos (/, j ) son las derivadas de las elementos (/, j ) de la matriz original, si se considera que todos los elementos a ft ) tiene derivadas con respecto a V.
dt «11( 0
dt d
/ X
d tanm(0 E n el caso de un vector de x(t) de dimensión n,
d dt De forma similar, la integral de una matriz A (?) de n x m con respecto a t se define como la matriz cuyos elementos (i, j ) son las integrales de los elementos (/, j ) de la matriz original, o
ja „ (t)d t
I a¡m( t ) d t
•••
| A (t)d t =
Ja „,(t)d t
J anm(t)d t
al considerar que los elementos au{t) son integrables como funciones de t.
D iferenciación de u n a m atriz.
S i los elementos de las matrices A y B son funciones de t,
entonces
d ,
t
d
(A + B ) = t
d tv
’
dt
d
a + t
dt
4 (A B ) = ^ B
d tK
J dt
(A-13)
b
+ A ^
dt
(A - 14)
S i k(t) es un escalar y es función de t, entonces (A - 15)
1 ,1 * * < » ] También,
L
—
dt
B í/ í = A B
í" A* — djB- dj t dt
(A - 16)
Es importante notar que la derivada de A 1está dada por
7 dt * " -
- A - '^ A - 1
dt
www.FreeLibros.me
(A - 17)
Sección A-4
Reglas de operaciones con matrices
641
L a ecuación (A - 17) se puede derivar fácilmente al diferenciar A A 1 con respecto a t. Y a que
A
dt
a a
-
'. ^
-' +
a
dt
a
^
dt
y también 4
dt
-‘ = ^-1 = 0
a a
dt
se obtiene A d A '1 A — -— =
dt
A -1 A
dAA , — A dt
dA~ dt
dt
di
que es el resultado deseado.
D erivadas de u n a fu n c ió n escalar con respecto a u n vector.
S i J ( \ ) es una función escalar
de un vector x, entonces
ÉL
d 2J
d 2J
d 2J
d 2X\
dx i dx2
dx i dxn
d 2J
d 2J
d 2J
_dx„ dXi
dx„ dx2
dx2 n
d 2J dx 2
dJ 1' $ a i
dx
' dJ' dX\
J
Asim ism o, para una función escalar V(x(t)), se tiene
d . . .. / d V \ Td x J tv m ) = * Jacobiano.
S i una matriz f(x ) de m * 1 es un vector función de un vector-w x (nota: un
vector-w es un vector de dimensión ri), entonces
'Mi Mi . . dX \ d f d x
_
d x i
Mi Mi . d x 2
d x 2
Mi Mi . - d x n
d x n
M
i
d x \
M
e
(A - 18)
d x 2
M
e
d x n _
D icha matriz de n x m se llama Jacobiano. Observe que, al utilizar esta definición de Jacobiano, se tiene
T-Ax = A T
dx
www.FreeLibros.me
(A - 19)
Análisis
642
vector-matriz
A p én d ice
A
E l hecho de que la ecuación (A - 19) se cumple, puede verse fácilmente del siguiente ejemplo: Si A > x están dados por
r A =
i £2n £212 £213 £221 £222 2223
* =
*1 *2 *3
entonces
Ax =
# 11
a 12
a 13
£¡21
ü 22
C¡23
dx
au x i + an x2 + £213*3 ü2¡X¡ + a22X2 + £223*3
df\ dxx
dh dxx
dfi dx2 df\ _dx2
dfi dx2 dfi dx3j
22) 1 £2]2
«21 2222 = A r
£213
2223
Así, se tiene la siguiente fórmula útil. Para una matriz real A de n
d XT dx
A x
=
A x
-r
A
X
Además, si A es una matriz real simétrica, entonces
dx
x T A x = 2Ax
Observe que si A es una matriz Herm ítica de n x n y x es un vector-« complejo entr - :es
-¿:x*Ax = Ax dx
[Para obtener las ecuaciones (A-20) y (A - 2 1), véase el problema A-7.] Para una matriz real de ¡? x m, un vector-u real x, y un vector-m real y, se tiene
d
dx
dy
x Ay = Ay
x r Ay = A r x
De forma similar, para una matriz compleja A de n x m , un vector-/? complejo x y un vector-;; complejo y, se tiene
_d_ x*Ay = Ay dx d_ dy
x*Ay = A r x
www.FreeLibros.me
(A-24)
(A - 2 5 1
A nálisis
642
vector-matriz
A p én d ice
A
E l hecho de que la ecuación (A - 19) se cumple, puede verse fácilmente del siguiente ejemplo: S i A \ x están dados por
r A =
an
ü \2
«21
«22
«13
X =
«23 J
x¡ X2 . XK
entonces
r Ax =
«11 .«21
«12 «22
«13 «23 _
*1 *2
=
_'í 3.
dxt dx
Ax
a\\X \ + « 12-Í2 « 22-^2
« 21-t-1
«13-*3
'f l '
«23-tó
A
r9x,
dx2
dx2
df \
«11
«21
^12
^22
^13
#23
= A'
tf l
_ dx3
dX2_
Así, se tiene la siguiente fórmula útil. Para una matriz real A de « * « y un vector-n real x,
d
T
T
-x Ax = Ax + A x
(A-20)
Además, si A es una matriz real simétrica, entonces
— xr Ax = 2Ax dx
Observe que si A es una matriz Herm ítica de n x n y x es un vector-n complejo entonces
-^rx*Ax = Ax dx
(A-21)
[Para obtener las ecuaciones (A-20) y (A-21), véase el problema A-7.] Para una matriz real de n * m, un vector-n real x, y un vector-m real y, se tiene
d\ _d_
x TA y = A y
(A-22)
x TA y = A t x
(A-23)
¿y
De forma similar, para una matriz compleja A de n * m, un vector-n complejo x y un vector-in complejo y, se tiene
— x*Ay = Ay x*Ay = A r x
www.FreeLibros.me
(A-24)
(A-25)
Sección A-5
Vectores y análisis vectorial
643
[Para obtener las ecuaciones (A-22) a (A-25), refiérase al problema A-8.] Observe que la ecuación (A-25) es equivalente a la siguiente ecuación:
— x *A y = A * x
dy
AS
VECTO RES Y A N Á LISIS VECTORIAL Dependencia lineal e independencia de vectores. linealmente independientes si la ecuación
Los vectores x,, x2, . . . , x„ se dicen ser
Cj Xi + c2x2 + • •• + c„ x„ = 0 donde c¡, c2, . . . , c„ son constantes, implica que c¡ = c2= ■• ■= c„ = 0. Por el contrario, los vectores x h \2
x„ se dicen ser linealmente dependientes si y sólo si x, se puede expresar como una
combinación lineal de x; (/' = 1 , 2 , . . . , /;; / A i). Es importante observar que si los vectores x h x2
x„ son linealmente independientes y los
vectores x,, x2, . . . , x„, x „+, son linealmente dependientes, entonces x „ _ , se puede expresar como una combinación lineal única de x,, x; , . . . , x„.
Condiciones necesarias y suficientes para la independencia lineal de vectores.
Se puede
probar que las condiciones necesarias y suficientes para que los vectores x, (i = 1, 2, . . . , w ) sean linealmente independientes son que: 1. m < n. 2. Exista al menos un determinante de columna-w no cero de la matriz de n x m cuyas columnas consistan de x¡, x2, . . . , x,„. Por lo tanto, para los n vectores xl? x; , . . . , x„ la condición necesaria y suficiente para la independen cia lineal es que |A) + 0 donde A es una matriz de n x n cuya columna i está hecha de los componentes de x, (/ = 1 , 2 , . . . , ¡i).
Producto interno.
Cualquier regla que asigna a cada par de vectores x y y en un espacio
vectorial una cantidad escalar se llama producto interno o producto escalar y se simboliza por (x, y), si se considera que los cuatro axiomas siguientes se satisfacen: 1.
< y,x)
=
(x,y)
donde la barra denota el conjugado de un número complejo 2.
(ex, y)
=
c (x ,y )
=
(x, c y )
donde c es un número complejo 3. 4.
(x + y, z + w ) = (x, z) + (y, z) + (x, w> + (y, w> (x, x) > 0,
para x A 0
www.FreeLibros.me
A nálisis
644
vector-matriz
A p é n d ic e
A
En cualquier espacio vectorial finito, existen muchas definiciones del producto interno, todas satis facen los cuatro axiomas. E n este libro, a menos de que se especifique otra cosa, se adoptará la siguiente definición de producto interno: el producto interno de un par de vectores-» x y y en un espacio vectorial V está dado por
n
(A-26)
i=i donde la suma es un número complejo y donde las x, son los complejos conjugados de los x,. Esta definición claramente satisface los cuatro axiomas. E l producto interno también se puede expresar como:
(x,y> = x*y donde x* denota la transpuesta conjugada de x. Asim ism o
<*.y) = (y,*) = y*x = y7* = x*y
(a-27)
E l producto interno de dos vectores-n x y y con componentes reales está dado por
r ( x ,y ) = Xiy¡ + x 2y 2 + ■■■ + x ny„ = 2 * , y¡ i=i
(A-28)
En este caso, es claro que se tiene (x, y ) = x 7 y = y 7 x,
para vectores reales de x y y
Se hace notar que el vector x real o complejo se dice norm alizado si (x, x) = 1.También se señala que, para un vector-n, x, x*x es un escalar no negativo, pero xx* es una matriz de » x ». Es decir, x*x = (x ,x ) = XiXi + X2X2 + • •• + x nx n
= |x!p + \x2\2 + ■■■ + \x„\2 y
XX* =
X]X{ x 2Xi
X2X 2
. . .
XtX X2X
X„X2
.
X¿c
X !X 2
.
■
Observe que, para una matriz compleja A de n * n y vectores-» complejos x y y, elproducto interno de x y A y y el de A * x y y son el mismo, o
(x, Ay) = x*Ay,
(A *x, y) = x*Ay
De forma similar, para una matriz real de n x n y vectores-n reales x y y, elproducto interno de A y y el de A 7 x y y son el mismo, o
(A Tx,y) = xr Ay
www.FreeLibros.me
xy
Sección A-5
Vectores y análisis vectorial
T ransform aciones unitarias. producto interno
(x, x)
645
Si
A es una matriz unitaria (es decir, si A 1 = x = Ay, porque
A * ), entonces el
es invariante bajo la transformación lineal
(x,x) = (Ay, Ay) = (y, A*Ay) = (y, A-1 Ay) = (y, y) Dicha transformación se llama
t r a n s f o r m
x = Ay,
a c i ó n
donde
T ransform aciones unitarias. producto interno
(x, x)
A
es una matriz unitaria, que transforma
X", t
x ,x ¡
en
X"=, y , y „
u n it a r ia .
Si
A es una matriz unitaria
(es decir, si
es invariante bajo la transformación lineal
x = Ay,
A"1
= A * ), entonces el
porque
x
Ay,
=
que transforma a X ".,*,2
en
X,"=l>’\ se llama una
t r a n s f o r m
a c i ó n
o r t o g o n a l .
N o rm a s de u n vector.
Una vez definido el producto interno, se puede emplear este producto
interno para definir las normas de un vector. E l concepto de norma es de alguna forma sim ilar al del valor absoluto. U n a norma es una función que asigna a cada vector número real denotado por
|¡x[| tal
1.
|¡x|| > 0,
2.
para
||x|| = 0,
3. k
es un escalar y
\k\
5.
\k\
es el valor absoluto de
||x +y||
4.
vectorial dado un
|x¡
<
+
|[y||,
|(x, y)| < j|x|| ||y|¡
0
x
si y sólo si
px|| = donde
x en un espacio
que
x=0
|¡x||, k .
para toda
xy y
(desigualdad de Schwarz)
Definiciones distintas de normas se encuentran en los libros. Sin embargo, la siguiente defini ción se ut'liza ampliamente. Una norma de un vector se define como la raíz cuadrada no negativa de
(x, x): l|x|| = (x,x ) l/2 = (x*x ) 1/2 = V |x,p + |x ,|2 + • ■• + |x„|2 Si
x
es un vector real, la cantidad
||x||2 se
puede interpretar de manera geométrica como la distancia
desde el origen al punto representado por el vector
llx - y|| = (x - y ,x - y) 1' 2 =
(A-29)
V
( x ,
-
x.
Observe que
y , ) 2
+ (x 2
-
y 2) 2
+ •• • + (x„ -
y „ ) 2
Las cinco propiedades de las normas listadas antes pueden ser obvias, excepto quizá las dos últimas desigualdades. Estas dos desigualdades se pueden probar como sigue. De las definiciones del producto interno y de la norma, se tiene
||Ax + y||2 = (Ax + y,Ax + y) = (Ax.Ax) + (y,Ax) + (Ax,y) + (y, y) = AA||x||2 + A(y, x) + A(x, y) + ||y||2 = A(A||x||2 + (x, y)) + A(x, y) + ||y||2 > 0
www.FreeLibros.me
A nálisis
646
vector-matriz
A p é n d ic e
A
Si se escoge ,
para x # 0
entonces A (x ,y ) + Hyll2 = ~
IWPlIylP S (y, y>(*,y>
=
|
+ Hyll2 ~ 0
y)p,
para x
+
0
Para x = 0, es claro que MPlIyll2 = |
Por lo tanto, se obtiene la desigualdad de Schwarz, |
(A-30)
Al emplear la desigualdad de Schwarz, se obtiene la siguiente desigualdad, II* + yll * ||x|| + ||y||
(A-31 )
Ésta se puede probar fácilmente, ya que ||x + y||2 =
< x,
y) +
= ||x]p + ||y|p + 2 R e(x,y) ^
M I2
+ ||y||2 + 2 |
< ||x|p + ||y|p + 2 ||x|| ||y|| = (IWI
+ ||y||)2
Las ecuaciones (A-26) hasta la (A-31) son útiles en la teoría de control moderna. Como ya se mencionó, existen diferentes definiciones de normas. Tres de estas definiciones son las siguientes. 1.
Una norma ||x|¡ se puede definir como sigue: ||x|| = [(Tx)*(Tx)]1/2 = (x*T*Tx) 1/2 = (x*Qx) 1/2 1/2
> 0 /=!/=!
La matriz Q = T*T es Hermítica, ya que Q* = T*T = Q. La norma j|x|| = (x*Qx) l/2 es una forma generalizada de (x*x)l/2, la cual se puede escribir como (x*Ix),/2. 2. Una norma se puede definir como la suma de las magnitudes de todos los componentes x¡\ IWI = X \x¡\ 1=1
www.FreeLibros.me
Sección A-5
3.
Vectores y análisis vectorial
647
Una norma se puede definir como el máximo de las magnitudes de todos los componentes x,: ||x|| = m ax {|*¡|} /
Se puede mostrar que las diferentes normas que se acaban de definir son equivalentes. Entre otras definiciones de normas, la norma (x*x) l/2 es la que más se utiliza en cálculos explícitos. Normas de una matriz. El concepto de normas de un vector se puede extender a las matri ces. Existen varias definiciones diferentes de normas de una matriz, algunas de ellas son las siguien tes. 1. Una norma ||A|| de una matriz A de n x n se define por ||A|| = m inA
tal que l|Ax|| < A||x||
Para la norma (x*x)1/2, esta definición es equivalente a ||A||2 = m a x { x * A * A x ;x * x = 1} X
que significa que ||A||2 es el máximo del “valor absoluto” del vector Ax cuando x*x = 1. 2. Una norma de una matriz A de n x n se puede definir por l|A|| = ¿ ¿ | a , 7|
'=i y=i donde \a¡\ es el valor absoluto de a,r 3. Una norma se puede definir como
(
n
n
\l/2
2 ¿k yp )
4. Otra definición de una norma está dada por l|A|| = m ax ( D |a,7| i
\j=\
Observe que todas las definiciones de normas de una matriz A de n x n tiene las siguientes propiedades: 1. 2.
IIA¡| = ||A*||
o
IIA|| = ||A?||
IIA + B|| < ||A|| + ||B||
3.
IIABII < ||A|| ||B||
4.
IIAx|| < ||A|| ||x||
Ortogonalidad de vectores. Si el producto interno de dos vectores x y y es cero, o (x, y) = 0, entonces los vectores x y y se dice que son ortog ona l es con respecto a l otro. Por ejemplo, los vectores
www.FreeLibros.me
A nálisis
648
" l"
x3 =
0 1
x2 =
A p é n d ic e
A
f
' 0'
1 0
vector-matriz
-1 0
son ortogonales en pares y por lo tanto forman un conjunto ortogonal. E n un espacio vectorial de dimensión n, los vectores x¡, \ 2, . . . , x„ se definen por Y Xi =
'o '
'O '
0
1
x2 =
o_
,
.. . ,
x„ =
0
0 1
satisfacen las condiciones (x „ x ) = 8,p o < x,,x,)
=
1
( X i , X j ) = 0,
i + j
donde i, j = 1, 2, . . . , n. Dicho conjunto de vectores se dice ortonorm al , ya que los vectores son ortogonales a cada uno de los otros y cada vector está normalizado. U n vector x no cero se puede normalizar al dividir x entre (|x|(. E l vector normalizado x/|jx|| es un vector unitario. Los vectores unitarios x „ x2,
, x„ forman un conjunto ortonormal si son
ortogonales por pares. Considere una matriz unitaria
A.
A l dividir a
A en vectores
columnas
A,, A , , . . . , A„,
se tiene
'A ,* '
Áf_ [Ai . A2.
■i A„]
A* A2 A ?A 2
••• •••
AfA,
A? Ai .A* Aj
A* A2
•••
A* A
'A f A ,
ri 0
0 1
••• •••
o' 0
0
0
•••
1
A ?A
de donde
A* A, = {A,, A,) = 1 A* Ay = (A,, A;) =
0,
i ± j
Por lo tanto, se ve que los vectores columna (o vectores renglón) de una matriz unitaria ortonormales. Los mismo es verdadero para matrices ortogonales, ya que son unitarias.
www.FreeLibros.me
A
son
Sección A-6
Valores propios, vectores propios y transformaciones de similitud
649
A-6 V A LO R ES P R O P IO S , VECTORES P R O P IO S Y T R A N SFO R M A C IO N ES DE SIM ILITUD En esta sección se revisarán propiedades importantes del rango de una matriz y después se darán definiciones de valores propios y vectores propios. Por último, se discutirán las formas canónicas de Jordán, las transformaciones de similitud y la traza de una matriz de n x n.
Rango de una matriz.
Una matriz A se dice de rango m si el número máximo de renglones (o
columnas) linealmente independientes es m. Por lo tanto, si existe una submatriz M de m * m de A tal que JM| A 0 y el determinante de cada submatriz d e r x r (donde r > m + 1) de A es cero, entonces el rango de A es m. [Observe que, si el determinante de cada submatriz de A de (ni + 1) x (OT + i ) es cero, entonces cualquier determinante de orden s (donde s > (m + 1)) es cero, ya que cualquier determinante de orden s > (m + 1) se puede expresar como una suma lineal de determinantes de orden m + 1.]
Propiedades del rango de una matriz.
A continuación se enumeran algunas propiedades
importantes del rango de una matriz. 1. E l rango de una matriz es invariante bajo el intercambio de dos renglones (o columnas), o la suma de un escalar múltiplo de un renglón (o una columna) en otro renglón (o columna), o la m ultiplicación de cualquier renglón (o columna) por un escalar no cero. 2.
Para una matriz A de n * m, rango A < min ( n, m )
3. Para una matriz A de n x n, una condición necesaria y suficiente para que el rango A = n es que |A¡ A 0.
4.
Para una matriz A de
n
x
m,
rango A * = rango A
o
rango A 7 = rango A
5. E l rango de un producto de dos matrices A B no puede exceder al rango de A o al rango de B ; es decir, rango A B < min (rango A , rango B ) Po r lo tanto, si A es una matriz de n x 1 y B es una matriz de 1 * m, entonces el rango A B = 1 a menos de que A B = 0. S i una matriz tiene rango 1, entonces esta matriz se puede expresar como un producto de un vector columna por un vector renglón.
6 . Para una matriz A de n x n (donde |A| A 0) y una matriz B de n x m, rango A B = rango B D e forma similar, para una matriz A de m
x
m (donde ¡A¡ A 0) y una matriz
B d e n x
m,
rango B A = rango B
Valores propios de una matriz cuadrada.
Para una matriz A de n x n, el determinante
|AI - A| se denomina p olinom io característico de A , que es un polinom io de grado n en A. L a ecuación característica está dada por
|AI - Aj = 0
www.FreeLibros.me
A nálisis
650
vector-matriz
A p én d ice
A
Si el determinante ¡Al - A| se expande, la ecuación característica se convierte en A - an AI - A
fl;i
=
- « i; A
- a„
fl;2
ün2
•• ■
flin
"' *
fl;„
'
A
ün
— A" + fli A" ' + •■■ + fl„~i A + fl„ = 0 Las n raíces de la ecuación característica se denominan valores propios de A. También se llaman raíces características. Se hace notar que una matriz real A de ti « n no necesariamente tiene valores propios reales. Sin embargo, para una matriz real A de /7 x n, la ecuación característica ¡AI - Aj = 0 es un polinom io con coeficientes reales, y por lo tanto cualquier valor propio complejo debe ocurrir en pares conju gados; es decir, si a + ¡¡3 es un vaior propio de A. entonces a - j¡3 también es un valor propio de A. Existe una relación importante entre los valores propios de una matriz A de n x n y los de A~!. Si asumimos los valores propios de A son A, y los de A ' hasta ¡x„ entonces
1 , 2 , . . . ,n
A r\
Mi
Es decir, si A, es un valor propio de A , entonces Aj1 es un valor propio de
A'1.
Para probar esto,
observe que la ecuación característica de la matriz A se puede escribir como [A I - A| = |A A _1 - I| |Aj = [A] ]A ~ ’ - A ' 11| |A¡ = 0 o
|A-'I - A_1| = 0 Por suposición, la ecuación característica de la matriz inversa
A-1
es
|/xl - A~‘| = 0 A l comparar estas dos ecuaciones, se ve que
p, = A -1 Por lo tanto, si A es un valor propio de A , entonces p. = A' 1 es un valor propio de A 1. Por último, observe que es posible que, para dos matrices cuadradas A y B, [AI
- AB| =
¡AI
- BA|
(Para la prueba, véase el problema A-9.)
Vectores propios de una matriz de n x n.
Ax,- =
Cualquier vector x, no cero tal que A,
x,-
se dice que es un vector propio asociado con un valor propio A, de A , donde A es una matriz de n x n. Como los componentes de x, se determinaron de un conjunto de n ecuaciones algebraicas homo géneas lineales con un factor constante, si x, es un vector propio, entonces para cualquier escalar a # 0, «x, es también un vector propio. E l vector propio se dice ser un vector propio norm alizado si su longitud o valor absoluto es la unidad.
www.FreeLibros.me
Sección A-ó
Valores propios, vectores propios y transformaciones de similitud
M atrices sim ilares.
651
Las matrices A y B n X n se dice que son sim ilares si existe una matriz
P no singular tal que P 1A P = B L a matriz B se dice que se obtiene a partir de A mediante una transform ación de sim ilitu d , en la que P es la matriz de transformación. Observe que A se puede obtener de B mediante una transformación de similitud con la matriz de transformación P ', ya que A = PBP
D iagonalización de m atrices.
' = (P
)
B (P
)
Si una matriz A de n - n tiene n valores propios distintos,
entonces existen n vectores propios linealmente independientes. Si la matriz A tiene valores propios múltiples con multiplicidad k, entonces existe al menos uno y no más de k vectores propios linealmente independientes asociados con estos valores propios. Si una matriz de n x n tiene n vectores propios linealmente independientes, se puede diagonalizar mediante una transformación de similitud. Sin embargo, una matriz que no tenga un conjunto com pleto de n vectores propios linealmente independientes no puede ser diagonalizada. Dicha matriz se puede transformar en la forma canónica de Jordán.
F orm a ca n ó n ica de Jordán.
Una matriz .1 de k ■ k se dice estar en la forma canónica de
Jordán si J Pi
0
J =
J ": 0
J p.
donde las J ;, son matrices de p, * p t de la forma A
1
0
A
0 1
■• •• • ■•
0 0
0 0
0 0
0 0
• ■•
A
1
• ■•
0
A
0 0
Las matrices J p se llaman bloques de Jordán de orden p r Observe que la A en J r y aquella en J ; puede ser o no la misma, y que
Pi + P i + ' • • + p s = k Por ejemplo, en una matriz J de 7 * 7, si p¡ = 3, p 2 = 2, p. = 1, p 4 = 1, y los valores propios de J son A h A,, A,, A,, A,, A,,, A7, entonces la forma canónica de Jordán puede estar dada por Jj(A i)
0
A,
1
0
0
A,
1
0
0
A,
0 "
--------- ,
J:(A i)
A, 0
¡ a7 ¡
J , ( A h) 0
1 i A,
J , ( A 7)
0
www.FreeLibros.me
: a7
A nálisis
652
vector-matriz
A p é n d ic e
A
Observe que una matriz diagonal es un caso especial de la forma canónica de Jordán. L a forma canónica de Jordán tiene las propiedades de que los elementos sobre la diagonal principal son los valores propios de A y de que los elementos inmediatamente arriba (o abajo) de la diagonal principal son 1 o 0 y todos los demás elementos son cero. L a determinación de la forma exacta del bloque de Jordán puede no ser simple. Para ilustrar algunas estructuras, considere una matriz de 3 x 3 que tiene un valor propio triple de A,. Entonces
J
o
_
h—t 0
1
1o
'
'a, i 0
O
0
' A j
1 y A,
O
A,
o " [ a 7
0
o' ]
o
O IA !
i
1
-------
0
O o
V
una de las siguientes formas canónicas de Jordán es posible:
Cada una de las tres matrices anteriores tiene la misma ecuación característica (A - A ,)3 = 0. L a primera corresponde al caso donde existe un solo vector propio linealmente independiente, ya que al denotar a la primera matriz como A y al resolver la siguiente ecuación para x,
(A - Aj I)x = 0 se obtiene un solo vector propio:
a = constante no cero
x=
L a segunda y tercer matrices tienen, respectivamente, dos y tres vectores linealmente independien tes. (Observe que sólo la matriz diagonal tiene tres vectores linealmente independientes.) Como se ha visto, si una matriz A de k x k tiene k valores propios múltiples, entonces se puede mostrar lo siguiente: 1. S i el rango de Al - A es k - s (donde 1 < s < k ) , entonces existen s vectores propios linealmente independientes asociados con A. 2. Existen s bloques de Jordán asociados con los s vectores propios. 3. L a suma de los órdenes p¡ de los bloques de Jordán es igual a la m ultiplicidad k. Por lo tanto, como se demostró en las matrices de 3 x 3 anteriores, aun si la m ultiplicidad de los valores propios es la misma, el número de bloques de Jordán y sus órdenes pueden ser diferentes en función de la estructura de la matriz A .
T ransform ación de sim ilitu d cu a n d o u n a m atriz d e n x re tie n e valores p ro p io s distintos.
Si
los n valores propios de la matriz A son diferentes, existe un vector propio asociado a cada valor propio A,. Se puede probar que dichos n vectores propios x „ x2, . . . , x„ son linealmente independien tes. Sea una matriz P de n x n
P = [P ,: P2 : • • •': P„] = [x!: x2: • • •: x„] donde el vector columna P¿ es igual al vector columna x„ o
P¡ = x,,
i = 1 ,2 ,... , n
www.FreeLibros.me
Sección A-ó
Valores propios, vectores propios y transformaciones de similitud
P definida de esta forma , x„ satisfacen la ecuación
L a matriz
\ 2,
es no singular, y
P 1 existe.
653
Observe que los vectores propios
x„
A x i = A iX i
Ax2 = A2x2
Ax„ = A„x„ se pueden combinar estas n ecuaciones en una, como sigue 'A ,
A[xj : x2 : • • • : x„] = [xj: x2 : • • •: x„ 0 o, en términos de la matriz
P, A, AP 0
A l prem ultiplicar esta última ecuación por
P
', se obtiene 0
A, P ‘ AP =
= diag (A1? A2, . . . , A„) 0
Por lo tanto, la matriz
A
se transforma en una matriz diagonal mediante una transformación de
similitud. E l proceso que transforma la matriz matriz
A en
una matriz diagonal se llama diagonalización de la
A.
Com o se estableció anteriormente, un múltiplo escalar del vector propio vector propio, ya que
ax,
x,
es también un
satisface la siguiente ecuación:
A(aXi) = A,(ax,) En consecuencia, se puede escoger a para que la matriz
P sea tan simple como sea posible. A de n x n son distintos, entonces
Para resumir, si los valores propios de una matriz
hay
exactamente n vectores propios que son linealmente independientes. U na matriz de transformación
P que transforma a A en
una matriz diagonal se puede construir de los n vectores propios linealmente
independientes.
T ransform ación d e sim ilitu d cuando u n a m atriz de n * n tien e valores p ro p io s m últiples. Se A de n x n involucra un valor propio A, de multiplicidad k y otros valores propios A*+|, A* +2, ■. •, A„ que son distintos y diferentes de A,. Es decir, los valores propios de A son supone que una matriz
Ai, Ai , .. . , Aj, A*+i, A*+2, . . . , A„
www.FreeLibros.me
A nálisis
654
vector-matriz
A p é n d ic e
A
Prim ero se considerará el caso cuando el rango de A, I - A es n - 1. Para este caso existe un solo bloque de Jordán para el valor propio múltiple A „ y existe un solo vector propio asociado con este valor propio múltiple. E l orden del bloque de Jordán es k, que es el mismo que el orden de la m ulti plicidad del valor propio A,. Observe que, cuando una matriz A de n x n no tiene n vectores propios linealmente indepen dientes, no puede ser diagonal izada, pero se puede reducir a una forma canónica de Jordán. E n el presente caso, sólo existe un vector propio linealmente independiente para A,. A h ora se investigará si es posible encontrar k- 1 vectores que estén asociados de alguna forma con este valor propio y que sean linealmente independientes de los vectores propios. Sin prueba, se mostrará que esto es posible. Primero, observe que el vector propio x, es un vector que satisface la ecuación
(A - A] I)x i = 0 por lo que x, se elim ina mediante A - A ,I. Como no se tienen suficientes vectores que son eliminados por A -A, I, se buscan vectores que sean eliminados por ( A - A, I ) 2, ( A - A, I ) 3, y así sucesivamente, hasta obtener k - 1 vectores. Los k - 1 vectores determinados de esta forma se llaman vectores propios generalizados. Se definen los k - 1 vectores propios generalizados como x2, x3, . . . , xk. Entonces estos k - 1 vectores propios generalizados se pueden determinar de las ecuaciones
(A - A ^ X i = 0 (A - A31)2 x2 = 0
( A - A 1I ) * x * = 0
(A-32)
que se pueden rescribir como
(A - A il)x! = 0 (A - Aj I)x 2 = X[
(A - Aj I)x* = x*_i Observe que
(A - Ax I)*_I x fc = (A — A il)*-2 x t _x = • • ■ = (A - A J jx z = Xi o ( A - A ! l) * _ 1x* = Xi
(A-33)
E l vector propio x, y los k - 1 vectores propios generalizados x2, x3, . . . , x* determinados de esta forma constituyen un conjunto de k vectores linealmente independientes. U n a forma adecuada para determinar los vectores propios generalizados es comenzar con xk. E s decir, se determina el x* que satisfará la ecuación (A-32) y al mismo tiempo se obtendrá un vec tor no cero
que( A -A, I )*-1 x*. Cualquiera de estos vectores no cero se puede considerar un vector
propio posible x,. P o r lo tanto, para encontrar el vector propio x,, se aplica un proceso de reducción
www.FreeLibros.me
Sección A-6
Valores propios, vectores propios y transformaciones de similitud
655
por renglón a ( A -A, I)* y se encuentran k vectores linealmente independientes que satisfacen la ecuación (A-32). Entonces estos vectores se prueban para encontrar uno que dé un vector no cero en el lado derecho de la ecuación (A-33). (Observe que se comienza con selecciones arbitrarias en cada paso para determinar
x2, x3,
x,
entonces se deben hacer
. . . , xt. Esto consume tiempo y no es
conveniente. Por esta razón, este enfoque no se recomienda.) Para resumir lo que se ha discutido, el vector propio
x3,
x, y
los vectores propios generalizados
x2,
. . . , xh satisfacen las siguientes ecuaciones: A x i = A iX ] A x 2 = Xi + A 3x 2
Ax* = x*_i + A,x* Los vectores propios x*+,, xi +2, . . . , x„ asociados con los valores propios distintos A* +„ Ai +2, .. ., A„, respectivamente, se pueden determinar de
Ax*+1 = Ai+1 x*+, Ax*+2 = A*+2X* +2
Ax n
A„ x„
A hora se define
S = [S3: S2: ■• •: S„] = [x3: x2: • • •: x„] donde los n vectores columnas de S son linealmente independientes. Por lo tanto, la matriz S es no singular. Entonces, al combinar las ecuaciones de los vectores propios anteriores y las ecuaciones de los vectores propios generalizados en una sola ecuación, se obtiene
A [xi • x2 : • • •: x* • x * + i: • • •: x„]
rA,
[xi:x2: • ' :x*: x*+i: ■ •:x„]
1 A,
0
1 A, 0
0
0 De donde 0
'J*(A,)[ !
ft L.
0
‘
A^+i
i
1
www.FreeLibros.me
0'
1
A».
0 A*+i
0
0
V
A nálisis
656
A l premultiplicar esta última ecuación por S
vector-matriz
A p é n d ic e
A
se obtiene
0’
i_ ' Af c + 1
'J*(A ,)
S ' 1A S =
0
K.
En la discusión anterior se consideró el-caso en el que el rango de A, I - A era n - 1. A continuación se considera el caso en el que el rango de A, I - A es n - s (donde 2 < s < n). Y a que la matriz A involucra k valores propios múltiples A, y otros valores propios Xk+,, A* +2, •• ■, A„ que son distintos y diferentes de A „ se tienen s vectores linealmente independientes asociados con el valor propio A,. Po r lo tanto existen s bloques de Jordán que corresponden al valor propio A,. Po r conveniencia en la notación, se define los s vectores propios linealmente independientes asociado con el valor propio A, como v n , v 21, . . . , v vl. Se define a los vectores generalizados asocia dos con v,i como v,2, v,-3, . . . , \ v donde i = 1 , 2 , . . . , s. Entonces existen en total k vectores (vectores propios y vectores propios generalizados), que son V i l , V 12, . . . , V l p p V21, V22, . . . , V 2 p v . . . , V j i ,
vs2, • .
•,
vsp¡
Los vectores propios generalizados se determinaron a partir de
( A - A , I ) v „ = 0,
( A - A , I ) v sl = 0
(A - A ] I) v ,2 = vn ,
(A - Aj ^ V í ,,, = VjPl _ i ,
••■
(A - Ai I)v j2 = vsj
•••
(A - Ai I ) vSPj = vVi_i
donde los s vectores propios v H, v 21, . . . , v 5l son linealmente independientes y
P i + P i + ' •' + Ps = k Observe que p s, p2, . . . , ps representan el orden de cada uno de los s bloques de Jordán. (Para determinar los vectores propios generalizados, se sigue el método discutido antes. Para ejem plificar los detalles, véase el problema A - l 1.) Se define una matriz de n x k que consiste de v , „ v l2, . . . , v
como
s(A0 = [v„:v12: ■■■;viP1;•••; vsl:vs2; •••: vsj = [x iix 2i---ixP i:---ix*]
= [s,:s2:---:s,] y se define
S = [S (A j): S*+ I: S*+2: • • •: S„]
= [Si:s2: •••: s„] donde S*; + l — X* + l ,
Sit +2 — X j +2 ,
www.FreeLibros.me
s „ = X„
Sección A-6
Valores propios, vectores propios y transformaciones de similitud
657
Observe que xi+ ,, x*+2, . . . , x„ son los vectores propios asociados con los valores propios A*+1, A * .2,
, A,„ respectivamente. L a matriz S definida de esta forma es no singular. A hora se obtiene
AS = S
Jp i(A i)
0
0
J/>,(Ai)
0
0
A*+i
0
0
V
0
0'
donde J (, (A ,) está en la forma A,
1 A!
1
J/>,(Ai) = 1 A, que es una matriz de p, x p r De donde,
0
' J p .(A i )
0'
Jp 2(A i) S -1 A S =
0
Jp, (A i)
0
Ó
Ap+i
0
0
V
0
Por lo tanto, se ha mostrado que, al utilizar un conjunto de n vectores linealmente indepen dientes (vectores propios y vectores propios generalizados), cualquier matriz de n x n se puede reducir a una forma canónica de Jordán mediante una transformación de similitud.
T ransform ación de sim ilitu d cu a n d o u n a m atriz de n x n es norm al.
Primero, se recuerda
que una matriz es normal si es real simétrica, Hermitica, real anti-simétrica, anti-Hermítica, ortogonal, o una matriz unitaria. Suponga que una matriz normal d e n * n tiene un valor propio A, de multiplicidad k y que sus otros n — k valores propios son distintos y diferentes de A,. Entonces el rango de A - A, I es n — k. (Refiérase al problema A-12 para la prueba.) Si el rango de A - A, I es n - k, hay k vectores propios x „ x2, . . . , x4 linealmente independientes que satisfacen la ecuación ( A — A, I)x ,- = 0,
i = l,2 ,...,k
Por lo tanto, existen k bloques de Jordán para el valor propio A,. Y a que el número de bloques de Jordán es el mismo que la multiplicidad del valor propio A,, todos los bloques de Jordán son de primer orden. Como los n - k valores propios restantes son distintos, los vectores propios asociados con estos valores propios son linealmente independientes. Por lo tanto, la matriz normal de n x « tiene en total n vectores propios linealmente independientes, y la forma canónica de Jordán de la matriz normal es una matriz diagonal.
www.FreeLibros.me
A nálisis
658
vector-matriz
A p én d ice
A
Se puede probar que si A es una matriz normal de n x «, entonces, sin importar que los valores propios incluyan valores propios múltiples, existe una matriz unitaria U de n x n tal que
IT 1AU = U*AU = D =
diag
(A1; A2, . . . , A„)
donde D es una matriz diagonal con sus valores propios en la diagonal principal. L a traza de una matriz A de n x n se define como sigue:
Traza de u n a m atriz de n x n.
traza de A = tr A = 2, a„ L a traza de una matriz A de n x n tiene las siguientes propiedades:
1.
tr Ar = tr A
2. Para las matrices A y B de n x n,
tr(A + B) = tr A + trB 3. Si los valores propios de A se denotan como A,, A;, . . . , A„, entonces
tr A =
Aj
+
A2 + •• • + A„
(A-34)
4. Para una matriz A de n x m y una matriz B de m x n , sin importar que A B = B A o A B ^ BA, se tiene
n m
tr AB = trBA = 2 2 a,jbj¡ /=1y=l
Si m = 1, entonces al escribir A y B como a y b, respectivamente, se tiene
trab = ba De donde, para una matriz C de n x m, se tiene
arCa = traarC Observe que la ecuación (A-34) se puede probar como sigue. A l emplear una transformación de similitud, se tiene
P 1A P = D = matriz diagonal o
S 1AS = J = forma canónica de Jordán Es decir
A = PD P 1
o
A = S JS 1
De donde, al emplear la propiedad 4, se tiene
trA = trPDP 1 = trP
PD = trD = A, + A2 + • • • + A„
De forma similar,
trA = trSJS'1 = t r S ' S J = tr J = A, + A2 + • • • + A„
www.FreeLibros.me
Sección A-7
Formas cuadráticas
659
P ropiedades invariantes bajo transfo rm a cio n es d e sim ilitud.
S i una matriz A de n x n se
puede reducir a una matriz sim ilar que tenga una forma simple, entonces se pueden observar las propiedades importantes de A . U n a propiedad de una matriz se dice invariante si ésta es poseída por matrices similares. Por ejemplo, el determinante y el polinom io característico son invariantes bajo transformaciones de similitud, como se muestra a continuación. Suponga que P 1 A P = B . Entonces
¡B| = |P _1 AP| = |P -'| |A| |P| = |A| |P_1| |P| = |A ||P - 'P | = |A| |I| = |A| y [A I - B| = ¡A I - p - * A P | = |P_1( A I ) P - p - ’ A P |
= |P_1(AI - A)P| = |P'i [AI - A| |P| = | A I - A | | P - 1||P| = | A I - A | Observe que la traza de una matriz es también invariante bajo transformaciones de similitud, como se mostró anteriormente:
trA = tr P *AP Sin embargo, la propiedad de simetría de una matriz no es invariante. Observe que sólo las propiedades invariantes de matrices presentan características intrínsecas de la clase de matrices similares. Para determinar las propiedades invariantes de una matriz A , se examina la forma canónica de Jordán de A , ya que la similitud de dos matrices se puede definir en términos de la forma canónica de Jordán como: la condición necesaria y suficiente para que dos matrices A y B de n x n sean similares es que la forma canónica de Jordán de A y la de B sean idénticas.
A -7 F O R M A S CU AD RÁ TICA S F o rm a s cu a d rática s.
Para una matriz A real simétrica de n x n y un vector-n x real, la forma rt
n
xtA x = S
a¡i = a¡¡
2 a,y *,■*/, (-íy-i
se denomina una forma cuadrática real en *,. Con frecuencia, una forma cuadrática real se llama simplemente forma cuadrática. Observe que x 7 A x es una cantidad escalar real. Cualquier forma cuadrática real se puede escribir siempre como x T A x. P o r ejemplo,
x \ - 2*1*2 + 4*1*3 + *2 + 8*3 = [*1
*2
1 1 *3] 2
- 1 2 Xi 1 0 x2 0 8 .* 3.
Vale la pena mencionar que, para una matriz A real de n x n, se define
B = y (A + A 7)
y
C = y (A - A 7)
www.FreeLibros.me
A nálisis
660
vector-matriz
A p é n d ic e
A
entonces A = B + C Observe que B = B
y
C = - C
D e donde, una matriz real A de n x « se puede expresar como una suma de una matriz real simétrica y una matriz real anti-simétrica. Y a que x 1 C x es una cantidad escalar real, se tiene xr C x = (x r C x ) r = x r C r x = —x r C x En consecuencia, se tiene x TC x = 0 Esto significa que una forma cuadrática para una matriz real anti-simétrica es cero. Por lo tanto, xr A x = x r(B + C )x = xr B x y se ve que la forma cuadrática real x ; A x involucra sólo la componente simétrica x' Bx . Esta es la razón por la que la forma cuadrática real se define únicamente por una matriz simétrica real. Para una matriz Herm ítica A y un vector-/? x complejo, la forma n
n
a,¡ = a¡¡
x *A x = 2 2 ,=i/=i
se denomina una forma cuadrática compleja, o forma Hermítica. Observe que la cantidad escalar x *A x es real, porque x *A x = x r A x = ( x r A x ) r = x T A Tx = x *A x
F o rm a s bilineales.
Para una matriz A real de n x n, un vector-/; x real, y un vector-//; y real,
la forma
n m
X7 A y =
2 2 aijX¡y¡ '=>;=!
se denomina una forma bilineal real en x¡ y y¿. x 1 A y es una cantidad escalar real. Para una matriz A compleja de n x m, un vector-// x complejo, y un vector-m y complejo, la forma
n m x * A y = 2 2 a.jX.yj i=l /=l se denomina una forma bilineal compleja. x *A y es una cantidad escalar real.
D efin ició n y sem ideflnición.
Una forma cuadrática xy A x donde A es una matriz simétrica
real (o forma Herm ítica x *A x, donde A es una matriz Herm ítica), se dice ser definida positiva si x' A x > 0
(o x *A x > 0),
para x A 0
x? Ax = 0
(o x*Ax = 0),
para x = 0
www.FreeLibros.me
Sección A-7
Formas cuadráticas
661
x' Ax > 0
(o x*Ax > 0),
para x A 0
x' Ax = 0
(o x *A x = 0),
para x
=0
x 7 A x (o x *A x ) se dice ser semidefinida positiva si x7 Ax > 0
(o x *A x > 0),
para x A 0
x7 Ax = 0
(o x *A x = 0),
para x
=0
x 7 A x (o x * A x ) se dice ser definida negativa si x7Ax < 0
(o x *A x < 0),
para x A 0
x7Ax = 0
(o x * A x = 0 ),
para x = 0
x 1 A x (o x * A x ) se dice ser semidefinida negativa si x7 Ax < 0
(o x *A x < 0),
para x ¥= 0
x7 A x = 0
(o x *A x = 0),
para x
=0
S i x 7 A x (o x * A x ) puede ser de cualquier signo, entonces x 7 A x (o x * A x ) se dice ser indefinida. Observe que si x 7 A x (o x * A x ) es definida positiva (o negativa) se dice que A es una matriz definida positiva (o negativa). De forma similar, A se llama una matriz semidefinida positiva (o negativa) si x 7 A x o x *A x es semidefinida positiva (o negativa); la matriz se llama indefinida sí x 7 A x o x *A x es indefinida. Observe que los valores propios de una matriz real simétrica o matriz Herm ítica de n x n son reales. (Para la prueba, véase el problema A-13.) Se puede mostrar que una matriz A real simétrica o matriz Herm ítica de n * n es una matriz definida positiva si todos los valores propios A, (/ = 1, 2. . . . , n) son positivos. La matriz A es semidefinida positiva si todos los valores propios son no negativos, o A, > 0 (/= 1, 2, . . . , « ) , y al menos uno de ellos es cero. Observe que si A es una matriz definida positiva entonces ¡A|
á
0, ya que todos los valores
propios son positivos. Por lo tanto, la matriz inversa siempre existe para matrices definidas positi vas. En el proceso de determinar la estabilidad de un estado de equilibrio, por lo regular se encuen tra una función escalar V (x ). U n a función escalar V (x ), que es función de x,, x;, . . . , x„ se dice definida positiva si V (x ) > 0 ,
para x A 0
V (0 ) = 0 V (x ) se dice semidefinida positiva si V (x ) > 0,
para x A 0
V (0 ) = 0 Si - V (x ) es definida positiva (o semidefinida positiva), entonces V (x ) se dice definida negativa (o semidefinida negativa). Las condiciones necesarias y suficientes para que la forma cuadrática x 7 A x (o la forma Hermítica x * A x ) sea definida positiva, definida negativa, semidefinida positiva, o semidefinida negativa han sido dadas por J. J. Sylvester. E l criterio de Sylvester es el siguiente
www.FreeLibros.me
A nálisis
662
vector-matriz
A p é n d ic e
A
positiva es que el determinante de A sea positivo y los menores principales sucesivos del determi nante de A (los determinantes de las matrices de k x k en la esquina superior izquierda de la matriz A , donde k = 1, 2 ,. . . , n - 1) sean positivos, es decir, se debe tener
> 0 ,
#11 #21
#12
>
o,
#11
#12
#13
#21
#22
#23
#31
#32
#33
>0,
|A| > 0
#22
donde
a¡j = ajr
para una matriz A simétrica real
a}¡ = a p ,
tica.
para una matriz A Herm ítica
C riterio de S ylve ster p a ra la d efin ició n negativa d e u n a fo r m a cuadrática o fo r m a H e rm í U n a condición necesaria y suficiente para que una forma cuadrática x 7 A x (o forma Herm ítica
x *A x ), donde A es una matriz real simétrica (o matriz H erm ítica) de « x
«, sea definida negativa es
que el determinante de A sea positivo si n es par y negativo si n es impar, y
los menores principales
sucesivos de orden par sean positivos y los menores principales sucesivos de orden impar sean negativos; es decir, se debe tener Olí
#n < 0,
#21
fll2
a22
> o,
#11
#12
#13
a21
#22
#23
#31
#32
#33
|A| > 0
(n par)
|A| < 0
(n impar)
<0 ,
donde
a,j = aJh
para una matriz A real simétrica
a¡j= # j.,
para una matriz A Herm ítica
[Esta condición se puede obtener al hacer que x7( -A)x sea definida positiva.]
C riterio d e S ylve ster p a ra la se m id efin ició n p o sitiva d e u n a fo r m a cu a d rá tica o fo r m a H erm ítica. U na condición necesaria y suficiente para que una forma cuadrática x 7 A x (o forma Herm ítica x* A x ), donde A es una matriz real simétrica (o matriz Herm ítica) d e « x « , sea semidefinida positiva es que A sea singular (|A| = 0) y los menores principales sean no negativos:
SO ,
flii
a¡i
ai¡ > 0, aj¡
a,k
#«,■
an
a¡,
a,k
a ki
ük
#**
s0 .
donde i < j < k y
aij = a¡„
para una matriz A real simétrica
a,j = a ,,,
para una matriz A Hermítica
www.FreeLibros.me
Sección A-8
Pseudoinversas
663
(E s importante apuntar que en las pruebas de semidefmición positiva o semidefmición negativa se deben revisar los signos de los menores principales, no sólo los de los menores principales sucesi vos. Véase el problema A-15.)
C riterio de Sylvester p a ra la se m id efm ic ió n neg a tiva de u n a f o r m a cu a d rá tica o fo r m a H erm ítica. U n a condición necesaria y suficiente para que una forma cuadrática x 7 A x (o forma Herm ítica x* A x ), donde A es una matriz real simétrica (o matriz Herm ítica) de n x n, sea semidefinida negativa es que A sea singular (|A| = 0) y los menores principales de ordep par sean no negativos y aquellos de orden impar sean no positivos:
a ,, =s0,
& ii
&ij
a ji
a ii
—
o,
an
O-ik
an
aa
0 ¡k
Oh
a k¡
Okk
donde i < j < k y
a,j = a¡„
para una matriz A real simétrica
a,j = a „ ,
para una matriz A Herm ítica
A-8 P SEU D O IN V ER S A S E l concepto de pseudoinversas de una matriz es una generalización de la noción de una inversa. Es útil para encontrar una “ solución” a un conjunto de ecuaciones algebraicas en el cual el número de variables desconocidas y el número de ecuaciones lineales independientes no es igual. A continuación, se considerarán las pseudoinversas que permiten determinar soluciones de norma mínima.
S o lu c io n es de n o rm a m ín im a q u e m in im iza n a ||x||.
Considere una ecuación algebraica
lineal X i +
5x2 =
1
Y a que tiene dos variables independientes y una sola ecuación, no existe una solución única. E n lugar de esto, existe un número infinito de soluciones. En forma gráfica, cualquier punto en la línea
x¡ + 5x2 = 1, como se muestra en la figura A - l, es una posible solución. Sin embargo, si se decide escoger el punto que está más cerca del origen, la solución se convierte en única. Considere la ecuación matriz-vector Ax = b
(A-35)
donde A es una matriz de n x m, x es un vector-w, y b es un vector-«. Se supone que m > n (es decir, el número de variables desconocidas es mayor que el número de ecuaciones) y que la ecuación tiene un número infinito de soluciones. Se va a encontrar la solución única x que está localizada más cerca del origen o que tiene la norma ||x|| mínima. Se define la solución de norma mínima como x°. E s decir, x° satisface la condición de que A x ° = b y ||x°|| < ||x|| para toda x que satisface A x = b. Esto significa que el punto de solución x ° está más
www.FreeLibros.me
A nálisis
664
vector-matriz
A p é n d ic e
A
cerca del origen del espacio de dimensión m entre todas las soluciones posibles de la ecuación (A-35). A continuación se determinará dicha solución de norma mínima.
M a triz p seu d o in versa derecha.
Para una ecuación vector-matriz
Ax = b donde A es una matriz de n x m que tiene rango «, x es un vector-«, y b es un vector-n; la solución que m inim iza la norma ||x|| está dada por
x° = A ™ b donde Á ,tM = A r ( A A ' r 1. Esto se puede probar como sigue. Primero, se nota que la norma |¡x¡j se puede escribir de la siguiente manera:
||x|| = ¡(x - Xo + x°|| = ||x°|| + ||x - x°|| + 2 (x °)r (x - x°) E l último término, 2 (x °)7(x - x°), se puede hacer cero, ya que
(x °)r (x - Xo) = [A r ( A A V b ] r[x - A r (A A r r ’ b] =
b r(A A r ) -1 A [x
-
A T(AAT)~l b]
= b r (A A r )'* [A x - (A A r )(A A r ) ' ! b] = b ^ A A 7) ' 1^
- b)
= 0 Por lo tanto,
NI = M
+ II* - *°ll
que se puede rescribir como
N I - ll*°ll = II* - *°ll Com o (|x - x°|| > 0, se obtiene 11*11 ^ M Por lo tanto, se tiene que x° es la solución que da la norma mínima ||x||.
www.FreeLibros.me
Sección A-8
Pseudoinversas
665
L a matriz A 74'7 = A 7( A A 7) 1que produce la solución de norma m ínim a (||x°|| = m ínim o) se lla ma la pseudoinversa derecha o inversa derecha mínima de A .
R e su m e n sobre la m atriz p seu d o in versa derecha.
L a pseudoinversa derecha A /iA/ da la solu
ción x° = A km b que minimiza la norma, o hace que ||x°|| = mínimo. Observe que la pseudoinversa derecha Aml es una matriz de m x n, ya que A es una matriz de n x m y
A rm = A 7 ( A A r )“ ‘ = (matriz de m x n) (matriz de n * »)~' = matriz de m x n,
m> n
Observe que la dimensión de A A 7 es más pequeña que la dimensión del vector x, la cual es m. También observe que la pseudoinversa derecha A KM posee la propiedad de que es realmente una “ matriz inversa” si se premultiplica por A :
A A ™ = A [A r(A A r) _1] = A A r (A A r ) - ‘ = I„ S o lu c ió n q u e m in im iza a ||Ax - b||.
Considere la ecuación vector-matriz
Ax = b
(A-3 6)
donde A es una matriz de n x m, x es un vector-/», y b es un vector-». Se supone que n > m. Es decir, el número de variables desconocidas es más pequeño que el número de ecuaciones. En el sentido clásico, puede existir o no alguna solución. S i no existe solución, se puede desear encontrar una solución única que m inim ice la norma ||A x - b||. Se define una “ solución” para la ecuación (A-36) que minimiza a ||Ax — b¡| como x°. En otras palabras, x° satisface la condición ]|A x - b|j > ||Ax° - b||,
para toda x
Observe que x° no es una solución en el sentido clásico, ya que no satisface la ecuación vectormatriz original A x = b. Sin embargo, se puede llamar a x° una “ solución aproximada” , ya que m ini miza la norma ||Ax - b||. A continuación se obtendrá una solución aproximada.
M a triz p se u d o in versa izquierda.
Para una ecuación vector-matriz
Ax = b donde A es una matriz de n * m que tiene rango /», x es un vector-//?, y b es un vector-», el vector x° que minim iza la norma ||Ax - b|| está dado por
x° = A LMb = (A r A )_1 A r b donde A /JW= ( A 7' A )-1 A 7. Para verificar esto, primero observe que
||Ax - b|| = ||A (x - x°) + Ax° - b|| = ||A (x - x°)|| + ||Ax° - b|| + 2[A (x - x°)]r (Ax° - b ) E l último término se puede mostrar que es cero como sigue:
www.FreeLibros.me
A nálisis
666
vector-matriz
A p é n d ic e
A
[A (x - x°)]r (Ax° - b ) = (x - x °)r A r [A (A r A ) 1A r - I„]b = (x - x°)r [(A r A )(A r A )" 1A r - A r ]b » = (x - x°)r (A r - A r )b = 0 P o r lo tanto,
||Ax - b|| = ||A (x - x°)|| + ||Ax° - b|| Observe que
||A(x - x°)||l
> 0, se obtiene
||Ax - b|| - ||Ax° - b|| = ||A (x - x°)|| s 0 o
||Ax - b|| > ||Ax° - b|| P o r lo tanto,
x° = ALMb = (A r A ) ''A r b m inim iza a
||Ax - b||.
L a matriz A IM = la matriz
A. Observe
(A? A) 1 A7 se
lla m a pseudoinversa izquierda o inversa izquierda mínima de
que A!m es en realidad la matriz inversa de
A, en que si
se postmultiplica por A
se obtendrá la matriz identidad \„r
ALMA = (A r A ) - ‘ A r A = (A r A ) - ‘(A r A ) = l m
P R O B LEM A S DE EJEM P LO Y S O LU C IO N ES Problema A-l Muestre que si las matrices A, B, C y D son de n x n, n x m, m * n, y m x m, respectivamente, y si |A| i 1 0 y |D| A 0, entonces A 0 Solución
B D
A C
0 D = |A| |D| A 0,
si |A| A 0 y |D| A 0
Como la matriz A es no singular, se tiene A 0
B D
A 0
0 I
I 0
o’ D
I 0
A 'B I
De donde, A 0
B D
Á 0
0 I I 0
0 D
I 0
A 'B I
0 D
I D 'C
= |A ID
De forma similar, como D es no singular, se tiene A C
0 D
A 0
0 I
I 0
www.FreeLibros.me
0 = |A||D| I
Apéndice A-
Problemas de ejemplo y soluciones
667
Problema A-2 Muestre que si las matrices A, B, C y D son de n * n, n * m, m * n, y m * m, respectivamente, entonces
A C Solución
B D
|A ||D - C A _'B |,
si|A|A0
|D ||A - B D
si|D|A0
C|,
Si |A| A 0, la matriz
A C
B D
se puede escribir como un producto de dos matrices:
0
I„ A ’B 0 D - C A ’B
y
lm
B D
’a C
0 1 I„ A'B 0 D-CA'B
ImJ
Por lo tanto,
A C
B D
A 0 I„ A ’B C l m 0 D - C A ‘B = |A||Im||In||D-CA-B| = IAi ID - CA-1B|
De forma similar, si |D| A 0, entonces
B D
I„ B 0 D
A - B D ’C D ’c
0 I„
y por lo tanto
A C
B D
I- B A - B D ' C 0 D D C
0 \m
= |I„||D||A - BD-1C| |I„ = |D|¡A - BD_IC| Problema A-3 Para una matriz A de n * m y una matriz B de m x n, muestre que
|I„ + AB| = |I„ + BA| Solución
Considere la siguiente matriz:
i„ -a]
B ImJ
Con referencia al problema A-2, A C
B D
|A j|D - C A
B|,
si ¡A |A0
|D| ¡A —B D
C |,
si |D |A 0
www.FreeLibros.me
A nálisis
66 8
vector-matriz
A p é n d ic e
A
Por lo tanto,
|I„| |I„ + BA| = |Im + BA| |I„¡|I„ + AB| = |I„ + AB| y se tiene
|I„ + AB| = |I„ + BA| Problema A-4 Si las matrices A, B, C y D son d n * n, n * m, m y-n, y m * m, respectivamente, entonces se tiene el siguiente lema de inversión de matrices:
(A + BDC) ' = A 1 - A 'B(D 1 + CA 'B) 'CA 1 donde se supone que las inversas indicadas existen. Pruebe este lema de inversión. Solución
Se premultiplican ambos lados de la ecuación por (A + BD C ):
(A + BDC)(A + BDC) 1 = (A + BDC)[A“' - A“'B(D 1 + CA ’B) ’ CA 0
1 = 1 + BDCA-1 - B(D“‘ + CA B) =I
']
CA 1 - BDCA'1B(D~' +CA 'B) 'CA 1
+ BDCA'1- (B + BDCA_1B)(D 1 + CA 'B) 'CA ’
= I + BDCA'1- BD(D~‘ + CA
B)(D' + CA 'B) 'CA 1
= I + B D C A 1- BDCA”’ =I Por lo tanto, se ha probado el lema de inversión de matrices. Problema A-5 Pruebe que si las matrices A, B, C y D son de n *■n, n * m, m * n, y m *•m, respectivamente, entonces
A B 0 D al considerar que |A| A 0 y Pruebe también que
|D|
(A-37)
|D|
-1
A '1 -D'CA'
0 D'
(A-38)
A 0.
w o1
>! 0
1 >1
Observe que
--- 1
Solución
‘ a - 1 - A -1 BD”1 0 D '1
A 0.
A 0 C D considerando que |A| A 0 y
-1
D~'
A B 0 D
I„ A ' B - A ' B ° l m
ln
0
0
l,„
Por lo tanto, la ecuación (A-37) está probada. De forma similar
A“' 0 A 0 -D' CA 1 D 1 C D
I„ - D' C + D'C
Por lo tanto, se ha probado la ecuación (A-38).
www.FreeLibros.me
0 lm
ln 0 0 Im
Apéndice A
Problemas de ejemplo y soluciones
669
Problema A-6 Pruebe que si las matrices A, B, C y D son de n * n, n * m, m * n, y m * m, respectivamente, entonces
A C
B D
-i
A 1 + A 'B (D - CA ’ B) CA 1 - ( D - CA 'B ) 'C A 1
-A
B(D - CA B) 1 (D - C A ” 1B )” 1
al considerar que |A| A 0 y |D - CA 1 B| A 0. También pruebe que
A C
B D
-i -D
(A - BD ' C) (A - BD 'C ) 'B D 1 1C(A - BD 1C) 1 D 1 C(A - BD 1C) 1BD 1 + D 1
considerando que |D| A 0 y |A - BD 1 C| A 0.
Solución
Primero, observe que
A C
B D
A C
0 Im
A 'B D -C A 'B
In
0
A l tomar la inversa de ambos lados de la ecuación (A-39), se obtiene -i
A C
B D
I„ 0
A C
A B D -C A 'B
(A-39)
0 I„
En referencia al problema A-5, se encuentra
I„ 0
A ’B 1-1 D -C A 'B A C
Por lo tanto,
A C
B D
-A 'B (D - CA B )~' (D - C A ” ' B )”1 -i
0
A”1 -C A '
In,
-1
0 In,
-1
A C
A ’B D -C A 'B
In
0
0 Im
I„ - A ' B ( D - C A ’ B) 1 A ”1 -CA 1 0 (D-CA'B)1
0 Im
A 1 + A 1B(D - CA 1B) 1CA 1 -A 1B(D - CA 1B)”1 -(D - CA 'B) 'CA 1 (D-CA'B)1 si se considera que |A| A 0 y |D —CA”1 B| A 0. De forma similar, observe que
A C
B D
I„ 0
B D
A -BD ” C D C
0 Im
( A - 4 0 )
Al tomar la inversa en ambos lados de la ecuación (A-40) y en referencia al problema A-5, se obtiene -1 -i -i
A C
B D
A -B D 'C D C
0
Im
I. 0
B D
( A - B D ' C ) ”1 0 I„ -BD 1 -D " l C(A - BD”'C)”' U j [ o D”1 (A-BD'C)1 -(A - BD 'C) BD 1 - D ”1C(A - BD”1C) 1 D 1C(A - BD 1C) 1BD”' + D 1 considerando que |D| A 0 y |A - BD”1 C| A 0.
www.FreeLibros.me
A nálisis
670
vector-matriz
Problema A-7 Para una matriz A real simétrica de n x n y dos vector-u x y y, muestre que a)
d y 'x = y dx
b)
— *r Ax = Ax + Ar x dx
Para una matriz A Hermítica de n x n y un vector-n compiejo x, muestre que
— x*Ax = Ax dx
c)
Solución a)
Observe que
ti + y i x 2 + • • +
yr x = que es una cantidad escalar. Por lo tanto
1
b)
y* = y
d ^
Observe que
X K
» d T y x = dx
T
.y ».
y
x Ax = 2 2 a,,x,x, que es una cantidad escalar. Por lo tanto, n
n
— ( 2 2 a¡jXiXj OX\\i= 1jmt 1
2 « 1& i- 1
— ( 2 2 auXiXj
2
O t. — x Ax = dx
+
2
« .1 * 1
1-1
n
OXn \ , - i y - 1
& nj X j +
i- 1
2 « .« ^ i ¿ -i
= Áx + A r x que es la ecuación (A-20). Si la matriz A es una matriz real simétrica, entonces 3
T
— x Ax - 2Ax, dx c)
si A = A
T
Para una matriz Hermítica A , se tiene
n n x*Ax = 2 2 OijXiXj /•iy -1
„ . 2 2 aijXiXj
dX1\/« i y» i
— x*Ax dx
2
/-i
= Ax
n ÜnjXj
/“ I
que es la ecuación (A-21).
www.FreeLibros.me
A p é n d ic e
A
Apéndice A
Problemas de ejemplo y soluciones
671
Observe que
2 anx (
, , 2 2 a,,x,x,
<**1X1- 17-1
l-l
— x*Ax = dx
=A x
n 2 QinXi
Por lo tanto,
— x*Ax = A*x = Ax dx
Problema A-8 Para una matriz A de n * m, un vector-« complejo x, y un vector-m complejo y, muestre que a)
-x*Ay = Ay
b)
— x*Ay = Ar x ¿y
Solución a) Observe que
x*Ay = 2 2 atjXiyj Por lo tanto.
n
•
• m
— (2 2 a¡,x, y¿ dx 1X/.1jmx
2 a v y, /-!
^
— x*Ay =
= Ay
dx
m
— I 2 2 a,,x,y,
2
d X n \ i - l /-1
que es la ecuación (A-24). b) Observe que
■
„
2 <2,1 x,
- jÁ ii* ,* * , 1v —17—1
/-i
=
^ dy X*Ay =
=A x n
^
. , 2 2 a,¡x¡y¡
oy
a n iy ,
i- 1
m
J
<—1
Q im X i
que es la ecuación (A-25). De forma similar, para una matriz real A d e n x m ,u n vector-n real x, y un vector-m real y, se tiene
d T — xrAy = Ay, dx
d T T — xrAy = A rx dy
que son las ecuaciones (A-22) y (A-23), respectivamente.
Problema A-9 Dadas las matrices A y B de n * n, pruebe que los valores propios de AB y los de BA son los mismos, aun si AB A BA.
www.FreeLibros.me
A nálisis
672
A p é n d ic e
A
Primero, se considerará el caso donde A (o B) es no singular. En este caso,
Solución |A I
vector-matriz
-
B A |
=
|A I
-
A ~ ' ( A B ) A |
=
| A ' ' ( A I
-
A B ) A |
=
f A ^ ' j
(A I
-
A B (
|A (
=
(A I
-
A B
A continuación se considerará el caso donde A y B son singulares. Existen dos matrices P y Q no singulares d e n ^ n tales que P A Q
I r
o
0
0
donde I r es la matriz identidad de r x r y r es el rango de A, r < n. Se tiene (A I
-
B A |
=
(A I
-
A I
-
Q
’ B A Q j
’ G i , 21
G
=
(A I
-
Q
G
,2
Ir
t i l
G
22
0
°J
’ B P
’ P A Q |
donde G i l Q
12
G
’ B P 21
G
G 22
Entonces G Ja i
-
b
a
|
=
0
„
1
G 2,
=
Asimismo.
IA I
-
A B |
(A I r
=
(A I
=
A I
-
-
P A B P
-
I =
0
G i l
0
0
G
G
„
0 A I „ _ r
„
21
-
P A Q Q
G
12
G
22
’ B P
12
G
-
~
G
„
0
=
-
— G zi
(A I
Ir
0
A I ,
_
G „ | | A I b _,|
G A I
A i r
| _
a i
0
J
G
12
A I „ - r
| A I t
-
G
„
(A I
-
B A |
| | A I n —r |
Por lo tanto, se ha probado que =
(A I
-
A B |
o que los valores propios de AB y BA son los mismos sin importar que AB = BA o AB A BA.
Problema A-10 Muestre que la matriz A de 2 * 2 siguiente tiene dos valores propios distintos y que los vectores propios son linealmente independientes uno del otro: A
=
1 0
1 2
Entonces normalice los vectores propios.
Solución
Los valores propios se obtienen de IAI - A|
A - 1
0
-1 = (A - 1)(A - 2) = 0 A — 21
www.FreeLibros.me
Apéndice A
Problemas de ejemplo y soluciones
673
como A, = 1
y
A, = 2
Por lo tanto, la matriz A tiene dos valores propios distintos. Existen dos vectores propios x, y x, asociados con A, y A,, respectivamente. Si se define Xn
—
X\2 x 2
X 2\
=
X22
entonces el vector propio x, se puede encontrar de Axi - AiXi
(A, I - A)xi = 0 Al observar que A, = 1. se tiene 1-1 0
-1 1-2
’ o' 0
Xll ■*21
que da „tM = constante arbitraria y x2¡ = 0 Por lo tanto, el vector propio x, se puede escribir como Ci
Xn Xl
=
X21.
0
donde c, A 0 es una constante arbitraria. De forma similar, para el vector propio x2, se tiene A x 2 = A2x2
(A2I - A ) x 2 = 0 Al notar que A2= 2, se obtiene '
2
-
1
- 1
0
2
-
2
Xl2
’o’
Xj2
0
de donde se obtiene X¡2 ~ X 22 = 0
Por lo tanto, el vector asociado con A2= 2 se puede seleccionar como X2 =
X¡2
C2
X 22
c2
donde c, f 0 es una constante arbitraria. Por lo tanto, los dos vectores están dados por r Xl =
y
x2 =
El hecho de que los vectores propios x, y x2 son linealmente independientes se puede ver del hecho de que el determinante de la matriz [x, x2] no es cero:
www.FreeLibros.me
A n á lis is
674
cl
C2
0
c2
ve cto r-m atriz
A p é n d ic e
A
=h 0
Para normalizar los vectores propios, se escoge c, = 1 y c2= 1/-J2, o 1 Xi
=
1' 0
x2 =
V2 1 V2
Claramente, el valor absoluto de cada uno de los vectores propios se convierte en la unidad y por lo tanto, los vectores propios están normalizados.
Problema A - ll Obtenga una matriz de transformación T que transforme la matriz
A =
0 0 0 0
1 -1 0 0
0 1 0 -1
3 1 1 -2
en la forma canónica de Jordán.
Solución
La ecuación característica es
|AI - A| =
A 0 0 0
-1 ! 0 A + 1 1 -1 0 1 A 0 í1 1
-3 -1 -1 \ + 2
A 0
-1 A + 1
A 1
-1 A + 2
= (A + 1)3A = 0 Por lo tanto, la matriz A involucra los valores propios A, = -1 ,
a2 —
-1 ,
a3
A4 = 0
= -1
s en -1, se tiene
A =
-1 0 0 0
-1 0 0 0
0 -1 -1 1
-3 -1 -1 1
que es de rango 2, o rango (4 - 2). De la condición de rango se ve que debe haber dos bloques de Jordán para el valor propio en -1, es decir un bloque de Jordán de p¡ y p, y otro de p2 x p->- donde p, + p-, = 3. Observe que para p, + p2= 3 hay una sola combinación (2 y 1) para las órdenes p, y p2. Se escoge
Pi = 2
Pi= 1
Entonces hay un vector propio y uno generalizado para el bloque de Jordán J/>i y un vector propio para el bloque de Jordán i pí se define el vector propio y el vector propio generalizado para el bloque de Jordán i como v n y vi2, respectivamente, y el vector propio para el bloque de Jordán Jp2 como v2|. Entonces deben existir los vectores v n, v 12 y v2l que satisfacen las siguientes ecuaciones:
(A - AiI)vu = 0, (A -
Ai I)v12 =
(A - A ,I ) v 2, = 0
vn
www.FreeLibros.me
Apéndice A
Problemas de ejemplo y soluciones
675
Para A, = -1, A - A, I puede estar dada como sigue:
A - A, I =
1 0 0 0
1 0 0 0
0 1 1 -1
3 1 1 -1
Al observar que 1 0 0 0
(A - Ai I)2 =
1 0 0 0
-2 0 0 0
1 0 0 0
se determina el vector v,2 que satisfará la ecuación
(A - A,I)2v,2 = 0 y al mismo tiempo hará que (A - A, l)v ,2no sea cero. Un ejemplo de dicho vector generalizado v l2 puede ser
a = constante arbitraria no cero
El vector propio v,, se encuentra como un vector no cero (A - A, I)v ,2: 2a
v„ = (A - Ai I)V)2 =
a a —a
Ya que a es una constante arbitraria no cero, se escoge como a = 1. Entonces se tiene - 1
Vil
<
1 = 1
II
2
0 0
- 1
1
A continuación, se determina v2, para que v2, y v¡, sean linealmente independientes. Para v2, se escoge
b + 3c -b c -c
V21
donde b y c son constantes arbitrarias. Se escoge, por ejemplo, b = 1 y c = 0. Entonces
V2 1 =
1 -1 0 0
Es claro que, v n, v 12, y v 2l son linealmente independientes. Se definen Vil = Xl,
V12 = X2,
www.FreeLibros.me
V21 = x3
Análisis
676
2 1 1 -1
T(A,) = [vn : v 12: v21] = [ x , : x2 : x3] =
vector-matriz
-1 0 0 1
A p é n d ic e
A
1 -1 0 0
Para el valor propio distinto A4= 0. ei vector propio x4se puede determinar de (A - A4I)x 4 = 0 Al observar que
0 1 0 3 0 -1 1 1 A - A4I = A = 0 0 0 1 0 - 1 -2 0 se encuentra
Xt =
donde d ^ 0 es una constante arbitraria. AI seleccionar a d =■ I. se tiene
T(A4) = X4 =
Por lo tanto, ia transformación T se puede escribir como
t
= [t ( a , ) : t ( a 4)] =
2 - 1 1 1 1 0 - 1 0
1 0
-
1
0 0
1
0
0
Entonces
0 0 1 1 0 0 r 'A T = 0 -1 1 .1 1 -2
-1 0 0 0
0 1 0 1.
1 0 2 -1 3 0 1 1 0 -1 1 1 1 0 -1 0 1 0 0 0 1 0 0 0 0 - 1 - 2. . - 1 1 0 0. .0
1: 0 0 -1 ! 0 0 = diag[J2(-l),Ji(-l),Ji(0)] ~o”f- r 0 0 o"fo.
Problema A-12 Suponga que una matriz normal A de n * n tiene un valor propio A, de multiplicidad k. Pruebe que el ranao de A - A, I es n —k. S o lu c ió n
Suponga que el rango de A - A, I es n - m. Entonces la ecuación ( A - A, I ) x = 0
www.FreeLibros.me
(A-41)
Apéndice A
Problemas de ejemplo y soluciones
677
tendrá m vectores solución linealmente independientes. Se escogen los m vectores de forma que sean ortogonales y normalizados. Es decir x,. x2 x,„ satisfará la ecuación (A-41) y serán ononormales. Se consideran los n - ni vectores x,„. x,„i2........ x„ tales que todos los n vectores X i , x 2, . . .
, x „
serán ortonormales. Entonces la matriz U. se define como
U = [ x i: x2: • • •: x„] es una matriz unitaria. Ya que 1 < i < m. se tiene
Ax, = A] x, y por lo tanto se puede escribir
AU = U
Ai I m B 0 C
U*AU =
A ,Im B 0 C
Al observar que
||Ax, - Ax.ll2 = ((A - AI)x,, (A - AI)x,)
= ((A* - AI)(A - A I)x,,x,) = ((A - AI)(A* - A I)x,,x,) = {(A* - A I)x„ (A* - AI)x,) = ||A*x, - Ax.H2 = 0 se tiene
A*x, = Ax, Por lo tanto, se puede escribir
A*U = U
U*A*U =
Al I m B, 0 Ci
A1Im 0
Bi C,
De donde.
= U*AU = (U*A*U)* =
Allm 0
Bl Cj
*
Ai I m
B^
Al comparar los lados izquierdo y derecho de esta última ecuación, se obtiene
B= 0
www.FreeLibros.me
0 u
Ai I m B 0 C
678
A nálisis
vector-matriz
A p é n d ic e
A
Por lo tanto, se obtiene A = U
Al lm
0
0
c
u *
Entonces
A - AI = U
(A, - A)Im 0 0 C - AI„
U*
El determinante de esta última ecuación es
|A - AI| = (A, - A)"|C - AI„~„
(A-42)
Por otro lado, se tiene rango (A - A, I) = n - m = rango o
= rango
0
U
ro
0
0
C — Ai I„
o
C - A, I„
u*
: rango (C - A , I „ _ J
Por lo tanto, se concluye que el rango de C -A, I„_,„ es n - m. En consecuencia |C - Ai l„-„] 4 0 y de la ecuación (A-42), A, se muestra ser el valor propio con multiplicidad m de |A - A II = 0. Ya que A, es el valor propio de A con multiplicidad k, se debe tener m = k. Por lo tanto, el rango de A - A, I es n-k. Observe que, como el rango de A - A| I es n ~ k, la ecuación
(A - Ai I)x, = 0 tendrá k vectores propios línealmente independientes x b x 2, . . . , xh
Problema A-13 Pruebe que los valores propios de una matriz Hermítica de n x n y de una matriz real simétrica de n x n son reales. Pruebe también que los valores propios de una matriz anti-Hermítica y de una matriz real anti simétrica son cero o imaginarios puros.
Solución Se define cualquier valor propio de una matriz I lermítica A den * n por A = a +jp. Existe un vector x 4 0 tal que Ax = (a + jl3)x La transpuesta conjugada de esta última ecuación es
x*A* = (a - jfi)x * Ya que A es Hermítica A* = A. Por lo tanto, se obtiene
x*Ax = (a - ;'/3)x*x Por otro lado, como Ax = (a +y/3)x, se tiene
x*Ax = (a + jp)x*x Por lo tanto, se obtiene
[(a - ¡ P ) - ( a + /P)]x*x = 0 o
-2jpx*x = 0 Ya que x*x A 0 (para x A 0), se concluye que
0
=
0
www.FreeLibros.me
Apéndice A
Problemas de ejemplo y soluciones
679
Esto prueba que cualquier valor propio de una matriz Hermítica A de n * n es real. De donde los valores propios de una matriz real simétrica son también reales, ya que es Hermítica. Para probar la segunda parte del problema, observe que si B es anti-Her.mítica, entonces j B es Hermítica. Por lo tanto, los valores propios de j B son reales, lo que implica que los valores propios de B son ya sea cero o imaginarios puros. Los valores propios de una matriz real anti-simétrica son también ya sea cero o imaginarios puros, ya que una matriz real anti-simétrica es anti-Hermítica. Observe que, en la matriz real anti-simétrica, los valores propios imaginarios puros ocurren en pares conjugados, ya que los coeficientes de la ecuación característica son reales. Observe también que una matriz real anti-simétrica de n * n es singular si n es impar, ya que dicha matriz debe incluir al menos un valor propio cero.
Problema A-14 Examine si la siguiente matriz A de 3 * 3 es definida positiva o no:
A = Solución 1.
2 6 0
-1 0 1
Se demostrarán tres formas diferentes para probar la definición positiva de la matriz A.
Primero se puede aplicar el criterio de Sylvester para la definición positiva de una forma cuadrática x' Ax. Para la matriz A dada, se tiene
2
2.
2 2 -1
2 2
> 0,
2 >0, 6
2
2 - 1
2
6
0
-1
0
1
>0
Por lo tanto, los menores principales sucesivos son todos positivos. De esta manera, la matriz A es definida positiva. Se puede examinar la definición positiva de x7 Ax. Como
xr Ax = [*1 * 2 * 3 ]
2 2 -1
= 2x, + 4 * i *2 -
2 6 0
-1 0 1
* 1 *2 * 2
2* 1X 3 + 6*2 + *3
= (* i - * 3) 2 + (*i + 2*2)2 + 2*2
3.
se encuentra que x 7 Ax es positiva excepto en el origen (x = 0). Por lo tanto, se concluye que la matriz A es definida positiva. Se pueden examinar los valores propios de la matriz A. Observe que
|AI - A| = A3 - 9AJ + 15A - 2 = (A - 2 )(A - 0.1459)(A - 6.8541) Por lo tanto,
A, = 2,
A2 = 0.1459,
A3 = 6.8541
Ya que los valores propios son positivos, se concluye que A es una matriz definida positiva.
Problema A-15 Examine si la siguiente matriz A es semidefinida positiva:
,’i 2 A = '2 4 1 2
1
www.FreeLibros.me
A nálisis
680
vector-matriz
A p én d ice
A
Solución En la prueba de definición positiva, se necesitan examinar los signos de todos ios menores principales además del signo del determinante de la matriz dada, el cual puede ser cero: es decir. |A| debe ser igual a 0. Para la matriz de 3 x 3 <*11
<*12
<*13
<*21
<*22
<*23
<*31
<*32
<*33
<*11
<*12
<*21
<*22
1
hay seis menores principales: «11,
<*22,
<*33,
’
<*22
<*23
<*32
«33
’
«u
«13
«31
« 33
Se necesitan examinar los signos de todos los seis menores principales y el signo de |A|. Para la matriz A dada. a,, = 1 > 0
a22 = 4 > 0 <*.3.3 =
0
«n
«12
1
2
«21
« 22
2
4
« 22
« 23
4
2
« 32
« 33
2
0
O lí
«13
1
1
«31
« 33
1
0
« II
« 12
« 13
«21
« 22
« 23
«31
«32
« 33
=
= -1 < 0
1
2
1
2
4
2
1
2
0
0
Es claro que. dos menores principales son negativos. Así. se concluye que la matriz A no es semidefinida positiva. Es importante observar que. como se han probado los signos de los menores sucesivos y del determinante de la matriz A,
1 > 0,
1
2
1
A
¿
o,
=
|A |
4
=
1
2
1
2
4
2
1
2
0
= 0
se pudo haber llegado a la conclusión errónea de que la matriz A es semidefinida positiva. De hecho, para la matriz A dada. A
|AI - A| =
- 2 - 1
=
(A
-
1
- 2 A
-
-1 4
=
- 2
- 2
(A 2 -
5A
-
5 )A
A
5 .8 5 4 1 ) A ( A
+
0 .8 5 4 1 )
y los valores propios son A, =
5 .8 5 4 1 ,
0,
-0 .8 5 4 1
Para que la matriz A sea semidefinida positiva, lodos los valores propios deben ser no negativos y al menos uno de ellos debe ser cero. Sin duda, la matriz A es una matriz indefinida.
www.FreeLibros.me
Apéndice B Teoría de la tran sform ada z
B-l
IN TRODUCCIÓN En este apéndice se presenta primero teoremas útiles de la teoría de la transformada z que no se trataron en el capítulo 2. Después se discuten detalles del método de la integral de inversión para encontrar la transformada inversa z. Por último, se estudia el método de la transformada z m odifica da. A l final del apéndice (en la sección de los problemas de ejemplo y soluciones), se discuten algunos problemas interesantes que tratan con la transformación z, que no se vieron en el capítulo 2 .
B-2 TEO REM A S ÚTILES DE LA TEORÍA DE LA TRA N SFO RM A D A z A quí se presentan algunos de los teoremas útiles de la teoría de la transformada z.
D iferenciación com pleja.
Una serie de potencias en z se puede diferenciar con respecto a z
en su región de convergencia cualquier número de veces para obtener una serie convergente. Las derivadas de X(z) convergen en la misma región de A'(r). Considere x
X { z ) = 2 x(k)z~k k=0 que converge en una cierta región en el plano z. Al diferenciar a A'(z) con respecto a z, se obtiene
■ fx(z) = ¿ UZ
( - k ) x { k ) z - k^
Ar=0
681
www.FreeLibros.me
Teoría de la transformada z
682
Apéndice B
A l multiplicar ambos lados de esta última ecuación por-z se tiene
- z— X (z) = (*Z
X
(B - l)
kx{k)z k
t =n
Po r lo tanto, se tiene (B- 2 )
Z[kx(k)] = - z - j ^ X ( z ) De forma similar, al diferenciar ambos lados de la ecuación ( B - l) con respecto a z, se tiene
d_ dz
x
- z f z Xiz)
=X
( ~ k 2) x ( k ) z ~ k~i
A l m ultiplicar ambos lados de esta última ecuación por -z, se obtiene
-z
d
X k 2x ( k ) z - k
dz
Z [ k 2x { k ) ] = y - z — ) X ( z ) L a operación ^ -z-J-
j
implica que se puede aplicar el operador
dos veces. De igual manera, al
repetir el proceso se tiene (B-3)
Z[k-x(k)] = [ - z T z ) X(z)
Dicha diferenciación compleja permite obtener nuevos pares de transformada z a partir de los pares ya conocidos.
Ejemplo B -l La transformada z de la secuencia escalón unitario 1(k) está dada por
Obtenga la transformada z de la secuencia rampa unitaria x(k), donde
x(k) = k mediante el uso del teorema de diferenciación compleja.
Z [ x ( k ) ] = Z [ k \ = Z [ k ■i ( * ) ] = In teg ra ció n com pleja.
= (1 l 'i - i y
Considere la secuencia
donde x(k)/k es finita para k = 0. La transformada z de x(k)/k está dada por
www.FreeLibros.me
Sección B-2
Teoremas útiles de la teoría de la transformada z
x(k)
Z
683
l-K
+ lim íS ) *—o k
(B- f)
donde C[.y (£)] -A^z). Para probar la ecuación (B-4), observe que
Z í* (* )
= G (z ) = I í f z - *
*=o K
A l diferenciar esta última ecuación con respecto a z se tiene
d_ 'G (z) = - 2 x(k)z * 1 = - z k=0
dz
12 x ( k ) z k = *=0
2
A l integrar ambos lados de está última ecuación con respecto a z desde z a x da
G ( z ) = r * & > d z , + G (°o ) Jz
A l observar que G H
Z\
está dado por G H
=
l i m
Z—x
G (z )
=
g (0 )
=
l
i
m
k->0 k
^
se tiene
Z
x(k)
H
Zi
*-.o
k
Teorem a de diferenciación parcial. Considere una función x(t, a) o x(kT, a ) que tiene trans formada z. A quí a es una constante o una variable independiente. L a transformada z de x(t, a) o x(kT, a ) se define como X(z, a). Por lo tanto, Z [x(t,a))= Z [x(kT ,a)) = X {z,a) L a transformada z de la derivada parcial de x:(/, á) o x(kT, a) con respecto a a está dada por
z [ i x M }~ z [ í
x(kT,a)
da
(B-5)
X (z,a)
Esta ecuación se denomina el teorema de diferenciación parcial. Para probar este teorema, observe que
Z
d , 3 * * (> ,« )
-x(kT ,a )
= 2 ~ x{kT ,a)z t=o da
= Í £ , x ík T -‘, ) 2~‘ ~ í x ( 2 ’ ‘,) Ejemplo B-2 Considere
x(t,a) = t 2e
www.FreeLibros.me
*
Teoría de la transformada z
684
Apéndice B
Obtenga la transformada; de esta función x(t. a) mediante el empleo del teorema de diferenciación parcial. Al observar que
^ - { - t e ~ a') = t 2e~°'
Te~aT z ( i - e~aTz - y Entonces se tiene
Z[ x{ t, a) ] = Z [ t 2e~a'] = Z d_ da
Te~aTz (1 - e~°Tz _1)2_
T 2e - ar(l + e ^ r z - ‘) z - ‘ (1 - e~aTz~')3 Teorema de convolución real.
Considere las funciones *,(/) y x2(t), donde x,(/) = 0,
para/<0
x2(t) = 0,
para / < 0
Suponga que x ,(í) y x2(l) tienen transformada z y que son A j(z ) y X 2(z), respectivamente. Entonces ¿ x , { h T ) x 2{ k T L h=Q
X l( z ) X 2( z ) = Z
hT)
(B-6)
Esta ecuación se denomina el teorema de convolución real. Para probar este teorema, observe que
Z
X
x x{ h T ) x 2{ k T - h T )
. h=0
=
X 2 x y( h T ) x 2( k T - h T ) z ~ k k=0/»=0 X
= X
X
X x , ( h T ) x 2( k T - h T ) z ~ k
donde se emplea la condición que x2(kT- hT) = 0 para h > k. Ahora se define a m = k - h. Entonces
Z
¿
Xi( h T ) x 2( k T - h T )
= X * i ( h T ) z h 2 x 2( m T ) z h~0 m=-h
Y a que x2(mT) = 0 para m < 0, esta última ecuación se convierte en x
Z
X
x x( h T ) x 2( k T - h T )
=
Teorema de la convolución compleja.
x
2 xl(hT)z~H2 x2{tnT)z~m = X t( z ) X 2( z ) E l siguiente teorema, conocido como el teorema de la
convolución compleja, sirve para obtener la transformada z del producto de dos secuencias xt(k ) y
x2(k).
www.FreeLibros.me
Sección B-2
Teoremas útiles de la teoría de la transformada z
Suponga que tanto
685
como x 2(k) son cero para k < 0. También suponga que
X:(z) = Z [ x ¿ k ) l
M >
X 2( z )
\z \> R 2
=
Z [ x 2( k) ],
donde /?, y R2 son los radios de convergencia para.v,(£) y x 2(k), respectivamente. Entonces la trans formada r del producto de x,(k) y x 2(k) se puede escribir como
Z [ x , ( k ) x 2(k) } =
(B-7)
donde R 2 < |c| < |rj//?,. Para probar este teorema, se toma la transformada - de x¡(k)x2(k):
Z [ x \ ( k ) x 2( k) ] = ' L x i ( k ) x 2{ k ) z ~ k
(B- 8 )
*=() La serie en ei lado derecho de ia ecuación (B - 8 ) converge para ¡--i> R, donde R es el radio de conver gencia absoluta para x¡{k)x2(k). De la ecuación (2-23), se tiene
= ^ - j c X 2U ) { k- ' d í
(B-9)
A l sustituir la ecuación (B- 9 ) en la ecuación (B - 8 ), se obtiene
Z [ Xi( k ) x 2(k)] = r L É Í
x ¿ k ) z - kd i
Z T f } k= 0 J C
A l observar que la ecuación (B - 8 ) converge uniformemente para la región |r| > R, se puede intercambiar el orden de la sumatoria y la integración. Entonces
z [ x , { k ) z 2{k)) = ~ - Á Z T T ]J C
c ' x 2( t ) Í x ¿ k ) ( r l z y k d { *= 0
Y a que
i * , ( k ) ( r l z)~k = X ¿ C ' Z ) k=0
se tiene
z [ Xl(k)x2(k )] = £ j j c r ' X 2 Í o x ¿ r ' z ) d c
(B-io)
donde C es un contorno (un círculo con centro en el origen), que está en la región dada por |£] > R2 v i r 1--!>/?„ o
www.FreeLibros.me
Teoría de la transformada z
686 Teorem a de Parseval.
Apéndice B
Suponga que las transformadas z de dos secuencias x t(k ) y x 2(k) son
X, (z) = 2[x, (k)},
|z¡ > R, (donde R, < 1)
X¿z) =2[x2(k)],
\A>Ri
y la desigualdad (B - l 1) se satisface para |z| = 1, o
Entonces, al sustituir |z| = 1 en la ecuación (8-10), se obtiene la siguiente ecuación:
z M k M k ) ) ^ = ¿ x¡(k)x2(k) =
r 'w
r V
í
JC
*=o
S i se hace que x t(k ) = x 2(k ) = x(k) en esta última ecuación, se obtiene
¿ j t 2(A0 = ¿y> r ' ^ ( P ( r V í =
z-'X (z)X {z-')d z
¿7 TJJC
(B - l2)
L a ecuación ( B - l 2) es el teorema de Parseval. Este teorema es útil para obtener la sumatoria d t x 2(k).
B-3 T RA N SFO RM A CIÓ N IN VERSA x Y EL M ÉTOD O DE LA IN TEGRAL DE IN V ER SIÓ N S i X ( z ) se expande en una serie de potencia en z“ ', oo
X(z) = 2 x(kT)z~k = *(0) + x ( T ) z l + x (2 T)z ~2 + • • • + x { k T ) z k + • • • k~Q
O
»
X(z) = 2 x(k)z~k = *(0) + *(l)z _1 + x( 2)z~2 + ■• • + x(k)z~k + • • • *= o
entonces los valores de x(kT ) o x(k) dan la transformada inversa z. S i X(z) está dada en la forma de una función racional, la expansión en una serie infinita de potencias crecientes de z' 1 se puede lograr al divid ir el numerador entre el denominador. Si la serie resultante es convergente, los coeficientes del término z~k en la serie son los valores de X(kT) de la secuencia de tiempo. Sin embargo, por lo regular es d ifícil obtener una expresión en forma cerrada. Algunas veces, las siguientes fórmulas son útiles para reconocer las expresiones en forma cerrada para series finitas e infinitas en z” 1.
(1 - az ’)3 = 1 - 3az 1 + 3a2z 2 - a3z 3 (1 - az~')* = 1 - 4az~l + 6a 2z~2 - 4a3z~3 + aAz~*
www.FreeLibros.me
Sección B-3
687
Transformación inversa z y el método de la integral de inversión
(1 -
a z ~‘) _1
=
1 + a z -1 + a 2 z "2 + a 3 z "3 + a 4 z “4 + a 5z ~ s+••■
(1 -
a z ~ l)~2
=
1 + 2a z -1
+ 3a 2 z ~2 + 4a 3 z ~3 + 5a 4 z “4 + 6 a 5 z ~5 + • ■•, |z|
(1 -
a z ~')~3
=
1 + 3az“ '
+ 6 a2z ~ 2 + 10a 3 z “3 + 15a4z~4
+ 21 a 5 z -5 + 28a6z -6 + •• • (1 — a z -1) -4
=
1 + 4 a z _1
|z| > 1
|z| > 1
+ 10a 2 z -2 + 20a 3 z -3 + 35 a 4 z ~4
+ 56a5z ~5 + 84a6z “ 6 + 120a 7 z “7 + •• ■
|z| > 1
Para una transformada z X(z), si se desea la expresión en forma cerrada para x(k), se puede usar el método de la expansión en fracciones parciales o el método de la integral de inversión que se presenta a continuación.
M étodo de la in teg ra l de inversión.
E l método de la integral de inversión, basado en la
integral de inversión, es el método más común para obtener la transformada inversa z. Está basado en la teoría de variable compleja. (Para un presentación rigurosa y completa de la integral de inversión, refiérase a un libro sobre la teoría de variable compleja.) A l presentar la fórmula de la integral de inversión para la transformada z, se necesita revisar el teorema de los residuos y su material antece dente asociado.
R epaso d el m ateria l necesario pa ra o btener la fó r m u la de la in teg ra l de in versión.
Suponga
que z0 es un punto singular aislado (polo) de F(z). Se puede ver que existe un número positivo r, tal que la función F(z) es analítica en cada punto z para el cual 0 < |z —z0| —r i •E l círculo con centro z = z0 y radio r, se denota como í j . Se define a T 2 como cualquier círculo con centro enz = z0y radio |z-z0| = r2para el cual
r 2 - r l-
Los círculos T, y T 2 se muestran en la figura B - 1. Entonces, la expansión en la
serie de Laurent de F(z) alrededor del polo en z = z0 puede estar dada por
F ( z ) = 2 an( z - z0)" + ¿ n=0
■
n= l
bn
( Z ~ Z 0f
donde los coeficientes a„ y b„ están dados por:
1X
F(z) an - ~ 7------ dz, l'f j 'r , (z — z0)
_ 1X
h F(z) bn - X —. f 7 rr ^ rra z , 2 TT]Jr2( z - zn) "+1
n = 0 , 1, 2 , . . .
n = 1,2,3,...
Figura B-l Región analítica para la función F (:).
www.FreeLibros.me
>1
688
Teoría de la Transformada z
Figura B-2
Apéndice B
Región analítica para la
función F(z) limitada por una curva cerrada F.
Observe que el coeficiente b ] está dado por
b i = ^ - Á F{z)dz ¿TT)Jr2
(B-13)
Se puede probar que el valor de la integral de la ecuación (B-13) no cambia si /", se reemplaza por cualquier curva cerrada /"alrededor de z0 tal que F(z) sea analítica sobre y dentro de /"excepto en el polo z = z0 (vea la figura B-2). La curva cerrada /"puede extenderse afuera del círculo F¡. Entonces, en referencia al teorema de Cauchy-Goursat, se tiene
Jr
F(z)dz -
F(z)dz = 0 J r2
Po r lo tanto, la ecuación (B-13) se puede escribir como
b<* é ¡ í Fi-z>dz E l coeficiente b¡ se denomina el residuo de F(z) en el polo z0. A continuación, se supone que la curva cerrada /"encierra m polos aislados z¡, z 2, ■. ■, z„„ como se muestra en la figura B-3. Observe que la función F(z) es analítica en la región sombreada. De
www.FreeLibros.me
Sección B-3
Transformación inversa z y ei método de ia integral de inversión
689
acuerdo al teorema de Cauchy-Goursat, la Integral de F (z ) sobre la región sombreada es cero. L a integral sobre el total de la región sombreada es £ F (z ) dz - §
F (z ) dz -
F(z) dz -
£
F(z) dz = 0
donde F,, F ;, . . . . F„, son curvas cerradas alrededor de los polos z,, z2, . . . , zm, respectivamente. Po r lo F (z ) dz = r
F(z) dz + r ¡
F ( z ) d z + ■• ■ + r2
F(z) dz I'm
= 2 v j(b u + b h + ■■■ + b i j = 2 v j(K { + K 2 + ■■■ + Km) donde Áj ^ b u.K 2~ h u
(B-l 4)
Km= bf son los residuos de F (z ) en los polos z,.z;, ____ z,„, respectivamente.
La ecuación ( B - 14) se conoce como el teorema de los residuos. Este teorema establece que una función F(z) es ana lítica dentro y sobre una curva cerrada F , excepto en un número finito de polos z,, z-,,. . . , z,„ dentro de F, entonces la integral de F (z ) alrededor de Ftom ada en contra de las manecillas del reloj es igual a 2777 veces la suma de los residuos de los polos z¡. z2, . . . , z,„.
In te g ra l de inversión p a ra la transfo rm a d a
Ahora se empleará el teorema de Cauchy-
Goursat y elteorema de losresiduos para obtener la integral de inversión parala transformada z. De la definición de la transformada z, se tiene x
X { z ) = 2 x ( k T ) z ~ k = x ( 0 ) + x ( T ) z “ > + z ( 2 F ) z ' 2 + ■■■ + x { k T ) z ~ k + • • • A=0
A l m ultiplicar ambos lados de esta última ecuación por z * " s e obtiene
X ( z ) z k~l = x (0 )z * ~ ‘ + x ( T ) z k~2 + x (2 7 > * ~ 3 + •• • + x { k T ) z ~ ' + •• ■
(B-15)
Observe que la ecuación (B-15) es la expansión en la serie de Laurent de X(z ) . ~ 1alrededor del punto z = 0. Considere un círculo C con centro en el origen tal que los polos de X(:)zk~' están dentro de él. A l observar que el coeficiente de x(kT) asociado con el término z '1en la ecuación ( B - 15) es el residuo, se obtiene
x ( k T ) = t r - . f X { z ) z k~' d z Z7TJJ C
(B - l6)
La ecuación (B- 1 6) es la integral de inversión para la transformada z. La evaluación de la integral de inversión se puede hacer como se presenta a continuación. Se definen los polos deA'(z)z*-1 comoz, , z2, . . . , z,„. Yaq ue la curva cerrada C encierra los polos z¡, z-,,. . . , z„„ entonces con referencia a la ecuación ( B - l 4) se tiene
X ( z ) z k~1d z = k C
C|
X ( z ) z k~' d z +
= 2jrj(K l + K 2 + ■• • + Km)
Cm
(B—17)
donde K „ K 2, . . . , K„, denotan los residuos d e X(z)zk~1en los polos z¡, z;, . . . , z„„ respectivamente, y C j, C2,
, Cmson pequeñas curvas alrededor de los polos aislados z,, z: , . . ., z„„ respectivamente.
www.FreeLibros.me
Teoría de la transformada z
690
Apéndice B
A hora se combinan la ecuaciones (B - 16) y la (B - 17) para obtener un resultado muy útil. Y a que
X(z)zk~' tiene m polos, esto es, zu z2, . . . , z„„
x ( k ) = x ( k T ) = Ki + K 2 + • •- + K m m
= X [residuo de X{z)zk ^¡ en el polo z = 2,deA (r)z*~ ']
(B-18)
1=1 A l evaluar los residuos, observe que si el denominador d e Jf ( :) z * '! contiene un polo simple en z = z, entonces el residuo K correspondiente es
K = lim [(z - Z j)X (z )z k~l] Z — Z¡
S i X(z)^ ~ 1 contiene un polo múltiple en z/ de orden q, el residuo K está dado por
Observe que en este libro se trata sólo con la transformada z unilateral. Esto im plica que x(k) = O para k < 0. Por lo tanto, los valores de k en la ecuación (B - 17) se restringen a los valores enteros no negativos. Si X(z) tiene un cero de orden r en el origen, entonces A(z)z*"' en la ecuación (B - 17) involucrará un cero de orden r + k - \ en el origen. S i r > 1 entonces r + k - 1 > 0 o ¿ > 0, y no existe un polo en z = 0 en X(z)zk~'. Sin embargo, si r < 0, entonces habrá un polo en z = 0 para uno o más valores no negativos de k. En tal caso, se necesita la inversión separada de la ecuación (B-1 7 ) para cada valor de k. Se debe observar que el método de la integral de inversión, cuando es evaluado por los resi duos, es una técnica muy simple para obtener la transformada inversaz, considerando queA(z)zA
no
tiene polos en el origen, z = 0. Si, sin embargo, A(z)zí l tiene un polo simple o un polo múltiple en z =
0 , entonces los cálculos se pueden hacer engorrosos y el método de expansión en fracciones parciales puede ser más simple de aplicar.
C om entarios sobre el cálculo de los residuos.
A I obtener los residuos de una función X(z),
observe que, sin importar la forma como se calculan dichos residuos, el resultado final es el mismo. Po r lo tanto, se puede utilizar cualquier método que sea conveniente según la situación. Por ejemplo, considere la función X(z) siguiente:
x ( z ) = 2zl
A {2 )
- z- - - +
(z + l ) 3
-4-z -
(z + l ) 2
+ _ J _
z + 1
Se demostrarán tres métodos para calcular los residuos de esta función X{z).
M étodo l.
E l residuo de esta función se puede obtener como la suma de los residuos de los
términos respectivos: [Residuo K de X(z) al poloz = - l ]
1
,.
d2
,
,
x3 2 z
2
www.FreeLibros.me
+ 5z + ó l
Sección B-4
Método de la transformada z modificada
Método 2.
691
Si ios tres términos de X(z) se combinan en uno solo como se muestra a continua
ción,
, , _ 2z 2 + 52 + 6 (2 + l ) 3
4z (Z + l ) 2
5 _ 11 z 2 + 19z + 11 2 + 1 (Z + l ) 3
entonces el residuo se puede calcular como sigue: [Residuo K d eX(z) al polo - = -1] i
(3 - l ) ! ; l mid z2
(2
+ 1): l l z
+ 19z + 11 (^ + l ) 3
.
= j lim (22) 2—»—1
=
Método 3.
11
Si X(z) se expande en la forma usual en fracciones parciales como se muestra a
continuación,
= H z 2 + 19z + 11 = ___ 3_________ 3___ ^
(2 + l ) 3
(2 + l ) 3
(Z + l ) 2
11 Z + 1
entonces el residuo de 3f(z) es el coeficiente del término l/(z + 1). Por lo tanto, [Residuo K deA fz) al poloz = - l ] = 11 B -4
M ÉTO D O DE LA TRA N SFO RM A D A z M OD IFICAD A L a transformada z modificada es una modificación del método de la transformada z. Se basa en insertar un retraso ficticio puro a la salida del sistema, además de insertar un muestreador ficticio en la salida, y variar la cantidad de retraso ficticio para obtener la salida entre cualquiera de dos instantes de muestreo consecutivos. E l método de la transformada z modificada es útil no sólo para obtener la respuesta entre dos instantes de muestreo consecutivos, sino también para obtener la transformada z de procesos con retrasos puros o retrasos de transporte. Además, el método de la transformadaz m odificada se aplica a la mayoría de los esquemas de muestreo. Considere el sistema que se muestra en la figura B-4(a). En este sistema se inserta un retraso ficticio de (1 -m )T segundos, donde 0 < /w < 1 y f e s el periodo de muestreo, en la salida del sistema. A l variar a m entre 0 y 1, se puede obtener la s a lid a y (0 en / = k T - (1 - m )T (donde k= 1,2, 3 , . . . ) . A l observar que G\s) está dada por
G*(s) = ¿ % ( í ) M 0 ] la función de transferencia pulso modificada G(z, m) se define como Z m[ G ( s ) ] = G ( z , m ) = G * ( j , m ) | s=(1/D in2 =
%[g(t
-
(1 -
donde la notación C„, significa la transformada z modificada.
www.FreeLibros.me
m ) T ) 5 r ( 0 ] U ( . / n >„z
( B ' 19)
Teoría de la transformada z
692
X(s)
X 'is )
sT
Y{s)
Retraso
GUI
xu)
(1
Apéndice B
m)T
-
,
/ G(z, m)
Sr
YKz, m)
YU, m)
XU)
(b)
F ig u ra B-4
(a) Sistema con retraso ficticio de (1 - m)T segundos; fb) sistema con función de transferencia pulso
modificada con entrada X(z) y salida T(r. m).
A l observar que
2 [ g ( t - (1 - m ) T ) 8 T( t)) = ¿e[g(r - T
+ m T ) 8 T( t )]
= e - T’ X [ g ( t + m T ) 8 T( t )] se tiene
G * { s , m ) = e~TsX [ g ( t + m T ) 8 T(t)]
(B- 20 )
Yaques£[g(/ + m 7)8,(f)] es la transformada de Laplace del producto de dos funciones en el tiempo, con referencia a la ecuación (3-19) se puede obtener como sigue; 1
2[g(t + mT)8r(t)} =
J
o mTP
/■£+;*
^ G (p) {
, dp
(B-21)
L a integral en el lado derecho de la ecuación (B-21) se puede llevar a cabo en forma sim ilar a la discutida en la sección 3-3, es decir, la integral de convolución se puede obtener al integrar ya sea en el semiplano izquierdo o en el semiplano derecho. Se considera que el contorno de integración está a lo largo de un sem icírculo infinito en el semiplano izquierdo. Entones iduo de
e ,v ^ un polo de G(s) z-e
(B-22)
Por lo tanto, de las ecuaciones ( B - 19), (B-20) y (B-22), se obtiene la transformada z modificada de G(z ) como sigue: jn'i's,
G{z, m) =z 1X residuo de
-eL
Z un polode G(s)
(B-23)
Observe que la transformada z modificada G(z, m) y la transformada G(z) se pueden relacionar como sigue:
G (z ) = lim zG (z,m ) m— *0
www.FreeLibros.me
(B-24)
Sección B-4
Método de la transformada z modificada
693
Con referencia a la figura B-4(6), la salida f(z, m) se obtiene como sigue:
Y ( z , m ) = G(z ,m )X (z)
(B-25)
Com o en el caso de la transformada z, la transformada z m odificada Y(z, m) se puede expandir en una serie infinita en z_l, como sigue:
Y ( z , m ) = y 0( m ) z 1 + y , ( m )z 2 + y 2( m ) z 3 + • • •
(B-26)
A l m ultiplicar ambos lados de la ecuación (B-26) por z, se tiene
z Y { z , m ) = y 0( m ) + y , ( m ) z _I + y 2{ m ) z ~ 2 + ■••
(B-27)
donde y^m) representa el valor de y(t ) entre t = kTy t ~ (k + l)T (k = 0, 1,2, . . . ) o
y k( m ) = y ( ( k + m ) T )
(B-28)
Observe que si y(k) es continua entonces lim y k - i { m ) = lim y k( m )
(B-29)
L a parte izquierda de la ecuación (B-29) da los valores y(0-),y(T-),y(2T~),... , y el lado derecho da los valores y{Q+),y{T+),y(2T+),. . . Si la salida_y(A7) es continua, entoncesX ^ C -) =y(kT+).
Ejemplo B-3 Obtenga la transformada; modificada de G(s), donde
G(s) = w
1 í + a
Con referencia a la ecuación (B-23), se obtiene la transformada; modificada de G(s) como
G (z,m ) = z 1 residuo de • —— s p o lo d e s s +az - e lim j —* —o
(s + a)
1 emTs z s +az - e
Ejemplo B-4 Considere el sistema que se muestra en la figura B-5(a) y (b). Obtenga la salida > '(;, m) de cada sistema. Para el sistema que se muestra en la figura B-5(a). se obtiene
Y{z,m ) = 2 m[Y (s )] = G2(z, m )G i(z)X(z) Observe que
Y(z) = 2 '[ r ( í ) ] = G2(z )G t(z)X(z) Para el sistema que se muestra en la figura B-5(b), se tiene
Y ( z , m ) = Z „ { Y ( s ) } = G , G2( z , m ) X ( z )
www.FreeLibros.me
Teoría de la transformada z
694
y
X(s)
x-(si
«r
XU)
Apéndice B
F( í >
G ,(í )
6 , (si
6r
íj-
VTz, m)
(a)
5r
P(z, m)
(b)
Figu ra B-5
(a) Sistema con un muestreador entre G,(s) y G,(s); (b) sistema sin muestreador entre G¡(s) y G,(.s).
donde
G , G 2(z,/n)
= 2 ' m [ G , ( í ) G 2(5)]
Observe que
Y ( z ) = G , G 2( z ) X ( z ) Ejemplo B-5 Considere el sistema que se muestra en la figura B-6. Obtenga la transformada - modificada de Os). La salida C(z) está dada por
C (Z ) = 1 + G / / (z )/?(z) La transformada z modificada de C(z) está dada por
C(z,m) =
F ig u ra B-6
G(z,m) 1 + GH(z)
R(z)
Sistema de control de la/o cerrado.
www.FreeLibros.me
(B-30)
Sección B-4
Método déla transformada z modificada
695
Ejem plo B -6 Considere el sistema que se muestra en la figura B-7. El periodo de muestreo Tes de 1 segundo, o T= 1. Suponga que el sistema está sujeto a una entrada escalón unitario. Obtenga c,.(m) para m = 0.5 y k = 0. 1, 2 , . . . . 9. También, verifique que la ecuación (B-24) se conserva cierta. La transformada z modificada de G(s) se obtiene de la ecuación (B-23) como sigue:
G(z, m) = : 1 £ residuo de—_
, ~ en polo deG(s)
residuo de r + I residuo de
1
1 em'~ -- —--- =7 doble polo en s =0 s-(s+l) z-
e " ‘s -
7T -7 un simple polo 5= -1 j -( í +l ) z-e-
= z '( l - z ~ ’)
1 .. d : lim — (2 - l)ls^,ds
s2(s + 1) z - es
1 + lim s—»-1 ( í + 1} s2(s + 1) z - esj
= z “' ( l - z~l)
mz
- mz - z2 + 2z e~mz (z-1)2 + z - e~'
(m — l)z ~ ' + (2 - m ) z l-z * 1 =
-2
_ —m _ —1
e~mz ~ \ \ - z " 1) + l-e -'z -'
(m - 1 + e~m)z~' + (2.3679 - 1.3679m - 2< rm)z~2 + [-0.36 7 9 (2 - m ) + e~m]z~ 3 (1 - z - ') ( l - 0.3679z_1)
Con referencia a la ecuación (B-30) y al notar que R(z) =1/(1 - r _l), se tiene C (z ,m ) -
G (z ,m ) 1 1 + G (z ) 1 - z ' 1 (m - 1 + e~m)z~' + (2.3679 - 1.3679m - 2e^m) z “2 ________________ + (-0 .7 3 5 8 + 0.3679m + C ) z ~ ] 1 - 2z~‘ + 1.63 2 1 z'2 - 0 .6 3 2 1 z'3
Por lo tanto, para m = 5 se tiene C (z , 0.5) =
Figu ra B-7
0.1065z“ ‘ + 0.4709z“ 2 + 0.05468z"
1 - 2z
+ 1.6321z"
0.6321z-
Sistema de control de lazo cerrado.
www.FreeLibros.me
(B-31)
696
Teoría de la transformada z
Apéndice B
Con referencia a la ecuación (B-27), la ecuación (B-31) se puede expandir en una serie infinita en z 1como sigue:
C( z, 0.5) =
C o (0 .5 )z_1 + C i(0.5)z-2 + c2(0 .5 ) z '3 + ■••
o z C (z, 0.5) = co(0.5) + Ci(0.5)z -1 + c2(0.5)z -2 + ••• donde c¡.(0.5) = c((k + 0.5)7) = c(k + 0.5) y k = 0, 1 , 2 , . . . Los valores de ct(0.5) se pueden obtener fácilmente con una computadora digital. La solución por computadora para/: = 0, 1,2___ ,9 escomo sigue:
co(0.5) = c(0 .5 ) = 0.1065 Ci(0.5) = c(1 .5 ) = 0.6839 c2(0.5)
= c(2 .5 ) = 1.2487
c3(0.5)
= c(3 .5 ) = 1.4485
c„(0.5) = c(4.5) = 1.2913 c5(0.5)
= c(5.5) = 1.0078
c6(0.5)
= c(6 .5 ) = 0.8236
c7(0.5)
= c(7 .5 ) = 0.8187
c8(0.5)
= c(8 .5 ) = 0.9302
c9(0.5)
= c(9 .5 ) = 1.0447
Estos valores dan la respuesta de los puntos medios entre pares consecutivos de puntos de muestreo. Observe que al variar el valor de m entre 0 y 1 es posible encontrar la respuesta en cualquier punto entre dos puntos de muestreo consecutivos, como c( 1.2) y c(2.8). Finalmente, observe que
G(z) = Z [G (s )] = Z
r l - e~s
1
s
s(s + 1)
( r - 1 + e~T) z + (1 - e ’ r - Te~T)z-
(1 - z ~ ' ) (l - e~Tz~' ) 0.3679z 1 + 0.2642z~2 (1 - z “') ( l - 0.3679z ') lim z G ( z , m )
0.3679z"' + 0.2642z 2 (1 - z'')(l - 0.3679Z'1)
Por lo tanto,
G ( z ) = lim z G ( z , m ) m —* O
Es claro que la ecuación (B-24) se conserva cierta.
Resumen.
E l propósito principal de esta sección ha sido presentar el método de la transforma
da z m odificada para encontrar la respuesta en cualquier tiempo entre dos instantes de muestreo consecutivos. Se observa que la transformada z modificada se puede usar no sólo para este propósito, sino para tratar con esquemas de muestreo con múltiples frecuencias de muestreo.
www.FreeLibros.me
Apéndice B
Problemas de ejemplo y soluciones
697
PRO BLEM A S DE EJEM PLO Y SO LU C IO N ES Problema B -l Obtenga la transformada o de \/k\
Solución Z
k\ l + z ~' + h z ~2 + h z ~' + h z ~i + --=
exp(z ')
Problema B-2 Obtenga
Mr (Esta serie se parece a la de la transformadas de 1/k. pero la secuencia k comienza aquí con 1 en lugar de 0.)
Solución
Ya que
1
1 + z~l + z~2 +
1 -Z -”
\z\ >
1
al multiplicar ambos lados de esta última ecuación por s~2. se tiene -2
—/fe— 2_ k-o
1 -
Z
'
Al integrar esta última ecuación con respecto as. se tiene
dz
-o
~k - 1
= ln (l -
2 ') + constante
(B-32)
donde la constante en la ecuación (B-32) es cero, [Para verificar esto, sustituyas por =c en ambos lados de la ecuación (B-32).] Por lo tanto, la ecuación (B-32) se puede reescribir como sigue:
¿
/t=l
~ r
fC
= ln(1 -
¿ (j)z * = -ln(l
z~'),
-
Z '),
|z| > 1
\z\ > 1
Problema B-3 La primera diferencia hacia atrás entre x(k) y x(k - 1) se define como
Vx(k) = x( k) - x( k - 1)
www.FreeLibros.me
698
Teoría de la transformada z
Apéndice B
La segunda diferencia hacia atrás se define como v 2x (k ) = qftrOfc)] = v [x (k ) - x (k - i)]
= V.’x (k ) - Vx(k - 1) y la tercera diferencia hacia atrás se define como
P 3jc(/t) = V 2x (k ) - V 2x (k - 1) De forma similar, la w-ésima diferencia hacia atrás se define corno \ r X (k ) = Vm- 'x (k ) - Vm , x (k - 1)
Obtenga la transformada z de Vx(k), V 2x(k). V'' x(k). y V"’ x(k).
Solución
La transformada r de la primera diferencia hacia atrás se obtiene como sigue: Z [V x (k )} = Z [ x m
-
-
\)]
= X ( z ) - z - 'X ( z ) = (1 - z - ') X ( z )
(B-33)
Como V 2x (k ) = [x (k ) - x (k - 1)] - [x (* - 1) - x (k - 2)]
= x (k ) -
2x(k
- 1) + x (k - 2)
la transformada z de V 2x(k) es
Z [ F 2x (* )] = -? [* (* )] - 2 Z [ x ( k - 1)] + Z [ x ( k - 2)] = X ( z ) - 2 z - 'X ( z ) + z~2X ( z ) = (1 - z~l) 2X ( z )
(B-34)
En esta forma se obtiene z [ r x (k )\ = ( i - z - ' f x ( z )
Observe que ia operación de tomar la diferencia hacia atrás corresponde a multiplicar X ( : ) por (1 - r _l). Por lo tanto, para la m-ésima diferencia hacia atrás Vmx (k ) = Vm~ 'x (k ) -
Vm~ 'x {k - 1)
se tiene
Z i r ’x í* ) ] = (1 - z - ')mX ( z ) Problema B-4 La primera diferencia hacia adelante entre x(k + 1) y x(k) se define como A x (k ) = x (k + 1) - x (k )
La segunda diferencia hacia adelante se define como A 2x (k ) = A [A x (k )] = A {x (k + 1) - * (* )]
= A x (k + 1) - A x {k ) La tercera diferencia hacia adelante se define como A * x (k ) = A 2x {k + 1) - A 2x (k )
www.FreeLibros.me
(B-35)
Apéndice B
699
Problemas de ejemplo y soluciones
y la m-ésima diferencia hacia adelante está dada por A mx { k ) = A m~' x (k + 1) - A m- 'x { k )
Obtenga la transformada z deAx(k). A 2x(k). A ' x(k). y A'" x(k).
Solución
La transformada z de la primera diferencia hacia adelante está dada por Z [ A x ( k ) ] = Z [ x ( k + 1)] - 2 W * ) ]
= z X (z ) - ^ (0 ) - X (z ) = (z - l ) X ( z ) - zx(0)
(B-36)
Y a que A 2x ( k ) = [x (k + 2 ) - x (k + 1)] - [x(A:
= x (k +
2) -
+ 1) - x(fc)]
2x(k + 1) + x (k )
la transformada c de A 1x(k) es Z [ A 2x (k ) ] = x[x(A: + 2) - 2x(A: + 1) + x(A:)]
= z 2X ( z ) - z 2x ( 0) - z x (l) - 2[ z X ( z ) - zx(0)] + X ( z ) = (z - l ) 2X ( z ) - z(z - l)x (0 ) - zAx(O )
(B ‘37>
donde A.v(0) = x( I ) - x(0). La transformada z de A ' x(k) se convierte en Z [ A 2x (k ) ] = Z [ x ( k + 3) - 3x {k + 2) + 3x {k + 1) - x(A;)]
= (z - l)-’ A '(z) - z(z - l ) 2x(0) - z(z - l)A x (O ) - z A 2x(0) donde A.v(0) =.v( 1) -x(0) y A 2x(0) = .v(2)-2.v( 1) +x(0). De tonna similar, para la m-ésima diferencia hacia adelante A mx ( k ) = A m- 'x ( k + 1) - A m- ‘ x (k )
se tiene m- l Z [ A mx {k )\ = (z - i r X ( z ) - z 2 (z - í r - - A ' x ( O ) 1=0
(B-38)
Problema B-5 Resuelva la siguiente ecuación en diferencias: (k +
1)x (k + 1) -
x (k ) =
0
donde x(k) = 0 para k< 0 y x(0) = I . Observe que la ecuación en diferencias es de la clase variante en el tiempo. La solución de este tipo de ecuación en diferencia se puede obtener mediante el empleo de la transformada z. (Se debe tener cuidado ya que el enfoque de la trasformada z aplicada a la solución de ecuaciones en diferencia variantes en el tiempo puede no ser exitosa.)
Solución
Primero, observe que
yaque la ecuación en diferencias original se puede escribir como
k x (k ) - x (k - 1) = 0
www.FreeLibros.me
Teoría de la transformada z
700
Apéndice B
la transformada z de esta última ecuación se puede obtener como sigue:
- z £ x { z ) ~ z - 'X {z ) = O
O z 2£ z
X ( z ) + X (z ) = O
de donde se tiene
dX(z) = _d z X {z ) z2
O ln X (z ) = ^ + \nK donde K es una constante. Entonces X(z) se puede encontrar de
A'(z) = K expz-1 Como exp ; -i se puede expandir en la serie
expz-1 = 1 + z -1 + ^ z -2 + i z -3 + . .. t
|z| > o
se tiene
X (z ) = K ^ l + z -1 +
2-(- l 2-3 + .. .j
de la cual se encuentra que la transformada inversa z de X (z) es x (k ) = K-j~¡,
k = 0,1,2,...
Como x(0) está dada como 1, se tiene
x(0 ) = K = 1 De donde, se ha determinado la constante desconocida K. Por lo tanto, la solución para la ecuación en diferencias dada es x (k ) = j ¡ ,
k = 0, 1 , 2 , . . .
Problema B -6 Resuelva la siguiente ecuación en diferencias (k + l)x (k + 1 ) - k x (k ) = k + 1
donde x(k ) = 0 para k<
Solución
0.
Primero observe que al sustituir A = 0 en la ecuación en diferencias dada, se tiene
Ahora se define
x (l) = 1
y ( k ) = kx(k)
www.FreeLibros.me
/^£p&í7c/rc& & y .
r r e ó fe m a s e fe e (e m a fo v s o fu c é o n e s i i e o i o m o D D O D ) C l n p ) D ) DD)Dt)D))fc3
7 0
i
escnVir como y {k + 1 ) - y ( k ) = k + 1
z Y (z ) - zy (0 ) - Y (z) =
( 1 - z ' 1)2
1 - z~
Como y(0) = 0. se tiene
2
Y (z) =
+
(i - z
* (i - z ~ r
y
Con referencia al problema A-2-8. se tiene
Z"
= \ (k 2 - k )
LO - ¿ ‘ ‘) 3J Entonces, la transformada inversa z de >'(z) puede estar dada por
y(fc) = |(Jt 2 - k ) + k = i (*2 + k ) Entones. x(k) para k= 1, 2. 3. . . . se determina de k x (k ) = y ( k ) = \ (k 2 + k )
como sigue: x (k ) = í ( k + ' l ) ,
k =
1, 2 , 3 , . . .
Problema B-7 Considere el sistema que se muestra en la figura B- 8 . El periodo de muestreo es de 2 segundos, o T= 2. La entrada x(t) es una función delta de Kronecker 50(í); es decir.
1, O,
& (* ) =
k =O k *0
Obtenga la respuesta cada 0.5 segundos mediante el empleo del método de la transformadaz modificada.
Solución
Como la entradax(t) es una función delta de Kronecker. se tiene X (z ) = 1
La función de transferencia pulso modificada G (:. m) se obtiene como sigue. Con referencia a la ecuación (B-23). G(z, m) = z
1 residuo de
q ¿93 | ~ — r r un polos = -0.693 1
Al observar que T= 2. se obtiene G ( z ,m ) = z~
lim s—
(s + 0.6931)
-0.6931
- 11 .. 3 8«6 2) ^»m z. , (e—
z — e T1“ 2
x lr l^ X
1 XU)
1 s + 0.6931 z — €
4 z - 0.25 K(f)
s + 0.6931 Figura B-8 6(s)
www.FreeLibros.me
Sistema maestreado.
Apéndice B
Problemas de ejemplo y soluciones
701
Entonces la ecuación en diferencias se puede escribir como
y(k + 1) - y(k) - k + 1 Al tomar la transformada z de esta última ecuación, se tiene
zY(z) - zy{0 ) - Y(z) =
j
ComojcfO) = 0. se tiene
Y(z) =
(1 - z~')3
(1 - z“')2
Con referencia al problema A-2-8. se tiene Z~'
= \ i * 2 ~ k)
j i - z-y. Entonces, la transformada inversa r de >(-) puede estar dada por
y(k ) = ±(k2 - k) + k = \{k2 + k) Entones. x(k) para k = 1, 2. 3. . . . se determina de
kx(k) = y(k) = í( k 2 + k) como sigue:
x(k) = i(k + 1),
* = 1, 2 , 3 ,.
Problema B-7 Considere el sistema que se muestra en la figura B- 8. El periodo de muestreo es de 2 segundos, o T= 2. La entrada x{t) es una función delta de Kronecker 80(t): es decir.
k =0 k * 0
1,
0,
Obtenga la respuesta cada 0.5 segundos mediante el empleo del método de la transformada z modificada.
Solución
Como la entrada x(t) es una función delta de Kronecker, se tiene
X (z ) = 1 La función de transferencia pulso modificada G(z, m) se obtiene como sigue. Con referencia a la ecuación (B-23). G(z, m) —
e " " s:
~ —yrr un P 0'0 5 = _ 0.6931
residuo de
z-er
Al observar que T= 2. se obtiene
G(z,m) = z '{
lim
[ j — -—0O. .i6 9 3 1
. 1 (e-| ”
(s + 0 .6931)
1 s + 0.6931 z - e
rz
z - 0.25 1 XU)
K(f>
j + 0.6931 Figura B-8 G(s) YU. m)
www.FreeLibros.me
Sistema maestreado.
Teoría de la transformada z
702
Apéndice B
Por lo tanto, la salida Y(z, m) se puede obtener como sigue: Y (z ,m )
=
G (z ,m )X (z )
=
4
z - 0.25
Con referencia a la ecuación (B-27), se tiene
zY(z,m) = yo(m) + y x(m)z~' + y2(m)z~2 + • • • dondey;(m)= y((k + m )T )= y(2 k + 2m). En este p r o b l e m a m) se puede expandir en una serie infinita en Y 1como sigue:
zY(z,m)
4 "" 1 - 0 .25 z
= 4 m + 4 _m' 1z_1 + 4 ^m_2z~2 + 4 ” ”~3z“3 + Por lo tanto,
y„(m ) = 4~m
y,(m) = 4 -'”-' y2(m) = 4 — 2 y3(m) = 4 — 3 Para obtener la salida del sistema cada 0.5 segundos, se hace que m = 0, 0.25, 0.5 y 0.75. Para m = 0.25, se obtiene
y„(0 .25 ) = y(0 .5 )= 4 ~025 = 0.7071 y,(0 .25 ) = y(2 .5 )= 4 ~‘ 25 = 0.1768 y 2(0 .25 ) = y(4 ,5) = 4 ~225 = 0.04419 y3(0 .25 ) = y(6 .5 )= 4 325 = 0.01105
www.FreeLibros.me
Apéndice B
Problemas de ejemplo y soluciones
703
De forma similar, se pueden calcular los valores d e y k(m ) para m = 0, 0.5, y 0.75. Este resultado se muestra en la figura B-9 como una gráfica d ey*(w ) contra k.
Problema B-8 Obtenga C(r, m). la transformada; modificada de la salida, del sistema que se muestra en la figura B-10.
Solución
De la figura B-10 se tiene
E(s) = R(s) - C(s) M(s) = G,(s)£*(X C (s)
=
G 2( s )M * ( s )
Por lo tanto.
M*(s)
=
G
f ( i ) £ * ( * )
M (z) = G\(z)E(z) También,
E*(s) =
- C *(s) = R*(s ) - G 2* (s)A/*(.s)
E (z ) = R(z) - G 2( z ) M ( z ) Por lo tanto.
M (z) = G ,( z )[f l(z ) - G 2(z)A Í(z)] de laque se obtiene
m(z) = ^ M R ( z ) 1 + G , ( z ) G 2( z ) Como C(;, m) se puede dar como G,(;. m )M (:\ se tiene
www.FreeLibros.me
Apéndice C Diseño p o r ubicación de polos cuando la señ a l de control es un vecto r
C-1 IN TR O D U C C IÓ N
En el capítulo 6 se presentó la técnica de ubicación de polos y el diseño del observador del estado cuando la señal de control u(k) era un escalar. Sin embargo, si la señal de control es una cantidad vectorial (vector-r), se puede esperar una mejoría en la respuesta característica del sistema porque se tiene más libertad para elegir las señales de control w,(¿), u2(k) , . . . , ur(k). Por ejemplo, en el caso de un sistema de orden n con un control escalar, la respuesta de oscilaciones muertas (deadbeat) se puede alcanzar cuando más en n periodos de muestreo. En el caso del control vectorial u(£), la respuesta de oscilaciones muertas se puede alcanzar en menos de n periodos de muestreo. Se observa que con el control vectorial es posible escoger en forma libre más de n parámetros; es decir, además de ser capaz de ubicar n polos de lazo cerrado en forma adecuada, se tiene la libertad de satisfacer otros requerimientos, si existen, para el sistema en lazo cerrado. Sin embargo, en este caso del control vectorial, el cálculo de la matriz de retroalimentación del estado K se vuelve más compleja, como se verá en este apéndice. C-2 D ISC U SIÓ N PR ELIM IN A R
Considere el sistema x(k + 1 ) = G x (k ) + Hu(*)
donde x(k)
= vectorde estado (vector-n) en el instante de muestreok
u(k)
= vectordecontrol (vector-r) en el instante de muestreo k G = matriz de n
X
n
H = matriz de n
X
r
704
www.FreeLibros.me
(C-1)
Sección 2
705
Discusiones preliminares
Se supone que las magnitudes de los r componentes de u(£) están restringidos. Como en el caso del sistema con señal de control escalar, se puede probar que una condición necesaria y suficiente para ubicar polos en forma arbitraria para el sistema definido por la ecuación (C-l) es que el sistema sea completamente controlable. Se supone que el sistema definido por la ecuación (C-l) es completamente controlable. En el esquema de retroalimentación del estado, el vector de control u(A) se escoge como u (k ) = -Kx(Jfc)
(C-2 )
donde K es la matriz de ganancia de retroalimentación del estado, que es una matriz de r X n. Con la retroalimentación del estado el sistema se vuelve un sistema de lazo cerrado y su ecuación de estado se convierte \( k + 1 ) = (G - H K )x(í)
donde la matriz K se escoge para que los valores propios de G - HK sean los polos de lazo cerrado deseados ¡jt, , ¡uir Transformación de la ecuación de estado a la form a canónica controlable.
Considere
el sistema definido por \ { k + 1) = G \( k ) + H ,u ( * )
(C-3)
donde \(k) = vector de estado (vector-«) n(k) = señal de control (escalar)
G = matriz de n
X
H, = matriz de n
X
n
1
Suponga que el sistema es completamente controlable. Entonces la matriz de controlabilidad tiene inversa. Se define
[H ,: G H ,:
i G" 1H,]
donde los f, son los vectores renglón. Entonces se construye una matriz de transformación T , como sigue: f„
f„G
T, =
(C - 4 )
f„G" donde los f „
G *
son los vectores renglón {k
Ti"1G T , =
=
O,
1,
2
,
f„
f *
f „ G
f „ G
1).
G
f „ G
"
1
f „ G
”
1
www.FreeLibros.me
Entonces se puede mostrar que
706
Diseño por ubicación de poios cuando la señal de control es un vector
• •
0 0
1 0
0 1
0 ~a„
0
0
^n-l
@n-2
Apéndice C
0 0
(C-5 )
1 • -ai
T r’H, =
(C-6)
[Vea el problema C-l para obtener las ecuaciones (C-5 ) y (C-6).] Ahora se define x (k )
= T jX ÍA :)
entonces la ecuación (C-3 ) se convierte en x(k
1 0
• •
0 1
0 ' 0
x ,( k )
V
x2( k )
0
u(k)
+ 0
. *n(k + 1) .
0
0
an—1
an—2
1 - f li. . * „(k ) . 1
xn~i(k + 1)
_
0 0
iu(k)
3
xi(k + 1) x2(k + 1)
+ 1) = T r ' G T ^ / c ) + T r ' H
‘
(C-l)
0
1_
Por lo tanto, se tiene que la ecuación de estado, ecuación (C-3 ), se puede transformar en la forma canónica controlable mediante el empleo de la matriz de transformación T , definida por la ecuación (C-4 ). Pasos de diseño. A continuación se discutirá el procedimiento para determinar la matriz de ganancia de retroalimentación del estado K tal que los valores propios de G - H K estén en los valores deseados /i„ ¡J.2, ■. . , H„La ecuación de estado que se considera a continuación es la dada por la ecuación (C-l):
x(k +
Se supone que el rango de la matriz x(k
H
1) = G x ( £ ) + H u (Á :)
de n
+ 1) = G
X
r es r. Esta última ecuación es equivalente a
x(k)
+ [ H j ! H 2 i • ■■i H r]
n(k)
donde hu
[ H , : H 2 : • • •: H r] = H ,
H, =
h? , h ni_
www.FreeLibros.me
i = l,2,...,r
Sección C-3
Diseño por ubicación de polos
707
El procedimiento para diseñar la matriz de ganancia de retroalimentación del estado K involucra los siguientes pasos: Paso 1. Extienda el proceso de transformación [el proceso que transforma la ecuación de estado dada por la ecuación (C-3 ) en la ecuación de estado en la forma canónica controlable dada por la ecuación (C-7 )] al caso donde la matriz H es una matriz den X r. Es decir, la ecuación de estado dada se transforma en la forma canónica controlable mediante el empleo de la matriz de transforma ción T, cuya forma exacta se dará posteriormente. Se define x (k) = Tx(Jt)
la ecuación de estado original, ecuación (C-l), se puede transformar a x(k + 1 ) = ' r ’ GTx(fc) + T -‘Hu(A:) = G x (k ) + Hu(fc)
(C-8)
donde G = T_l GT está en la forma canónica controlable y H = T ' H. (Esta forma canónica contro lable es ligeramente diferente a la forma usual, como se verá más adelante.) Paso 2 . Mediante el uso de la matriz de ganancia de retroalimentación del estado K, el vector de control puede estar dado por
u (*) = —Kx(¿) = -KTx(A:) y la ecuación de estado del sistema se convierte en x(k + 1) = (G - HKT)x(/t)
La matriz K se escoge para que la matriz G - HKT tenga los valores propios deseados ¿u,,, ¡x2, . .., ÍV C-3 D ISEÑ O P O R U BICA CIÓ N DE P O LO S
Primero se discutirá la forma como se determina la matriz de transformación T para después deter minar la matriz de ganancia de retroalimentación del estado K. Considere el sistema completamente controlable definido por x(k + 1) = G x (k ) + Hu(Jfc)
(C-9 )
donde x(k) = vector de estado (vector-n)
u(&) = vector de control ( vector-/') G = matriz de n X n H = [H, : H2 : • • • : Hr] = matriz de n X r Se supone que el rango de la matriz H es r. Por lo tanto, los vectores componentes H„ H2, . . . , H, de la matriz H son linealmente independientes, ya que el sistema se supone de estado completamente controlable, el rango de la matriz de controlabilidad de n X nr [H.GHi
www.FreeLibros.me
.G" ’H]
708
Diseño por ubicación de polos cuando la señal de confrol es un vector
Apéndice C
es rt. La matriz de controlabilidad se puede escribir en una forma expandida como sigue: [h ,;h 2:
;H r:g
h
!.g
h
2;
;g
h
,:
:G n 1h ,;G n 1h 2 ; ;G n 1h ,]
Se seleccionan n vectores linealmente independientes de la matriz n X rtr. Se comienza con el lado izquierdo de la matriz. Ya que los primeros r vectores H¡, H2, .. ., H, son linealmente independien tes, se seleccionan estos r primeros vectores. Si es así, que tenemos que r = 1 son vectores linealmente independientes. Entonces se examina GH, para ver si es linealmente independiente de los r vectores escogidos. A continuación se examina GH2, GH3, . . . , GH,, . . . en el orden que se muestra en la matriz de controlabilidad expandida hasta que se encuentren n vectores linealmente independientes. (Ya que el rango de la matriz de controlabilidad es n, siempre hay n vectores linealmente indepen dientes.) Una vez que se seleccionan los n vectores linealmente independientes, se arreglan en la si guiente forma F
=
[ H ,
i G
H
, :
: G " '
1 H
, : H
2 : G
H
2 i
Gn* 1H2: :Hr : GH ,: i G" 1H,] El número n, se dice ser invariante de Kronecker y satisface la ecuación
(C-10)
ni + n2 + ■■• + nr = n
Se define el máximo de «„ n2, . . . , nr como «min: (C-ll)
rtmin = m a x (« !,« 2,
Se hará referencia a esta ecuación en la discusión de la respuesta de oscilaciones muertas. A conti nuación se calcula y se define el vector renglón 17, como donde F ~ '
f „
rj, = ni + n2 + ••• + n¡,
Entonces la matriz de transformación
T
i = 1 ,2 ,..., r
requerida se puede dar como
(C-12)
donde
S ,
f,
S ;
=
f G
Observe que la matriz de transformación dada por la ecuación (C- 12) es una extensión de la matriz de transformación dada por la ecuación (C-4 ). Para simplificar la presentación, ahora se considerará un caso simple donde n = 4 y r = 2 . (En este caso, sólo n¡ y n2están involucradas.) (La extensión a casos más generales es directa.) Entonces la matriz de transformación se convierte en una matriz de 4 X 4 . La matriz de transformación dada por la ecuación (C-12 ) se convierte en T
T
T
S
www.FreeLibros.me
Sección C-3
Diseño por ubicación de polos
709
donde
f, s ,
f2
=
,
s 2 =
_f1G">'1_
fzG"2-1
(observe que en el caso de n = 4 existen tres posibilidades para las combinaciones n¡ y n2: n ¡= 1, n 2 = 3; n ] = 2, n2 = 2; y n ] = 3, n2 = 1. Por ejemplo, si «, = 2 y w2 = 2, entonces las matrices G y H se
convierten, respectivamente, en 1
0 - flu 0
G = T ”1G T =
0 O 1 bl2
1H
O O
O
0
0 an
0
0
!
-014 1
~ a 22 | ~ a 2i
. —^21
H =T
|
«12 ¡
si n t = 2 , n 2 = 2
6 12 = f, G H 2 = O en este caso)
. (Nota:
H = T'H =
}
(C-14)
1
0 0 G = T~‘G T = -011 .-021
O
(C - 13)
“ 024.
véase el problema C-2). Como otro ejemplo, si w, = 3 y
O
si n, = 2 , n-, = 2
1 0 -012 -022
«2 = 1, entonces
0 1
0 0
-013
-014
—023
—024.
si «, = j , n 2 =
(C-15 )
O
«2 = 1 (Nota: ¿>,2 = f, G 2 H 2 puede o no ser cero)
o
si 17, = 3,
bn
o'“r
(C-16)
(vea el problema C-4). A continuación, se tratará el caso donde «, = 2 y n 2 = 2. (Otros casos se pueden manejar de forma similar. Por ejemplo, para el caso donde n¡ = 3 y n 2 = 1, véanse los proble ma C-3, C-4 y C-5.) Para este caso donde «, = 2 y n 2 = 2, la matriz G = T _l G T puede estar dada por la ecuación (C-13) y la ecuación característica es
- 1 0
z
Izl - G| =
flu
z
+ an
0 ao
0
0
z
«21
an
#23
+ an
f l24
-1
Z
Ü2¡
Z +
+ «24
«21
1
(z 2 +
z
-1 Z +
N
-1
z
tjn
a 14
022
013 z
«12 Z + « n ) ( z 2 + a 24 Z + « 23) ~ («22 z +
0
www.FreeLibros.me
014
-1 a 2i ) ( a i4z + « i3)
(C-17)
710
Diseño por ubicación de polos cuando la señal de control es un vector
Apéndice C
donde se ha utilizado la expansión de Laplace en menores. (Véase el apéndice A para los detalles.) De la ecuación (C-l 7 ) la ecuación característica [zl - G | = 0 se convierte en z2 + an z + a u I
¡zl - G| =
«14 2 + a ,3 ¡ z2 + a 24z + (¡2S
(¡22Z + «21
=
(C-l 8)
0
Los valores propios de G se pueden determinar al resolver la ecuación característica. A continuación, se determinará la matriz de ganancia de retroalimentación K para que los valores propios de G - HK sean fi¡, (jl2i . . . , jx„. Se define la matriz B de 2 X 2 tal que 1 0
B
bn
1
(Observe que b]2 es una constante que aparece en la matriz H .) En el caso particular donde «, = 2 y n2= 2 , el valor de bl2 es igual a 0 . Por lo tanto, B = I. Para casos más generales, la matriz B puede no ser la matriz identidad. También, se define la matriz A de 2
X 4
como
«11
«12
¿>i3 ¿14
«21
¿>£
«23
A=
(C-l 9 )
¿>24
Entonces se verá que la matriz K se puede dar por K = B A T'1 y el vector de control u(¿) puede estar dado por u(*) = - B A T _1x(A:) = -BAx(Jfc)
Por lo tanto, la ecuación del sistema dada por el ecuación (C-8) se convierte en x(* + 1) = Gx(Ar) - HBAx(fc) = (G - HBA)x(ít) Para el caso presente, la matriz H BA se convierte en: HBA =
'0 0' 1 0 0 0
-1
0 1
1
0 '
'« t i
«12
«13
«14
0
1
_& 2l
«22
«23
«24.
0
0
0
0
«11
«12
«13
«14
0
0
0
0
«22
«23
.« 2 1
«24.
Por lo tanto,
G - H BA =
-
«1.
0 «21
- -
-« 1 2
«12
—
«13
—
«22
—
«13
—
a i4
" "
«22
—
www.FreeLibros.me
«23
—
«14
—
«24.
1
0
0 «21
0
0
1
0 -« 1 1
~
«23
—
«24
Sección C-3
711
Diseño por ubicación de polos
Entonces, en referencia a la ecuación (C-18), la ecuación característica ¡zl - G + HBA| se convierte en z2 + (a 12 + fe)z + a „ + fe | (aj4_+ fe_)_2_ + _«n_+ fe_ Izl - G + HBAl = (¿22 + fe)z + «21 + fe I z2 + («24 ~+ 824)Z + «23 + 5,3 = [z2 + («12 + <5i2)z + «11 + fe][z2 + («24 + fe)z + «23 + ¿23] -
fe)z
[(« 1 4 +
+ Ü 13 + f e ] [ ( « 2 2 +
fe)z
+
«21 +
fe ]
= 0
(C-2 0 )
Se quiere que los valores propios de G - HBA sean f i„ p 2, p 3 y p 4, o la ecuación característica deseada sea (z - /u-i)(z - fi2)(z - /z3)(z - p,4) = z4 + « iz 3 + a 2z 2 + a3z + a4 = 0
(C-21)
Si se igualan los coeficientes de potencias iguales de las dos ecuaciones características, las ecuaciones (C-20 ) y (C-2 1 ), se obtienen las ecuaciones siguientes: «12 + f e + Ü24 + f e = ai «11
(«11
+
+
S il
+
( < J l2
fe )(« 2 4
+
+
fe )(« 2 4
f e )
+
+
(« 1 2
—
(« 1 3
(« 11
f e )
+
+
«23
+
f e
fe )(a 2 3
+
f e )
f e ) (« 2 2
+
f e
)
-
(« 14
+
—
(« 2 1
+
fe )(« 2 2
5 2l) ( « 1 4
+
+
f e )
f e )
=
d 2
=
a 3
+ 5n)(a23 + f e ) - (« 13 + fe )(a 2i + 52i) = a 4
Observe que hay ocho variables 8 y cuatro ecuaciones. Por lo tanto, los valores S„, fe , S]3, S14, fe, b22, 823, y S24 no pueden ser determinados en forma única. Existen muchos conjuntos posibles de valores para fe, fe, . . . , fe y por lo tanto, la matriz A no es única. Cualquier matriz A cuyos elementos satisfaganlas cuatro ecuaciones anteriores es aceptable. Una vez que la matriz A se selecciona, la matriz de ganancia de retroalimentación del estado K está dada por K = BAT1
y el vector de control de retroalimentación del estado es u(/fc) = — B A T -1x(k)
y la ecuación de estado dada por la ecuación (C-9 ) se convierte en x(k + 1) = Gx(/t) - H B A T
x(yt) = (G - H B A T -1)x(A:)
Para continuar, observe que |G - H B A T _1|= |T-1||G - H B A T -1||T| = |T_1G T - T _1HBA| = |G - HBA|
Para un conjunto de valores propios deseados p.,, pi2, . . . , jx„, se tiene los coeficientes corres pondientes a„ a 2, . . . , a„ en la ecuación característica \zl - G + HBA| = 0 . Para un valor dado de a„ a 2, . . . , a„ es posible escoger la matriz A que no es única. (Esto significa que se tiene cierta libertad para satisfacer otros requerimientos, si existen.) www.FreeLibros.me
712
Diseño por ubicación de polos cuando la señal de control es un vector
Apéndice C
Si se desea una respuesta de oscilaciones muertas, se requiere que /i¡ = ¡x2 = ju, = ¡j.a = 0 . La ecuación característica deseada dada por la ecuación (C-21 ) se convierte en 0 Observe que se escoge, por ejemplo, A =
-fln *
—«12
-Ol4
—«13
*
-«24
í* 2 3
(C-2 2 )
donde los elementos indicados por el asterisco son constantes arbitrarias, entonces G - H BA se convierte en
G - H BA =
0
1 0
0
0
0
0
0
0
0
1
* * * * 0
0
0
donde los elementos indicados por el asterisco doble son constantes arbitrarias.
(G - H B A )2 =
(G - H B A )3
(G - H B A )4 =
0
0
0
0
0
0
0
0
**
0
0
0
0
**
0
0
0
0
0
0
0
0
o ' 0
0
**
0
0
0
0
0
0
"o
0
0
o '
0
0
0
0
0
0
0
0
0
0
0
0
De esta manera, se obtiene la respuesta de oscilaciones muertas. La matriz A dada por la ecuación (C-2 2 ) no es única porque diferentes selecciones de elementos producirán la respuesta de oscilacio nes muertas. Por lo tanto, existe más de una matriz de ganancia de retroalimentación del estado K que produce la respuesta de oscilaciones muertas. Esto era de esperarse, ya que hay dos señales de control m,(£) y u2(k) disponibles, en lugar de una sola señal de control. Es importante señalar que si se selecciona a au
ü\2
fli3
fli4
^21
@22
í*23
~í>24
entonces 0 0 G - HBA = 0 0
1 0 0 0
0 0 0 0
www.FreeLibros.me
0 0 1 0
(C-23)
Sección C-3
Diseño por ubicación de polos
71 3
y
(G - HBA)2 = 0
Por lo tanto (G - H BA)* se hace cero para k = 2 , 3 , 4 , . . . La respuesta de oscilaciones muertas se alcanza en dos periodos de muestreo. De hecho, en general, al escoger los elementos de A en la manera dada por la ecuación (C-2 3 ), la respuesta de oscilaciones muertas se puede alcanzar en «min pasos en lugar de n pasos, donde n min = m a x ( n ,,n 2). . . , n T)
Ya que n¡+ n2+ • • • + nr = n, se observa que «m¡„ siempre es menor que n. Extensión al caso más general. Se ha dado una discusión detallada para el caso donde n = 4 (n¡ = n2 - 2 ) y r = 2 . La extensión de la discusión anterior al caso más general es directa. Por ejemplo, considere el caso cuando n = 6 y r = 3 . Para este caso, « i + n2 + «3 = 6
y se tienen varias combinaciones de «„ n2 y «3. Ahora considere el caso donde n, = 3 , n2 = 2 , y n2 = cada para este caso es
La matriz de controlabilidad F modifi-
F = [Hj | GH, :G2H ,:H 2: GH2 i H3]
Se define n, = X ***
5
«2 = 2
f3 J }«3 = 1 donde un renglón de asteriscos denota un vector renglón. Entonces la matriz de transformación T se puede formar como sigue: -i T = donde fi fi'G S2 = f2G f,G 2 Entonces las matrices G y H tendrán las formas siguientes: S, =
G =
S3 = f3
0
1
0
0
0
0
0
0
1
0
0
0
-«II
-«12
-«13
— «14
-«15
— «16
0
0
0
0
1
0
— «21
— «22
-«23
— «24
— ^25
— «26
. — «31
— «32
“ «33
-«34
«35
www.FreeLibros.me
— «36.
Diseño por ubicación de polos cuando la señal de control es un vector
714
0 0 0 0 1 bn 0 0 0 _ _ _1_ _ X
Apéndice C
0 0 bn
0 bn
1
.
donde bn = f^G2H2, bn = f, G2 H3, y ¿>23 = f2GH3. Estos valores pueden o no ser cero. (Observe que en la matriz G los menores principales están en la forma canónica controlable.) La matriz de ganan cia de retroalimentación del estado K está dada como sigue: K = BAT"1 donde ’l B= 0 0
bn bn
1 0
-1
1
5 12 5 22
«1 3
«14
«1 5
«16
¿21
«23
«24
«25
«26
X.
S32
«33
«34
«35
«36
A=
Observe que
HB
bn
'o
0
0
0
0
0
1
¿>12
bn
0
0
0
0
1
bn
0
0
1
' "l 0 0
bn
bn
1
«23
0
1
-1 =
'o
0
o'
0
0
0
1
0
0
0
0
0
0
1
0
0
0
1
El efecto de postmultiplicar la matriz B por H es eliminar a bj} del producto de matrices H B. Observe que si u(i) es un vector-r la forma general de la matriz B es
B
1 bn 0 1 0 0 0
0
■•
bn
• •
«2r
• •
«3r
(C-2 4 )
1
donde las constantes bv son aquellas que aparecen en la matriz H d e / t X r . (Los elementos de H B son 0 o 1.) Ejemplo C-1
Considere el sistema x(k + 1) = G x( k) + Hu(&)
www.FreeLibros.me
Sección C-3
715
Diseño por ubicación de polos
donde x(k) = vector de estado (vector-3) u(k) = vector de control (vector-2 )
y
0 1 H= 0 0 1 0
0 0
1 0 0 1 , - 0.25 0 0.5
Se desea determinar la matriz de ganancia de retroallmentación del estado K para que la respuesta al estado inicial x(0) sea de oscilaciones muertas. Observe que con la retroalimentación del estado u(k) = - K x(k), la ecuación del sistema se convierte en
x(k + 1) = (G - HK)x(Jfc)
(C-2 5 )
Primero se examinará la matriz de controlabilidad:
[H:G H :G 2H] = [H, i H 2i GH, i G H 2i G 2H,:G 2H 2] 0 ¡ 0 ¡ '1 l"!1 f o "! 0 10 ! !0 ! ! l 1 0 .2 5 ! 1 ¡ - l 2j
1 0.5 0.25
L°J
0 - 0 .2 5 -0 .1 2 5
Es claro que, el rango de esta matriz de controlabilidad es 3. Por lo tanto, la ubicación arbitraria de los polos es posible. Ahora se escogen tres vectores linealmente independientes comenzando desde el lado izquierdo. Estos vectores se muestran encerrados entre líneas punteadas. (Los tres vectores linealmente independientes se escogen como H,, H 2, y G H ,.) Ahora se reacomodan estos tres vectores de acuerdo a la ecuación
(C-10) y
se define la matriz F como sigue:
F = [H,:GH,;H 2] Se observa que n, = 2 y n2 = 1. Al rescribir la matriz F, se tiene
0 0 1 0 F= 0 1 1 0.5 0 La matriz inversa de F es
0 - 0.5 1 0 1 F“' = 0 1 0 0 Ahora se define el vector renglón los vectores
f,
y
f 2
17, de F -1 como f , , donde tj, =
n¡ y
t )2
=
n¡ + n2. Ya que n, = 2 y n2 = 1,
son el segundo y tercer vectores renglón, respectivamente. Es decir,
f, = [0
1 0]
f2 = [l
0
0]
Ahora, se define la matriz de transformación T como
donde
S, -
,
www.FreeLibros.me
S, - f,
71 6
Diseño por ubicación de polos cuando la señal de control es un vector
Apéndice C
Por lo tanto,
0 1 0 0 0 1 1 0 0
-1
0 0 1 1 0 0 0 1 0
=
y
0 1 0 T' = 0 0 1 1 0 0 Con esta matriz de transformación
T, se define x (k ) =
Entonces
Tx (k)
G T ‘GT = G
0 0 1
1 0 0
0" 0 1 0 0 - 0.25
0 0
1 1 0 0.5 ¡ - 0.25
T ” o“ También,
r 'H =
1
0
0 1 0
0 1 0
0.5
0 0 1
1 0 0
0“
h
0 1 0 0 0 1 1 0 0
0 1 0 0 = 1 0
0 0 1 0 0 1
Ahora, se determina la matriz de ganancia de retroalimentación de estado
K, donde
K = BAT 1 De la ecuación (C-24), la matriz B para este caso es una matriz de 2 X 2. Al observar que bl2 = 0, se tiene
B= Para este caso,
A es una matriz de 2 X
1 *12" 0 1
-1
’l 0' 0 1
3:
8,1 812 8,3" 82, 822 823 G0 = 0 1
Ahora se determina la matriz
-
=
HBA: 0 0 1 0 1 0 0.5 - 0.25 — 1 0 0 1 0 1 0 0
0 1 0 0.5 1 0
0 - 0.25 0
’
0 0 0 6,1 5,2 6,3 821 822 823
0 1 0 8,3 0.5 - 8,2 - 0.25 -8 „ 1 - 83, ?23 -822 www.FreeLibros.me
5
8,2
8
822 823
8l3
Sección C-3
Diseño por ubicación de polos
717
La ecuación característica |zl - G + H BA| = 0 está dada como sigue:
-1
z 5u
Izl - G + H BA| =
0
z — 0.5 + S 12 0.25 +
1 + S21
5 22
5)3
z + 523
o Como se desea la respuesta de oscilaciones muertas, la ecuación característica deseada es
z3 = 0 Observe que la selección de las 5 no es única y la matriz A no es única. Suponga que se escogen las 5 tal que S „ = 0,
Si 2 = 0.5,
«21
S 22
=
1>
Su = -0.25
= 0,
5 23
0
=
Entonces
Izl - G + H B A =
z
-1
0
0
z
0
0
0
z
z3 =
0
y por lo tanto 0
0.5
-0.25
1 0
0
es aceptable. Entonces la matriz K se obtiene como sigue: K = BAT
1=
1 0 0 1 -0.25
0
0
0.5
1 0 0
-0.25
0
0 1 0 0 0 1 1 0 0
0.5
1 0
Con la selección de la matriz K , ( G - H BA)* = 0 para k > «min, donde nm¡„ = max (n ,,n 2) = max ( 2 , 1) =
G - HBA
0 1 0 0 0 0 0 0 0
(G - H B A )2 =
0 0 0 0 0 0 0 0 0
De hecho.
2
Por lo tanto. (G - H B A )* = 0, Observe que
G - H B A = T 'G T - T
HBA = T
k = 2 ,3 ,4 ,..,
GT - T
HKT = T
(G - H K )T
Con referencia a la ecuación (C-25) y su solución x(k) = (G - H K )* x(0), se tiene que x(k) = 0 para k = 2 , 3, 4,. . ., ya que
www.FreeLibros.me
Diseño por ubicación de polos cuando la señal de control es un vector
71 8
Apéndice C
G - H K = T(G - HBA)T' (G - HK)2 = T(G - HBA)T
T(G - HBA)T
‘ = T(G -
HBA)2T ‘ = 0
y x(k) = (G - HK)*x(0) = 0,
k = 2,3,4...
Por lo tanto, se ha diseñado la matriz de ganancia de retroalimentación del estado K para que la respuesta del sistema al estado inicial x(0) sea de oscilaciones muertas. El estado \(k) se puede transferir al origen a lo máximo en dos periodos de muestreo. [Observe que si la señal de control u(k) fueraunescalar entonces se podrían tomar a lo más tres periodos de muestreo, en lugar de los dos periodos de muestre para la respuesta de oscilaciones muertas.]
P R O B LEM A S DE EJEM PLO Y SO LU C IO N ES Problema C-l Considere el sistema dado por
x(k + 1) = G x (át) + Hi u(k) donde x(k) = vector de estado (vector-n) u(k) = señal de control (escalar)
G = matriz de n
X
n
H, = matriz den
X
1
Suponga que el sistema es de estado completamente controlable. Se define
[Hi • GH, : • • • G" -1 Hi]_1 =
donde f¡ (i =
1,2,. . . , n)
son vectores renglón. También se define
-1
1n
f„G
T, =
f„G"-’ Muestre que 0
1
0
•
0
0
0
1
•
0
0
0
0
•
1
- 0 /1 - 2
•
-O í
T f 1G T , =
(C -26) —a„
www.FreeLibros.me
Apéndice C
Problemas de ejemplo y soluciones
719
T r 'H i =
(C-2 7 )
donde a¡ son los coeficientes que aparecen en el polinomio característico de G, o |zl - G| = z" + a,z"~l + •••+ a„-iz + a„ Solución Se probarán las ecuaciones (C-26 ) y (C-27 ) para el caso donde n = 3 . (Las extensión para un número entero positivo arbitrario n es directa.) Por lo tanto, se obtendrá que 0 1 0 ‘ T r'G T , = 0 0 1 (C-2 8 ) @2 d\
Ya que u t3G
T r1 =
f3G 2
es posible rescribir la ecuación (C-28 ) como sigue: Tr'G =
0 0 -a ,
1 0 1 0 -a2 -ai
f3 f3G f3G 2
(C-2 9 )
Ahora considere la transpuesta conjugada del lado derecho de la ecuación (C-29 ). Al observar que para sistemas físicos los coeficientes a,, a2, .. ., a„ del polinomio característico son reales, se tiene 0 0 -a3 [R :G*f* :(G*)2f3] 1 0 -a2 = [G*f* :(G*)2f*i—a3f* - «2G*f$ - a,(G*)2f5] 0 1 -a,
Observe que G' satisface su propia ecuación característica: 4>(G*) = (G*)3 + a,(G*)2 + a2G* + a3I = 0
Por lo tanto, -[a3I + a2G* + a,(G*)2]f? = (G*)3f?
En consecuencia, [ R : G * f s ; ( G * ) 2R
0
0
-a3
1
0
—a2 = [G*f*:(G*)2f*!(G*)3f5] = G*[f* ■G*f* i (G*)2f5]
0
1 -a,
Al tomar la transpuesta conjugada de ambos lados de esta última ecuación, se obtiene 0 0 1 0 1 0 -a3 -a2 -ai
t3 tiG
=
fjG2
www.FreeLibros.me
ti tiG G = Tr'G tiG 2
720
Diseño por ubicación de polos cuando la señal de control es un vector
Apéndice C
la cual es la ecuación (C-29). Por lo tanto, se ha mostrado que la ecuación (C-28) es cierta, o
0 1 0 0 - a 3 -a 2
GT, =
0 1
A continuación se mostrará que
1 7 ' H, =
0 0 1
Ya que
[Hi: G H i: G2Hi se obtiene
[H i: G H i: G2Hi
f,H, fi GH, f, g 2h , 1 0 0 0 1 0 = f2H, fiGH, f2G2H, 0 0 1 f3H, f3GH, f3G2H, f3Hi = 0 ,
f3GHi = 0 ,
f3G2H, = 1
Al emplear estas ecuaciones, se obtiene
f3H, f3 f3G H, = f3GH, f3G2H, f,G2
0 = 0 1
Observe que la extensión de lo presentado aquí al caso de un número positivo arbitrario n se puede hacer fácilmente.
Problema C-2 Considere el sistema \ (k +
1) = Gx(&) + Hu(A:)
donde x(k) = vector de estado (vector -4) u(k) = vector de control (vector-2)
y
1 0 0 -1 1 0 1 -2 0 1 -1 2 0 1 1 0
www.FreeLibros.me
Apéndice C
Problemas de ejemplo y soluciones
721
Con referencia a la ecuación (C-10), se obtiene la matriz F. Entonces, al emplear la matriz de transforma ción T definida por la ecuación (C -l2), se determinan las matrices G = T _1 G T y H = r ' H. Por último, obtenga la ecuación (C -l4). Solución Primero se escribirá la matriz de controlabilidad como sigue:
--- 1
[h , ; h 2 : g h , : g h 2; g 2h , : g 2h 2: g 3h , : g 3h 2] “1---1 1---F I---- 1 2 0 -5 2 ¡11 10 | 1-11 0 ¡ 3 2 11 4 1 !!í °i Io 10 ■0 | 1 0! j 2| 3 0 -6 4 1 ll 111 1 ll 0 lo 1 1 2 1 Li---1 1__l 1___1 1__1 Ahora se escogen cuatro vectores linealmente independientes de esta matriz de 4 X 8, comenzando desde el extremo izquierdo. (Estos vectores se muestran encerrados por líneas punteadas.) Los cuatro vectores linealmente independientes son H h H,. G H , y G H ,. A continuación se arreglan estos cuatro vectores de acuerdo con la ecuación (C-10) y se define la matriz F como sigue:
F = [H,; GH,: H2: GH2] (Observe que en este caso n¡ = 2 2 y n2 = 2.) Por lo tanto,
1 -1 0 1 F= 0 0 0 1
0 0 0 1
0 0 2 1
La inversa de esta matriz está dada por
1 1 0 1 F"1 = 0 -1 0 0
0 0
0 0 0.5 1 0.5 0
Como en este caso «, = 2 y n2 = 2, el segundo vector renglón de F^1 se define como f, y el cuarto vector renglón como f2. Entonces
f, = [0 1 0
0]
f2 = [0 0 0.5 0 ] La matriz de transformación T está dada por
S,
T=
s2
donde
S, = Por lo tanto,
f, ti G T= Í2
f2G
-1
f. f, G
1 0 1 -2 0 0 0 0.5
S-, =
0 1 0.5
- 0.5
www.FreeLibros.me
-1
Í2 Vg
2 1 0
1 -2 0 0 0 2 - 0.5 0 1
0 0 0 1
Diseño por ubicación de polos cuando la señal de control es un vector
Con esta matriz de transformación
Apéndice
0 1 1 -2 G = T 'G T = 0 0 0 0.5 0 -1 0
0 1
0 0 0.5 0 - 0.5 1 1
0 2 0 0 1.5 -1
-3
1.5
0 1 1 -2 H = T"'H = 0 0 0 0.5
-1 1 0 1 -2 1 0 1 -1 1 0 0
0 0 2 1
2 1 0
1 -2 0 0 0 0 0 2 0 - 0.5 0 1 1
0 2 1 0 0 1
0 1 0 0 0 0 0.5 0 0 0 - 0.5 1 0 1
0 1 0 0
0 0 0 1
Observe que, cuando n ¡= n 2 = 2, la matriz G tiene la forma dada por la ecuación (C-13) y la matriz tiene la forma dada por la ecuación (C-14), o bien
G=
C
T se obtiene
0 1 l 0 0 -flll -«12 ¡~«13 -«14 0 1 0 i 0 —«21 -a-a j - a 23 ~«24
0 1 H= o~ 0
H
0 fe,2 0 1
(Observe que, en este caso, b n es cero.) Finalmente, se obtendrá la ecuación (C-14). Observe que mi
F F=
f, [H, GH, H2 GH2]
m2
f2 m,H, m, GH, m, H2 m, GH2 f,H, f, GH, f,H2 f,GH2 m2H, m2GH, m2H2 m2GH2 f2H, f2GH, f2H2 f2GH2 1 0 0 0
0
0 0 1 0 0 0 1 0 0 0 1
fi f,G h = t _1h = [H, f2 Í2G
BS
donde m, y m2son el primero y tercer vector renglón de F ', respectivamente. Como F 1F es una matriz identidad, se tiene que f, H, = 0, f, H2= 0, f, GH, = 1, f, GH2= 0, f2H, = 0, f2H2= 0, f2GH, = 0, y f2 GH2= 1. Por lo tanto, tenemos
"1
72 2
0 0 f,H2 f.GH, f,GH2 1 0 = h 2] = f2H, f2H 2 0 0 f2GH, f2G H 2 0 1
que es la ecuación (C-14).
www.FreeLibros.me
Sección C-3
Diseño por ubicación de polos
72 3
Problema C-3 Considere el sistema definido por la ecuación (C-8):
x(k + 1) = T _ 1G Tx(tt) + T
Hu (k) = Gx(k) + Hu(k)
donde la matriz de transformación T está definida por la ecuación (C-12). Suponga que la matriz dada por la ecuación (C-15) y la matriz H está dada por la ecuación (C-16). Es decir.
0 0 0 1 0 0 1 0 «12 -«13 —«14 -«11 —«21 -«22 —«23 —«24
G|
G - HBA =
1 0
está
0 0 0 0 H= 1 b,2 0 1
«23 Z2 + «22 Z + «21
0 0
G
Z
+ «24
0
0 1
0
—«11 —Su —«12 —¿12 —«13 — §13 ~«14 —¿14 —«21 —¿21 —«22 —¿22 —«23 — ¿23 ~ «24 _ §24
donde
¿12 0 1 1
-1
A = '¿n ¿12 ¿13 ¿14 ¿21 ¿22 ¿23 ¿24
También muestre que si se escoge, por ejemplo,
-«11 *
«12
«13
*
*
—«14 -«24
(C-30 )
donde los elementos mostrados con asterisco son constantes arbitrarias, el sistema presentará una respuesta de oscilaciones muertas para cualquier estado inicial x(0); es decir,
(G - HBA)* = 0 ,
k = 4 , 5 , 6 ,..,
También muestre que si se escoge
A=
“«11 -«21
—«12 —«22
«13 «14 —«23 —«24
Entonces
(G - HBA)* = 0 para k > nmmdonde
nm¡„ = max(«i,n2) = max (3 , 1) = 3
Solución
Para el caso donde la matriz
|zl
G
está dada por la ecuación (C-15). se tiene
0 z —1 0 0 0 z -1 «14 «11 «12 Z + «13 Z + «24 «21 «22 «23
www.FreeLibros.me
(C-31)
Diseño por ubicación de polos cuando la señal de control es un vector
72 4
Apéndice C
A l expandir este determinante empleando la fórmula de expansión de Laplace, se obtiene z -1 z - 1 - 1 0 z + «13 «14 \zl - G| = 0 z z + «24 «23 «11 «12 «2 3 Z + «24 +
z
- 1
«21
«22
- 1
Z
~f
0 «13
«14
= (z + a24)(z3 + a,3z2 + a ,2z + a,,) -
«
14(023 z 2
+
a 22z
+
«
21 )
Por lo tanto, el determinante |rl - G j se puede escribir como: zl
- G
z 3 + a¡3 z2 + a S2z a23z 2 + a22z +
=
|
«ii
+
(C-32)
z
«21
mego se calcula
0 0
1
bn
1
b ,2
0
1
0
1
—1 §12
§14 05
§13
05
§11 05
HBA =
0 0
§23
0
0
0
0
0
0
0
' 5 ,,
§12
§13
§14
0
0
0
0 0
1
0
§2,
§22
§23
§24
S il
§12
§1.3
§14
0
1
6 2 ,
§22
§23
§24
(Observe que el efecto de postmultiplicar la matriz H por la matriz B es eliminar b,2 del producto H B.) Por lo tanto
HBA
«11 «2 1
«12
5n —
§2 1
— «22
-
§12
-an
613
«1 4
§ |4
§22
-«2 3
S 23
— «24
§24
Si se escoge A como la de la ecuación (C-30), entonces
G
- HBA
0 1 0 0 0 0 1 0 0 0 0 0 * * * 0
donde los elementos mostrados con asterisco son constantes arbitrarias. Observe que
(G
- HBA)2
(G - HBA)3
0 0 1 0 0 0 0 0 0 0 * * 0 0 0 0
0 0 (G - H BA)4 = 0 0
0 0 0 0
0 0 0 0 0 0 0 0 0 0 * 0 0 0 0 0
0 0 0 0 0 0 0 0
www.FreeLibros.me
Apéndice C
7 25
Problemas de ejemplo y soluciones
Por lo tanto,
x(k) = (G - HK)*x(0 ) = T(G - HBA)*T_1 x(0 ) = 0 ,
k > 4
Se ha visto que la respuesta de oscilaciones muertas se alcanza al escoger A como la dada por la ecuación (C-30). Sin embargo, si se escoge A como la de la ecuación (C-31), entonces la respuesta de oscilaciones muertas se puede alcanzar en a lo más tres periodos de muestreo, porque los asteriscos que aparecen en ( G - H B A )5se convierten en cero y
x(Jfc) = T(G - HBA)*T ' x(0 ) = 0 ,
k > nmi„ = 3
Problema C-4 Considere el sistema siguiente:
x(k + 1) = Gx(Jt) + Hu(fc) donde x(k) = vector de estado (vector-4)
u(£) = vector de control (vector-2 )
G=
-1 1 1 -2 0 1 1 0
0 1 -1 0
0 0 2 1
H = [H,: H2
A l emplear el control por retroal¡mentación del estado cerrado en los siguientes puntos:
u(A) = -K x(k),
Zi = 0.5 + j0 .5 ,
z2= 0.5 - / 0.5
z3 = -0.2,
z4= -0.8
Determine la matriz de ganancia de retroalimentación del estado matrices G y H dadas, obtenga la ecuación (C-16).
Solución
se desea ubicar los polos de lazo
K requerida.
Entonces, mediante las
Primero se examinará la matriz de controlabilidad:
[H : G H : G2H i G3H] = [H, i H2i GH, i GH2: G2H, i G2H 2: G 3H, i G3H2] i 0¡ ! ! ! ! l! 101
1 o¡ ! l!
0¡ 1 01
1 ¡ -1 -2 1 1 3 ¡ 0 1i 1
2 11 - 5 i- 3 ! 1 81 - 3 -22 11 3 15 -6 1-3 í 0 -1 2 í 21
(C-33 )
El rango de esta matriz de controlabilidad es 4. Por lo tanto, la ubicación arbitraria de polos es posible. Se escogen cuatro vectores linealmente independientes comenzando desde el extremo izquierdo. (Estos vectores se muestran encerrados en líneas punteadas.) Los cuatro vectores linealmente independientes se escogen como Hh H2, GH, y G2H,. Ahora estos cuatro vectores se rearreglan de acuerdo con la ecuación (C-10) y la matriz F se define como sigue:
F = [H ,: G H ,: G2H ,: H2] Se observa que, en este caso. n l : 3 y n2= 1. Al rescribir la matriz
0
F=
1 ¡ - 3 1
-2
__8
o' T
-3"
1_
1
F, se tiene
1
2
www.FreeLibros.me
Ib el D a
Diseño por ubicación de polos cuando la señal de control es un vector
726 Luego, se calcula
F~'. Con referencia al apéndice A,
se tiene
= A 1 + A-1 B(D - C A 1B) 1CA 1 - ( D - C A 'B) 'CA-1 0 0 0 1
_4
- 1
5 1 3 1 3 2 3
2 3 1 3 1 3
Apéndice C
A ‘B(D - CA ‘B) 1 (D - CA ‘B)-‘
2
__i 3 __1 3
_2
3
(E l mismo resultado se puede obtener fácilmente con M A T LA B .) Como n, = 3 y n2 = 1, se escoge el tercer vector como f, y el cuarto como f2. (Observe que el vector renglón se define como 17,, donde t), = + n2 + • • ■+ n„ como fr) Es decir, fi =
[0 | 1 - il
*2 = [ 1
La matriz de transformación
1 |
T se define como T=
donde
S, =
fr f,G f,G2
S2 = [f2J
Por lo tanto,
_ -1 _1 T= 2 _1 i 2 1 _2 1 0
0
0
Con esta matriz de transformación
1 3
1 3
0
3
-1 1 1 1 1
1 3 1 3
3
3
3
3
3
3
0
0
3
3 1 3
0
0
0
1
0
T, si se define x(k) = Tx(k)
entonces
0 1 0 0 0 3 2 0
G = T GT =
0 ¡ 0 1 i 0 ~2 1 1 0 ¡-1
(C-34)
También 3
J
H = T 'H
- 1
i 3 O
1 3
O
0 U
1
«l t
—f n
O
1 .
2 3
1 3
-
2 3.
0
1 0 1
1
0
0
0 1
0
0
0
0 0
1
Ahora se determina la matriz de ganancia de retroalimentación del estado
K = BAT 1 www.FreeLibros.me
(C-35)
0
K, donde
Apéndice C
727
Problemas de ejemplo y soluciones
Con referencia a la ecuación (C-24) y al notar que. en este caso, bn = 0, la matriz B es una matriz de 2 X
2 dada por
-1
B = ’l bi2 0
’l o" 0 1
1
(C -3 6 )
Para este caso, A es una matriz de 2 X 4:
A=
S il
«12
§13
8]4
821
822
«23
«24
Por lo tanto
G -
HBA =
0
1
0
0
0
1
3 -
-6 1 1 2 — 821
8,2
-2
-« 2 2
-
0 0 813'
-« 2 3
1 ~ «14
" — 1 — «24
Con referencia a la ecuación (C-32), se tiene
|z l - G +
HBA|
z3 +
«i3)z2 +
(2 + «23
Z2
+ «22
Z
( —3 +
«i2)z
+ ( — 2 + 821 )
+ Su
| ¡ Z
— 1 + S|4 +
1
=
0
+ S 24
Esta ecuación característica debe ser igual a la ecuación característica deseada, que es
(z - 0.5 -/'0 .5 ) ( z - 0.5 + ;'0.5)(z + 0 .2 )(z + 0.8) = z 4 - 0 .3 4 z 2 + 0.34z + 0.08 = 0 SI se igualan los coeficientes de potencias iguales de z de las dos ecuaciones características, se tendrán cuatro ecuaciones para determinar las ocho 8. Por lo tanto, la matriz A no es única. Suponga que se escogen en forma arbitraria 814 — 0 ,
S 22 — 0 ,
823 — o ,
«24 = - 1
Entonces
|z l - G +
HBA| = z4 +
S,3)z3 +
(2 +
(-3 +
S,2)z2 + 8„z
- 2 +
Al igualar la ecuación característica con la ecuación característica deseada, se tiene
8„ = 0.34 8,2 = 2.66 «13
= —2
82, = 2.08 Por lo tanto,
A=
0.34 2.08
2.66
0
-2
0
Entonces la matriz K se obtiene como sigue:
K = BAT 1 =
0 -1
-2 .1 0 6 7 0.02667
0.7800 0.3600
Con esta matriz K, el control por retroalimentación del estado
u(k ) = -Kx(tfc)
www.FreeLibros.me
0.1067 -0.02667
S2,
= 0
728
Diseño por ubicación de polos cuando la señal de control es un vector
colocará los polos de lazo cerrado en z, =0.5 +JO .5, z2 = 0.5 - y'0.5, z3 la matriz K no es única: existen muchas posibles matrices para K. Por último, se obtiene la ecuación (C-16). Observe que
Apéndice C
-0.2 y z4= -0.8. Se observa que
m, F ‘F =
m2 f, f2
[H,
G 2H ,
GH,
m, G 2H, m2G 2H, f , G 2H, f 2G 2H,
m, G H , m 2G H , f,G H , f 2G H ,
m, H,
m 2H, f,H , f 2H,
H2
m, H 2 m 2H 2 f,H 2 f 2H 2
1 0 0 0
0 0 0 1 0 0 0 1 0 0 0 1
donde m, y m , son el primero y segundo vectores renglón de F _l. respectivamente. Corno F~' F es la matriz identidad, f, H, = 0, f, H 2 = 0, f, G H , = 0. f, G 2 H, = 1, f, H, = 0 y f, H, = 1. De la ecuación (C33) se observa que G H , es linealmente dependiente de H,_ H,, y G H ,. Por lo tanto, f, G H , = af¡ H H, + yf, G H , = 0, donde a, (i, y y son constantes. Observe que f, G : H, puede o no ser cero. En consecuencia.
H = T " 'H =
f, f¡ G [H , f,G 2
H 2] =
f2 donde
f.H ,
f,H 2
f, G H , f , G 2H, f2H,
f, g h 2 f, G 2H 2 f2H 2
0 0 1 0
0 0 bn 1
¿l2 = f, G 2 H 2. Esta última ecuación es la ecuación (C -l 6).
Problema C-5 Con referencia al problema C-4. considere el mismo sistema. Suponga que se desea una respuesta de oscilaciones muertas para un estado inicial arbitrario x(0). Determine la matriz de ganancia de retroalimentación del estado K. Solución
Con referencia a las ecuaciones (C-34g (C-35), y (C-36), se tiene
G =
0 1 0 | 0 0 0 1! 0 0 3 -2_|_ 1 ’ i ~o“~' 0 ¡ : : 1 1 1 o" 1 bn 0 1 0 1
H =
0 0 0 0 1 0 o"" T
-
donde b,2 es cero. Para la respuesta de oscilaciones muertas, se escoge A como sigue: A =
-an
-«12
~ a 21
—«22
-«13 —«23
—«14 —«24
0 3 2 0
donde a se definen como en la ecuación (C-15). Entonces
G - HBA y se encuentra ( G - H B A ) ‘ = 0,
0
1 0
0
0
0 1 0
0 0 0 0 0 0 0 0 * = 3,4,5,
www.FreeLibros.me
-2 0
1 -1
Apéndice C
Problemas de ejemplo y soluciones
72 9
La respuesta de oscilaciones muertas se alcanza en a lo más tres periodos de muestreo. [Observe que en este problema n¡ = 3 y n2 = 1. Por lo tanto, nml„ = max («,, n-2) =3.] La matriz de ganancia de retroalimentación del estado K se obtiene como sigue:
K = BAT 1 "l
0 1 -1
o" "o 1 2
_
3
-2
0
0
3 1
0
i
3
r
-i
0 0 0 1
1
_ 31
1 _1
3
3 1 3 1 3 3 1 _2 3 3
0 3 2 _1 3
2 3
_i
3
0
Con esta matriz K , el control por retroalimentación del estado
u(k) = -Kx(k) colocará los polos de lazo cerrado en el origen y, por lo tanto, producirá la respuesta de oscilaciones muertas para cualquier estado inicial x(0 ).
www.FreeLibros.me
Bibliografía
A - l . Antoniou, A ., D ig ita l F ilte r s : A n a ly s is a n d D e s ig n . N ueva York: M cG raw -H ill Bo o k Company, 1979. A-2. Aseltine, J. A ., Transform M e th o d in L in e a r System A n a lys is . N u e v a Y o rk : M cG ra w - H ill Boo k Company, 1958. A-3. Ástrom, K . J. y B . Wittenmark, C o m p u te r C o n tro lle d System s: T h e o ry a n d D e sig n . Englewood Cliffs, N . J.: Prentice Hall, Inc., 1984. B - l.
Bellm an, R., In tro d u ctio n to M a trix A n a ly s is . N u eva York: M c G ra w - H ill Boo k Company, 1960.
B-2.
B ris to l, E. H., “ D e sig n a n d P ro g ra m m in g C o n tro l A lg o rith m s f o r D D C Systems, ” C o n tro l En g in e e rin g , 24, E n e ro de 1977, pp. 24-26.
B-2.
Butm an, S, y R. S iv a n (Sussm an), “ O n C an ce llatio n s, C o n tro lla b ility a n d O b servab ility, ” I E E E Trans. A u to m a tic C ontrol, AC-9 (1964), pp. 317-18.
C - l.
Cadzow, J. A . y H. R. Martens, D iscrete-Tim e a n d C o m p u te r C o n tro l System s. Englewood C liffs, N . J.: Prentice Hall, Inc., 1970.
C-2. Chan, S. W., G . C. Goodw in y K . S. Sin, “ Convergence Properties o f the Riccati Difference Equation in Optimal Filtering o f Nonstabilizable Systems,” I E E E Trans. A u to m a tic C o n tro l, AC -29 (1984), pp. 110-18. C-3. Churchill, R. V. y J. W . Brow n, C om p lex V ariables a n d A p p lic a tio n s , 4a. ed., N u eva York: M cG ra w - H ill Bo o k Company, 1984. D - l.
Dorato, P. y A . H. Levis “ Optimal Linear Regulators: The Discrete-Time Case,” I E E E Trans. A u to m a tic C o n tro l, AC-16 ( 19 7 1), pp. 613-20.
E - l.
Evans, W. R., “ Control System Synthesis by Root Locus Method,” A 1 E E Trans. P a r í II . 69 (1950), pp. 66-69.
730
www.FreeLibros.me
Bibliografía
F - l.
731
Falb , P. L. y M . Athans, “ A direct C onstructive P ro o f o f the C riterio n for C om plete C ontrollability o f Time-lnvariant Linear Systems,” I E E E Trans. A u to m a tic C o n tro l. A C -9 (1964), pp. 189-90.
F-2.
Fortmann, T. E., “ A M atrix Inversión Identity,” I E E E Trans. A u to m atic C o n tro l, AC-15 (1970), p. 599.
F-3.
Franklin, G. F., J. D. Pow ell y M . L. Workman, D ig ita l C o n tro l o f D y n a m ic System s, 2nd ed., Reading, Mass.: Addison-Wesley Publishing Co., Inc., 1990.
F-4.
Freeman, H., D iscrete-Tim e System s. N ueva York: John W ile y & Sons, Inc., 1965.
G - l. Gantmacher, F. R., T h e o ry o f M a tric e s, Vols. 1 and II. N u eva York: Chelsea Publishing Co., Inc., 1959. G-2. Gopinath, B., “ On the Control o f Linear M últiple Input-Output Systems,” D e ll Syst. Tech. J., 50 (1 9 7 1 ), pp. 1063-81. H - l.
Hahn, W ., T h e o ry a n d A p p lic a tio n o f L ia p u n o v s’ D ire c t M eth o d . Englew ood C liffs, N . J.: Prentice H all, Inc., 1963.
H-2. Halmos, P. R., F in it e D im e n s io n a l Vector Sp ace s. Princeton, N . J.: D. Van Nostrand Company, 1958. 1-1.
Ichikawa, K., Theo ry f o r D e sig n o f C o n tro l System s (in Japanese). Tokyo: Gijutsu-Shoin, 1989.
J- l.
Jerry, A. J., “ The Shannon Sampling Theorem — Its Various Extensions and Applications: A Tutorial R eview ,” Pro c. I E E E , 65 (1977), pp. 1565-95.
J-2.
Jury, E. I., “ Hidden Oscillations in Sampled-Data Control Systems,” A I E E Trans. P a r t I I , 75 (1956), pp. 391-95.
J-3. J-4.
Jury, E. I., S a m p le d - D a ta C o n tro l System s. N ueva York: John W ile y & Sons, Inc., 1958. Jury, E . I., “ Sam pling Schemesin Sampled-Data Control Systems,” I R E Trans. A u to m a tic C o n tro l, A C -6 (1961), pp. 88-90.
J-5.
Jury, E. I., T h e o ry a n d A p p lic a tio n s o f the z Transform M eth od . N u eva York: John W ile y & Sons, Inc., 1964.
J- 6 .
Jury, E . I., “ A General r-Transform Formula for Sampled-Data Systems,” I E E E Trans. A u to m atic C o n tro l, AC-12 (1967), pp. 606-8.
J-7.
Jury, E. I., “ Sampled-Data Systems, Revisited: Reflections, Recollections, and Reassessments,” A S M E J . D y n a m ic System s. M easu rem en t , a n d C o n tro l, 102 (1980), pp. 208-16.
J- 8 .
Jury, E. I. y J. Blanchard, “ A Stability Test for Linear Discrete-Time Systems in Table Form s,” Proc. IR E , 49 (1961), pp. 1947-48.
K - l.
Kailath, T., L in e a r System s, Englewood C liffs, N . J.: Prentice H all, Inc., 1980.
K-2. Kailath, T., y P. Frost, “ A n Innovations Approach to Least-Squares Estimation, Part II: Linear Smoothing in A dditive W hite N oise,” I E E E Trans. A u to m a tic C o n tr o l AC-13 (1968), pp. 655-60. K-3. Kalman, R. E., “ On the General Theory o f Control Systems,” Proc. F irst Intern. Cong. IF A C, Moscow, 1960. A u to m atic a n d R em ó te C o n tro l. Londres: Butterworth & Co., Ltd., 1961, pp. 481-92. K-4. Kalm an, R. E . 1 J. E. Bertram, “ Control System Analysis and Design via the Second Method o f Liap unov: I. Continuous-Time System s; II. Discrete-Tim e System s,” A S M E J . B a s ic En g in e e rin g , ser. D, 82 (1960), pp. 371-93, 394-400.
www.FreeLibros.me
732
Bibliografía
K-5. Kalm an, R. E., Y. C. Ho y K . S „ Narendra, “ Controllability o f Linear Dynam ical System s,” C o n trib u tio m to D iffe re n tia l E q u a tio n s, 1 (1963), pp. 189-213.
K- 6 . Kanai, K . y N . Hori, In tro d u ctio n to D íg ita ! C o n tro l System s (in Japanese), Tokyo: M aki Shoten, 1992. K-7. Katz, R , D ig it a l C o n tro l U sin g M icro p ro ce sso rs. Londres: Prentice H all International, Inc., 1981. K - 8 . Kreindler, E. y P. E. Sarachik, “ On the Concepts o f Controllability and O bservability o f Linear Systems,” I E E E Trans. A u to m atic C ontrol, A C - 9 (1964), pp. 129-36. K-9. K u o B . C , D ig it a l C o n tro l System s. N ueva York: Holt, Rinehart and Winston, Inc., 1980. L - l . La S alle , J. P. y S. Lefschetz, S ta b ility by L ia p u n o v ’s D ire c t M e th o d w ith A p p lic a tio n s , N ueva York: Academ ic Press, Inc., 1961. L-2.
Lee, E. B . y L. Markus, F o u n d a tio n s o f O p tim a l C o n tro l Theory. N u eva York: John W ile y & Sons-, Inc., 1967.
L-3.
Leondes, C. T. y M . N ovak, “ Reduced-Order Observers for Linear Discrete-Time System s,” I E E E Trans. A u to m a tic C o n tro l , AC-19 (1974), pp. 42-46.
L-4.
L i, Y. T., J. L. M e iry y R. E. Curry, “ On the Ideal Sam pler Approxim ation,” I E E E Trans. A u to m a tic C o n tro l, AC-17 (1972), pp. 167-68.
L-5.
Luenberger, D. G., “ Observingthe State o f a Linear Systems,” I E E E Trans. M ilita r y Ele ctro n ics, M I L -8 (1964), pp. 74-80.
L- 6 . Luenberger, D. G „ “ A n Introduction to Observers,” I E E E Trans. A u to m a tic C o n tro l, AC-16 (1971), pp. 596-602. M - 1. M elsa, J. L. y D. G. Schultz, L in e a r C o n tro l System s. N ueva York: M cG raw -H ill Boo k Company, 1969. M-2. Middleton, R. H. y G. C. Goodw in, D ig it a l C o n tro l a n d E stim a tio n — A U n ifle d A p p ro a c h . Englew ood C liffs, N . J.: Prentice Hall, Inc., 1990. M-3. M itra, S. K . y R. J. Sherwood, “ Canonic Realizations, o f Digital Filters Using the Continued Fraction Expansión,” I E E E Trans. A u d io a n d E le c lro a c o u stic s, N A U -2 0 (1972), pp. 185-94. M-4. M itra , S. K . y R . J. Sh erw o od , “ D ig ita l La d d e r N e tw o rk s ,” I E E E
T ran s. A u d io a n d
E le c lro a c o u s tic s , AU-21 (1973), pp. 30-36.
N - l. Neuman, C. P. y C. S. Baradello, “ Digital Transfer Functions for M icrocom puter C ontrol,” I E E E Trans. System s, M an , a n d C ybern etics, S M C - 9 (1979), pp. 856-60.
N-2. N oble, B . y J. Daniel, A p p lie d L in e a r A lg e b ra , 2nd ed. Englewood C liffs, N . J.: Prentice Hall, Inc., 1977. O -l. Ogata, K., S ta te S p a c e A n a ly s is o f C o n tro l System s, Englewood C liffs, N . J.: Prentice Hall. Inc. 1967. 0-2. Ogata, K ., M o d e rn C o n tro l En gineer'm g , 2nd ed. Englewood Cliffs, N . J.: Prentice H all, Inc., 1990. 0-3. Ogata, K.., System s D yn a m ic s, 2a. ed., Englewood C liffs, N . J.: Prentice H all, Inc., 1992. 0-4. Ogata, K ., S o lv in g C o n tro l E n g in e e rin g Pro b le m s w ith M A T L A B . Englewood C liffs, N . J.: Prentice H all, Inc., 1994.
www.FreeLibros.me
Bibliografía
733
0-5. Ogata, K., D e s ig n in g L in e a r C o n tro l System s w ith M A T L A B . Englewood Cliffs, N . J.: Prentice H all, Inc., 1994. P- 1.
Pappas, T., A . J. Laub y N . R. Sandell. Jr., ” 0 n the Num érica! Solution o f the Discrete-Time Algébrale R iccati Equation,” I E E E Trans. A u to m atic C o n tro l , AC-25 (1980), pp. 631-41.
P-2.
Payne, H. J. y L. M . Silverm an, “ On the Discrete Tim e Algebraic Riccati Equation,” I E E E
P-3.
Phillips, C. L. y H. T. Nagle, Jr., D ig it a l C o n tro l System s A n a ly s is a n d D esig n , Englewood
Trans. A u to m atic C o n tro l , AC-18 (1973), pp. 226-34.
C liffs, N . J.: Prentice Hall, Inc., 1984. R - 1. Ragazzini, J. R. y G. F. Franklin, Sa m p le d - D a ta C o n tro l System s. N u eva York: M c G ra w - H ill Boo k Company, 1958. R-2.
Ragazzini, J. R. y L. A . Zadeh, ‘‘The Analysis o f Sampled-Data Systems,” A l E E Trans. P a r t II
71 (1952), pp. 225-34.
S - l . Strang, G., L in e a r A lg e b r a a n d Its A p p lica tio n s . N ueva York: Academ ic Press, Inc., 1976. T-l.
Tou, J. T., D ig it a l a n d S a m p le d - D a ta C o n tro l System s. N u eva York: M c G ra w - H ill B o o k Company, 1959.
T-2.
Turnbull, H. W . y A . C. Aitken, A n In tro d u ctio n to the T heo ry o f C a n o n ic a l M a tric e s . L o n dres: B la c k ie and Son, Ltd., 1932.
V-l.
Van Dooren, P., “ A Generalized Eigenvalue Approach for Solving R iccati Equations,” S I A M J . S c ie n tijic a n d S ta tis tic a l C o m p u tin g , 2 (1981), pp. 121-35.
W - l . W illem s, J. C. y S. K . Mitter, “ Controllability, Observabiiity, Pole A llocatio n , and State Reconstruction,” I E E E Trans, A u to m atic C o n tro l , AC-16 (1971), pp. 582-95. W-2. W olovich, W . A., L in e a r M u ltiv a ria b le System s. N ueva York: Springer-Verlag, 1974. W-3. Wonham , W . M ., “ On Pole Assignment in Multi-lnput Controllable Linear Systems,” I E E E Trans. A u to m a tic C o n tro l, AC-12 (1967), pp. 660-65.
Z - l . Zadeh, L. A . y C. A. Desoer, L in e a r System Theo ry: The State S p a c e A p p ro ach . N u eva York: M cG ra w - H ill Boo k Company, 1963.
www.FreeLibros.me
índice
C A cción de control PID: controlador analógico, 115 A lcanzabilidad, 474-475 A n álisis de estabilidad de Liapunov, 321-336 de sistem as en tiem po continuo, 329-332 de sistem as en tiem po discreto, 332-334 primer m étodo de, 321 segundo m étodo de, 3 21-322 A nálisis de estabilidad: de sistem as lineales e invariantes en el tiem po, 328 m ediante el uso de la transformación bilineal y el criterio de estabilidad de Routh, 191-192 Angulo: de la asíntota, 2 07-208 de llegada, 209 de salida, 209
B B loque de Jordán, 383, 651 -652
c 2 d ,628 C ancelación de polos y ceros, 211, 469-481 Cero, 39-40 Circuito del muestreador y retenedor, 13-14 operación en el m odo de retención del, 1314 operación en el modo de seguim iento del, 13-14 Circuitos de retención de datos, 77 Circuitos de retención de orden superior, 19, 82 Circuitos de retención, 17-18 C odificación, 6, 8 Codificador, 7 Com pensación: de adelanto de fase, 233 de atraso de fase, 233 de atraso-adelanto de fase, 233 Com pensador de adelanto de fase, 2 34, 237 Com pensador de adelanto, 262, 272-273 Com pensador de atraso de fase, 234 Com pensador de atraso, 224, 273-274 735
www.FreeLibros.me
736
Indice
Com pensador de atraso-adelanto de fase, 233 Conjunto ortogonal, 648 Constante de error estático de posición, 199 Constante de error estático, 198-201 Constante del error estático de aceleración, 198-201 Constante del error estático de velocidad, 199 C ontracción, 334 -3 3 5, 367-368 Control óptim o cuadrático: de sistem as de seguim iento, 596-609 en estado estacionario, 587-596 Control PID digital: algoritm o de posición, 116 algoritm o de velocidad, 117 Controlabilidad, 377, 379 de la salida com pleta, 3 8 5 -3 8 6 de la salida, 387 del estado com pleto, 38 0 -3 8 4 , 387, 393, 4 06 en el plano z, 384 matriz de, 380, 401, 707-708 Controlador analógico, 21 Controlador digital, 20 realización de un, 122 Controlador PD, 234 Controlador PI, 234 Controlador PID digital, 114-118 Controlador PID, 1 1 7 -1 1 8 ,1 2 1 ,2 3 3 -2 3 4 algoritm o de posición, 116 algoritm o de velocidad, 117, 157, 159-160 analógico, 156-159 digital, 156-159 Conversión analógica a digital, 14 Convertidor A /D , 15 de tipo contador, 15 del tipo de aproxim aciones sucesivas, 15 Convertidor analógico a digital, 7 Convertidor D/A: m ediante resistores ponderados, 16, 18 m ediante un circuito en escalera R-2R, 17-18 Convertidor digital a analógico, 7, 16
Covector, 572 Criterio de estabilidad de Routh: transformación bilineal acoplada con el, 191-192, 258-259 Criterio de Sylvester: para definición negativa, 662 para definición positiva, 661-662, 679 para sem idefinición negativa, 663 para sem idefinición positiva, 662 Cuantificación, 1, 7 error de, 9 nivel de, 8-9 proceso de, 4 ruido de, 9, 11, 126 Cuantificador, 9, 10
D D ecodificación, 6 D ecodificador, 7 D efinición negativa: de una función escalar, 661 D efinición positiva: de una función escalar, 660-661 D em ultiplexor, 13 D ependencia lineal de vectores, 643 D esigualdad de Schwarz, 645-646 Determinante, 633-635 propiedades de un, 634-635 Diagrama de bloques: de un sistem a de control en tiem po continuo en el espacio de estados, 296 de un sistem a de control en tiem po discreto en el espacio de estados, 296 Diagrama de Bode, 232-233 D iferencia hacia adelante, 322 w -ésim a, 699 primera, 698-699 segunda, 698 tercera, 698 D iferencia hacia atrás: w -ésim a, 698
www.FreeLibros.me
Indice
73 7
primera, 697 segunda, 698 tercera, 698 D iferenciación com pleja, 681-682 Diferenciación: en el plano z, 165 D iofanto, 518 D iscretización, 6, 394 de la ecuación en el espacio de estados en tiem po continuo, 3 14 Diseño: basado en el enfoque de las ecuaciones polinom iales, 51 7-540 basado en el m étodo analítico, 242-257 basado en el m étodo de respuesta en frecuencia, 225-242 basado en el m étodo del lugar geom étrico de las raíces, 204-225 basado en la ubicación de polos con retroalim entación del estado observado, 4 2 1 -4 6 0 basado en la ubicación de polos, 402-421 D oblam iento, 96 en frecuencia, 96 error de, 97 D om inio de atracción, 325
E Ecuación de error del observador, 428, 443, 4 4 5 ,4 5 0 Ecuación de estado lineal en tiem po discreto: solución del caso invariante en el tiem po, 3 0 2 -3 0 9 solución del caso variante en el tiem po, 3 0 9 -3 1 0 Ecuación de estado: enfoque de la transformada z para la solución de la, para el caso en tiem po discreto, 3 0 4 -3 0 7 equivalente m ediante el retenedor de orden cero de la, en tiem po continuo, 315-317
solución de la, para el caso en tiem po continuo, 312 solución de la, para el caso lineal e invariante en tiem po discreto, 302-309 solución de la, para el caso lineal y variante en tiem po discreto, 309-310 Ecuación de Riccati, 573-574 en estado estacionario, 588-589, 600-621 Ecuación Diofantina, 518, 520-521, 523-525, 5 2 9 ,5 3 3 ,5 3 5 , 547, 551, 555, 559 solución a la, 520-521 Ecuación indeterminada, 623 Energía de control mínima, 622 Energía de control, 622 Enfoque de ecuaciones polinom iales: al diseño de sistem as de control, 525-532 al diseño de sistem as de regulación, 523-525 Entrada delta de Kronecker, 43, 103 Error de actuación en estado estacionario, 198-200 Error de actuación, 200 Error de ganancia de un convertidor A /D , 16-17 Error de linealidad de un convertidor A /D , 16-17 Error de redondeo, 9 Error en estado estacionario, 196-197, 200-201 Errores en convertidores A/D: error de ganancia, 16-17 error de linealidad, 16-17 error de nivel, 16-17 Espacio de estados, 294 Espectro de frecuencia: de com ponentes com plem entarías. 92 de un filtro paso bajas ideal, 92-93 de una com ponente primaria, 92 de una señal muestreada, 91 -92 Estabilidad absoluta, 193 Estabilidad asintótica uniform e, 365 a lo grande, 364-365
www.FreeLibros.me
7 38
Indice
Estabilidad asintótica, 325 a lo grande, 325 Estabilidad B IBO , 326 Estabilidad de entrada-acotada salida-acotada, 326 Estabilidad relativa, 193, 1 9 5 ,2 2 0 Estabilidad uniform e, 324 Estabilidad, 324 teorem a de Liapunov sobre, 327 Estado de equilibrio aislado, 324 Estado de equilibrio, 324 Estado, 294 Estimador de estados, 422 Evaluación en el sem iplano derecho de la,
86-88 E xpansión en series de Laurent, 141, 687, 689
F Filter, 6 03-604 Filtro de prom ediado m óvil, 136 Filtro de respuesta al im pulso finita, 135-137 Filtro de respuesta al im pulso infinita, 135 Filtro digital, 122 program ación directa de un, 123-124, 133 program ación en escalera de un, 128-135 program ación en paralelo de un, 127-128 program ación en serie de un, 126-127 program ación estándar de un, 124-125, 133-134 realización en paralelo de un, 163-165 realización en serie de un, 163-165 realización m ediante un diagrama de bloque de un, 122 Filtro ideal: características de magnitud de un, 92 respuesta al im pulso unitario de un, 93-94 Filtro no recursivo, 136-138 Filtro paso bajas ideal, 92-93 Filtro recursivo, 135, 137
Forma bilineal: com pleja, 660 real, 660 Forma canónica controlable, 297 -2 9 8 , 300, 3 9 6 ,3 9 8 , 489 Forma canónica de Jordán, 300, 302, 382, 390, 399-400, 651-652, 657, 659, 674 Forma canónica diagonal, 2 9 9 -300, 399, 489 Forma canónica observable, 298-300, 398-399, 489 Forma cuadrática, 659-660 com pleja, 660 real, 659 Forma hermitiana, 660 Formas canónicas: controlable, 297-298, 300, 396, 398, 489 de Jordán, 300, 302, 382, 390, 3 9 9 -400, 6 51-652, 657, 659, 674 diagonal, 299-300, 399, 489 observable, 298-300, 398 -3 9 9 , 489 Format: corto, 318 extendido, 318 Fórmula de Ackermann: para el diseño de observadores de orden m ínim o, 450, 454 para el diseño de observadores, 4 3 5 -4 3 8 , 4 4 0 ,4 4 5 , 496 para la ubicación de p olos, 4 0 8 -4 1 2 , 4 66, 493 Franja primaria, 175 Franjas com plem entarias, 175 Frecuencia de cruce de ganancia, 274 Frecuencia de N yquist, 96 Función de transferencia de fase no m ínim a, 233 Función de transferencia pulso senoidal, 227-228 Función de transferencia pulso, 98, 102, 104-118 de controladores digitales, 111-118 de elem entos en cascada, 108-110
www.FreeLibros.me
Indice
739
de un sistem a en lazo cerrado, 110-111 matriz de, 3 10-312 Función delta de Kronecker, 42, 62 Función escalar: definición negativa de una, 322 definición positiva de una, 322 indefinición de una, 322 sem id efin ición negativa de una, 322 sem id efin ición positiva de una, 322 Función rampa unitaria, 26
Integral de inversión: para la transform adaz, 689 Invariancia: de la ecuación característica, 312 propiedad de, 401 Invariante de Kronecker, 708 Inversa de zI-G : cálculo de la, 304-309 Inversa m ínim a por la derecha, 665 Inversa m ínim a por la izquierda, 666
G
J
Ganancia derivativa, 116 Ganancia integral, 116 G anancia proporcional, 116 Generador de la función escalera, 78
Jacobiano, 641
K
Kalman, R. E„ 377
Im pulsos unitarios: tren de, 75 Indefinidad: de una función escalar, 661 Independencia lineal de vectores, 643 Indice de desem peño cuadrático, 568 con térm inos cruzados, 582 índice de desem peño, 566 incluyendo térm inos cruzados, 582 valor m ínim o del, 575 Inestabilidad escondida, 334 Inestabilidad, 325, 3 27-328 Integración com pleja, 682-683 lntegrador digital: bilineal, 172 con retardo, 171-172 sin retardo, 171 Integral de con volución , 84-85 evaluación en el sem iplano derecho de la,
86-88 evaluación en el sem iplano izquierdo de la, 84-86
L Ley asociativa, 638 Ley de control cuadrático en estado estacionario: enfoque de Liapunov a la, 591-594 Ley de control óptimo: cuadrático, 568-596 de energía mínima, 622-625 Liapunov: función de, 322-323, 334, 591 m étodo directo de, 322 primer método de, 321 segundo m étodo de, 321-322 Lugar geom étrico de las raíces, 206 Lugares geom étricos de atenuación constante, 176-177 Lugares geom étricos de frecuencia constante, 176-178 Lugares geom étricos de las raíces: asíntotas del, 207-208 reglas generales para la construcción del, 207-210
www.FreeLibros.me
740
Indice
Lugares geom étricos de relación de am ortiguam iento constante, 178-180
M M apeo conform e, 180 M apeo: del plano s al plano z, 299 del plano z al plano w, 299 entre el plano s y el plano z, 174-182 M atrices pseudoinversas por la izquierda, 665-666 M atrices sim ilares, 651 M atriz antisim étrica, 633 real, 679 M atriz cuadrada: valores característicos de una, 649-650 M atriz de transferencia: pulso, 3 10-312 Matriz pseudoinversa: por la derecha, 664-665 por la izquierda, 6 65-666 Matriz sim étrica, 633 real, 679 Matriz: antiHermitiana, 633 antisim étrica, 633 cancelación de una, 639 de ganancia de retroalim entación del estado, 40 2 -4 0 3 , 41 0 -4 1 4 , 427, 492, 494 de ganancia de retroalim entación del observador, 427, 434, 438, 442, 4 4 9 -4 5 0 , 496, 499 de Sylvester, 5 18-520, 524, 535, 540-541, 548, 551, 559 de transición de estados, 303, 305, 309-310 definida negativa, 661 definida positiva, 661 derivada de una, 640 diagonalización de una, 651, 653 diferenciación de una, 640 estable, 365
exponencial, 313 fundamental, 303, 309 hermitiana, 633 indefinida, 661 integral de una, 640 inversa, 635-637 lema de inversión, 573, 636, 668 m ultiplicación por un escalar, 637 m ultiplicación por una matriz, 637 nilpotente, 414-416 no singular, 635 norma de una, 647 normal, 633 ortogonal, 633 rango de una, 649 reglas de operaciones con, 637-643 sem idefinida negativa, 661 sem idefinida positiva, 661 sim étrica, 633 similar, 651 singular, 635 traza de una, 658 unitaria, 633-648 valores característicos de una, 649-650 vectores característicos de una, 650 M étodo de diseño analítico, 242-257 M étodo de expansión en fracciones parciales, 46-50 M étodo de la integral de inversión, 50-52, 60-64, 64-66 M étodo de programación anidada, 338, 343 M étodo de programación m ediante expansión en fracciones parciales, 3 3 9 -3 4 1 , 345 M étodo de respuesta en frecuencia, 225 -2 4 2 M étodo del lugar geom étrico de las raíces, 205 condición de ángulo en el, 206 condición de magnitud en el, 206 M étodo directo de la división, 40-42 M étodo directo de Liapunov, 322 M odo de retención, 13 caída del, 14 M odo de seguim iento, 13
www.FreeLibros.me
Indice
741
M uestreador con im pulsos, 75-77, 83 M uestreador real, 78 M uestreador y retenedor, 6 M uestreo aleatorio, 8 M uestreo con im pulsos, 75, 77 M uestreo de orden m últiple, 8 M uestreo de razón m últiple, 8 M uestreo periódico, 8 M uestreo, 6 frecuencia de, 90 proceso de, 4 teorem a de, 90-92 M ultiplexor analógico, 12 M ultiplexor, 12 M ultiplicador de Lagrange, 570-572
N N ivel de cuantificación, 8 Norm a Euclidiana, 324 Norma, 6 4 5 -6 4 7 euclidiana, 324
O
Observabilidad, 377, 388 com pleta, 3 8 9 -39 0 en el plano z, 3 91-394 matriz de, 389, 394, 401 O bservación del estado: condición necesaria y suficiente para la, 422-425 de orden m ínim o, 422 de orden reducido, 422 O bservación, 422 Observador corriente, 444 Observador de estados, 422 de orden com pleto, 422, 4 26-444 de orden m ínim o, 4 4 6 -4 5 6 Observador de orden m inino, 4 46-450, 4 5 2 -4 5 4 , 4 69 -4 7 0 , 502-504 Observador de orden reducido, 446
Observador predictor, 428 de orden com pleto, 438 diseño de, 430-444 Operador retardo unitario, 40 O scilación escondida, 98, 361
P Plano w: procedim iento de diseño en el, 228-242 Planta, 7 Polinom io característico, 649 Polinom io m ínim o, 350-354 Polinom io m ónico, 518 Polinom ios coprim os, 518, 541 Polo, 39-40 Polos del observador, 428 Poly, 499 P o ly v a lm , 500 Principio de dualidad, 392-394 Principio de superposición, 3 Problema con valores en frontera de dos puntos, 572 Problema de control óptim o cuadrático: discretizado, 580-582 en estado estacionario, 592-594 enfoque de Liapunov a la solución de, 592-596 Problema de cuantificación de los coeficien tes, 234 Problema de optim ización paramétrica, 591 Problema del regulador óptim o cuadrático: en estado estacionario, 591-592 enfoque de Liapunov a la solución de, 591-592 Proceso de adquisición de datos, 12 Proceso de distribución de datos, 12 Proceso, 7 Producto escalar, 643 Producto interno, 643-645, 647 Programación directa, 123 método de, 336
www.FreeLibros.me
7 42
Indice
Program ación en escalera, 128-135 Programación en paralelo, 127-128 Programación en serie, 126-127 Programación estándar, 124-126 Programas en M ATLAB: para control óptim o cuadrático, 579, 590-591, 60 0 -6 0 3 , 615 para encontrar la respuesta a un escalón unitario, 119, 196, 240, 268, 421, 458, 530, 6 05-606 para encontrar la respuesta a una entrada delta de Kronecker, 45 para encontrar la respuesta a una rampa unitaria, 120, 2 6 0 ,4 5 9 , 531 para encontrar la transformada z inversa, 44, 63 para encontrar las series de Fibonacci, 68 para la ubicación de polos en el plano z, 500-501 Prueba de estabilidad de Jury, 185-190 Prueba de estabilidad de Schur-Cohn, 185 Pseudoinversa por la derecha, 623-624, 664-665 Punto de desprendim iento, 208-209 Punto de ruptura de entrada, 208-209 R Radio de convergencia absoluta, 25 Raíces características, 650 Rango, 649 Realizabilidad física: condición para la, 244-245 Regulador con observador, 502, 505, 543 Representación en el espacio de estados: no unicidad de la, 301 Residuo, 50, 84-85, 145, 399, 688, 690-691 teorem a del, 689 Respuesta de o scila cio n es muertas (deadbeat), 2 42 , 248, 411, 41 4 -4 1 8 , 435, 4 39-442, 444, 4 5 3 -4 5 4 , 47 0 -4 7 1 , 490, 494, 498, 502 -5 0 5 , 508, 550, 712-713, 715, 717-718, 723, 728-729
Respuesta en estado estacionario, 193 Respuesta transitoria, 193 esp ecificacion es de la, 193-195 Respuesta: a perturbaciones, 202 entre dos instantes de m uestreo consecutivos, 320-321 R etención de datos, 6, 77 Retenedor de «-ésim o orden, 77 Retenedor de orden cero, 18-19, 78, 166 características de magnitud y fase de un, 151-153 características de respuesta en frecuencia de un, 94-96 diagrama de Bode de un, 95 función de transferencia de un, 139 Retenedor de primer orden, 19, 80-82, 139140 características de magnitud y fase del, 151153 con interpolación, 19-20 función de transferencia del, 80-82 R etenedor de primer orden con interpolación, 19-20 Retenedor de segundo orden, 19 R etenedor poligonal, 19-20 Retraso de transporte, 280
S Secuencia de ponderación, 100 Secuencia escalón unitario, 26 Segundo método de Liapunov, 322 S em idefínición negativa: de una función escalar, 661 S em idefínición positiva: de una función escalar, 662-663 prueba de, 680 Señal analógica en tiem po continuo, 1-2 Señal analógica, 1-2 Señal cuantifícada en tiem po continuo, 1-2 Señal de datos m uestreados, 2
www.FreeLibros.me
Indice
74 3
Señal digital, 2-3 Señal en tiem po discreto, 2-3, 23 Series de Fibonacci, 67-69 Sistem a de adquisición de datos, 11-12 Sistem a de control con retroal¡mentación del estado observado, 428, 434 con un observador de orden m ínim o, 447, 4 5 1-452 Sistem a de control de datos m uestreados, 3 Sistem a de control del péndulo invertido, 596 Sistem a de control digital, 3, 5 Sistem a de control en tiem po discreto, 3 Sistem a de control óptim o, 566, 568 Sistem a de distribución de datos, 11 Sistem a de regulación óptim a, 566 Sistem a de seguim iento tipo 1, 597 Sistem a de seguim iento, 460 con retroalim entación del estado observado, 645 con retroalim entación del estado y control integral, 460-461 con retroalim entación del estado, 464 control óptim o cuadrático de un, 596-609 Sistem a del doble integrador, 3 61-362, 439, 4 90, 513 Sistem a del péndulo invertido, 597, 625-628 Sistem a lineal e invariante en el tiem po, 3 Sistem a lineal en tiem po discreto variante en el tiem po, 3 09-310 Sistem a lineal, 3 Sistem a tipo 0, 197-198 Sistem a tipo 1, 197-198 Sistem a tipo 2, 197-198 Sistem a, 324 Sistem as de control m ediante el acoplam iento a un m odelo, 5 32-534, 536-537, 561 Sobrepaso m áxim o, 195 Solución de norma mínim a, 624 que m inim iza ¡|Ax - b||, 665 que m inim iza ||x||, 663-665 ss2tf, 6 0 3 -6 0 4 Sujetador, 78
Sumatoria de convolución, 98, 100 Sylvester J. J., 661
T Tabla de estabilidad de Jury, 185, 187-188 T écnica de asignación de polos, 402 Teorema de Cauchy-Goursat, 688-689 Teorema de C ayley-H am ilton, 350, 380, 404, 4 0 8 ,4 8 1 ,4 8 5 ,4 9 2 Teorema de convolución com pleja, 684 Teorema de convolución real, 684 Teorema de convolución: com pleja, 684 real, 684 Teorema de corrim iento, 31 Teorema de diferenciación parcial, 683 Teorema de m uestreo de Shannon, 150-151 Teorema de Parseval, 686 Teorema de traslación com pleja, 34 Teorema de traslación real, 31 Teorema del valor final, 36 Teorema del valor inicial, 35 Teorema principal de estabilidad de Liapunov, 326, 363-365 Teoremas de Liapunov: sobre estabilidad asintótica, 326-327 sobre estabilidad, 327 sobre inestabilidad, 327-328 Tiem po de apertura, 14 Tiem po de establecim iento, 195 Tiem po de levantam iento, 195 Tiem po de retardo, 194-195 Tiem po derivativo, 115 Tiem po integral, 115 Tiem po pico, 195 Transductor analógico, 7 Transductor de datos muestreados, 7 Transductor digital, 7 Transductor, 7 Transformación bilineal, 191, 228, 231 Transformación de Riccati, 572-573
www.FreeLibros.me
744
Indice
Transformación de sim ilitud, 301, 311-312, 65 1 -6 5 3 , 657 bajo propiedades invariantes, 659 Transform ación ortogonal, 645 Transform ación unitaria, 645 Transform ación w, 22 8-2 2 9 , 231 Transform ación z inversa, 37 Transformada de Laplace de una función asterisco, 103-104 Transformada z inversa, 37, 687 enfoque m ediante ecuaciones en diferencias para la obtención de la, 46 enfoque m ediante M ATLAB para la obtención de la, 42-45 m étodo de cálculo para la obtención de la, 42 -4 6 m étodo de d ivisión directa para la obtención de la, 40-42, 62 m étodo de expansión en fracciones parciales para la obtención de la, 46-50, 64 m étodo de la integral de inversión para la obtención de la, 50-52, 60-62, 64-66 Transformada z m odificada, 6 91-696 Transformada z, 24 bilateral, 25 de la primera diferencia hacia adelante, 6 98-699 de la primera diferencia hacia atrás, 6 97-698 de la segunda diferencia hacia adelante, 6 98-699 de la segunda diferencia hacia atrás, 698 de una función cosen o , 28 de una función escalón unitario, 25, 33 de una función exponencial, 27 de una función polinom ial, 27 de una función que involucra el término (1 - e - Ts)/s, 88-90 de una función rampa unitaria, 26 de una función senoidal, 27
definición de la, 24 integral de inversión para la, 689 inversa, 37 linealidad de la, 31 m étodo de la integral de convolución para la obtención de la, 83 propiedades de la, 38 propiedades importantes de la, 31 tabla de, 29-30 teorem a de corrim iento para la, 31 teorem a de traslación com pleja de la, 34 teorem a de traslación real para la, 31 teorem a del valor final de la, 36 teorema del valor inicial de la, 35 unilateral, 24-25 Traslape, 98 Traza, 307, 658
U U bicación de polos, 408 condiciones necesarias y suficientes para la, 402-408 diseño cuando la señal de control es un vector, 704-718 diseño por, 402 -4 2 1 , 707, 718
V Valor característico, 649-650, 678 Variables de estado, 294 Vector adjunto, 572 Vector característico generalizado, 4 94, 496, 498, 654, 6 5 6 ,6 7 4 Vector característico, 650, 674 generalizado, 654, 656 normalizado, 650 Vector de control óptim o, 567 forma en lazo cerrado del, 574 forma realimentada del, 574 Vector de estados, 294
www.FreeLibros.me
Indice
Vector: norma de un, 645 norm alizado, 644 unitario, 648
745 Vectores: dependencia lineal de, 643 independencia lineal de, 643 ortonormales, 648
www.FreeLibros.me