Teoria Sistemelor Automate Cristian Oar˘a Facultatea de Automatica si Calculatoare Universitatea “Politehnica” Bucuresti e-mail:
[email protected] URL: http://www.riccati.pub.ro/
TEORIA SISTEMELOR AUTOMATE
Capitolul 1: CONCEPTE FUNDAMENTALE ALE BUCLEI DE REACTIE (FEEDBACK)
Ce Dorim ? Bucla de Reactie Stabilitatea Interna a Buclei de Reactie Stabilizare Performante Asimptotice Solutia Problemei Reglarii CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
1
1. Ce Dorim ? Acest capitol este cel mai important pentru intelegerea scopului si mijloacelor automaticii ! Introducem notiuni de baza cum ar fi conexiunea in bucla de reactie (feedback) si caracterizam principalele ei proprietati ce o transforma in instrumentul fundamental al automaticii (asigura stabilizarea + reglarea)! Punctul de plecare: Avem un sistem care nu face ceea ce dorim ! Cum procedam? Doua variante posibile: • Il schimbam cu altul care face ceea ce dorim (dar oricum trebuie sa stim CUM sa cerem/construim sistemul nou...) • Il modificam (CUM ?) pe cel pe care il avem deja. Analiza sistemelor de la Semnale si Sisteme a incercat sa va familiarizeze cu diverse clase de modele sistemice si cerinte naturale asupra lor. CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
2
Ce Dorim ?
Clasa sistemelor considerate: • LINIARE • INVARIANTE IN TIMP • FINIT DIMENSIONALE • CAUZALE • O INTRARE – O IESIRE (SISO) Punctul de vedere: Intrare–Iesire (I/O) (modelele sunt fctii rationale proprii) – Teoria matematica de baza: Functii de o variabila complexa Ce Dorim de la un astfel de Sistem ? Multe ... De exemplu: Sa fie stabil (semnalele externe de energie finita sa rezulte in semnale interne tot de energie finita), sa urmareasca clase de semnale prescrise in conditiile in care apar semnale perturbatoare cunoscute ori necunoscute si zgomote, sa faca CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
3
Ce Dorim ?
totul cu comenzi mici (pentru a nu satura elementul de actionare) si totul in prezenta incertitudinilor de model... Multe intr–adevar!!!! Este posibil sa facem toate aceste lucruri? Daca DA, cum? Incercam sa raspundem treptat acestor intrebari dezvoltand Teoria Sintezei. ATENTIE INSA: Modelele cu care lucram sunt black–box si nu putem umbla in interiorul lor (si oricum este nevoie de specialisti din domenii din cele mai diverse pentru a stii cum)! Cum procedam? Tratam modelul sistemului nominal ca atare (black–box) si anexam un alt sistem (numit uzual regulator si apartinand aceleiasi clase de modele) pe care il proiectam noi astfel incat sistemul rezultant format din sistemul nominal si regulator sa faca ceea ce dorim. Cum il “anexam”? In serie, in paralel, in bucla de reactie pozitiva/negativa? Depinde ce dorim dar minimal dorim ca indiferent de sistemul original (stabil sau nu) sistemul rezultant sa fie stabil. CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
4
Ce Dorim ?
Conexiunea Serie 1 Fie P (s) = s−1 pe care il inseriem cu un sistem proiectat de noi C astfel incat sistemul rezultant sa fie stabil. Cum procedam? Trebuie ca C sa fie de forma e e (s − 1)C(s) unde C(s) sa fie strict stabila. Este sistemul rezultant strict stabil? Da, dpdv intrare–iesire dar daca injectam un semnal intre cele doua sisteme NU! Mai mult, nu putem asigura un zerou EXACT in s = 1 si nici nu stim EXACT ca sistemul original are un pol in s = 1! La o mica abatere rezulta un sistem INSTABIL! Deci nici un regulator nu-mi asigura cerinta de stabilitate (interna)!
Conexiunea Paralel Similar pentru conexiunea paralel! Exemplificati voi cum ar trebui sa arate un regulator si de ce nici un regulator nu ne satisface! Cum mai putem lega doua sisteme in mod elementar? Bucla de reactie (Feedback)
CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
5
Ce Dorim ?
2. Bucla de Reactie (Feedback)
Asa cum vom vedea printr-o analiza detaliata, conexiunea in bucla de reactie este CEA CARE REZOLVA CHESTIUNEA STABILITATII (interne) si inca multe alte cerinte! Cel mai simplu sistem REAL cu bucla de reactie are trei componente (vezi Fig. 1):
• Un sistem nominal ce este controlat (automatizat); • Un senzor ce masoara iesirea sistemului nominal; • Un sistem numit regulator (controller) ce genereaza intrarea sistemului nominal; (elementele de actionare sunt uzual incluse in sistemul nominal); CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
6
Bucla de Reactie (Feedback)
Fiecare dintre cele trei componente ale buclei de reactie are doua semnale de intrare (unul din interiorul sistemului si unul exogen) si un semnal de iesire. Semnalele au urmatoarele semnificatii: r : referinta (semnal de intrare) v : iesirea senzorului u : comanda (semnal de actionare) d : perturbatia externa y : iesirea sistemului (semnal masurat) n : zgomot de masura Cele trei semnale externe r, d si n se numesc intrari exogene. d r Regulator
u
Sistem nominal
y
v Senzor n
Fig. 1: Sistem de control automat (elementar) CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
7
Bucla de Reactie (Feedback)
Ce dorim? y trebuie sa aproximeze o functie de r prespecificata si trebuie sa faca acest lucru in prezenta perturbatiei externe d, a zgomotului n si a incertitudinilor diverse de modelare (a sistemului nominal)! Mai mult, uzual nu acceptam nici comenzi u prea mari iar y este disponibil doar prin intermediul masuratorii v ! Ipoteze matematice fundamentale (tipice cursului SS): Semnalele din Fig. 1 sunt scalare, descrise de functii regulate sau singulare (generalizate) ce au transformate Laplace, cele trei componente ale buclei de reactie (sistemul nominal, regulatorul si senzorul) sunt sisteme liniare invariante in timp avand functie de transfer rationala proprie (Totul este “civilizat”)! Deci “avem” frecventa si analiza urmatoare se face la nivelul transformatelor Laplace. Fiecare componenta din Figura 1 are doua intrari si o iesire putand fi exprimata sub forma (de exemplu in cazul sistemului nominal)
y=P
d u
=
P1 P2
CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
8
d u
= P1d + P2u. Bucla de Reactie (Feedback)
Ipoteza aditionala: Iesirile celor trei componente sunt functii liniare de suma (sau diferenta) intrarilor, i.e., ecuatiile sistemului nominal, senzorului si regulatorului sunt de forma y = P (d + u), v = F (y + n), u = C(r − v). Semnul “ − ” din ultima ecuatie este o chestiune de traditie (reactie negativa in electronica) putand fi inlocuit alternativ cu “ + ”. Diagrama bloc a acestor ecuatii este data in Figura 2 in care s-au omis semnele “ + ” in jonctiuni. d r
x1
-
u
x2
C
y P
v x3
F
n
Fig. 2: Bucla de reactie (standard) CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
9
Bucla de Reactie (Feedback)
Cand este (bine) definit asa ceva ? Toate functiile de transfer in bucla inchisa trebuie sa existe, i.e., functiile de transfer de la cele trei semnale exogene r, d si n la toate semnalele interne u, y, v si x1, x2 si x3 ! Prima concluzie: Este suficient sa analizam functiile de transfer de la r, d si n la x1, x2 si x3 (celelalte rezulta din acestea). Scriind ecuatiile jonctiunilor obtinem x1 = r − F x3, x2 = d + Cx1 , x3 = n + P x2, sau in forma matriciala
1 −C 0
0 1 −P
F x1 r 0 x2 = d . 1 x3 n
Sistemul in bucla inchisa este deci bine definit daca matricea de dimensiune 3 × 3 de mai sus este nesingulara, i.e., determinantul ei 1 + P CF nu este identic nul, CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
10
Bucla de Reactie (Feedback)
i.e., 1 + PCF 6≡ 0 ! In acest caz, functiile de transfer in bucla inchisa se obtin din
x1 1 x2 = −C x3 0
−1
0 1 −P
care este echivalenta cu x1 1 1 x2 = C 1 + P CF x3 PC
F 0 1
−P F 1 P
r d n
−F r −CF d . 1 n
(1)
Problema: Am presupus intitial ca P , C, F sunt proprii (avand motivatie matematica serioasa). Rezulta si ca functiile de transfer in bucla inchisa (1) sunt proprii atunci cand sistemul in bucla inchisa este bine definit ? Din pacate NU fara ipoteze suplimentare ... !!! Introducem: Sistemul in bucla inchisa este bine definit in sens strict daca toate functiile CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
11
Bucla de Reactie (Feedback)
de transfer in bucla inchisa sunt proprii (⇔ 1 + P CF nu este strict propriu ⇔ 1 + PCF(∞) 6= 0 ). Nota: Buna definire in sens strict implica automat si buna definire ! Este realist sa cerem unui sistem de reglare buna definire in sens strict ? DA !!! Argumente pro (si contra !): Functiile de transfer ale oricarui sistem sunt de fapt strict proprii (o sinusoida de amplitudine constanta si frecventa din ce in ce mai mare aplicata unui sistem conduce la o iesire ce tinde la zero). Da, dar la frecvente mari sistemele sunt in general foarte complexe si inceteaza in fapt sa fie liniare pe masura ce frecventa creste ! De fapt avem nevoie ca unul singur dintre P , C sau F sa fie strict propriu si daca acest lucru nu se intampla automat la modelele cu care lucram oricum cerem |P CF (∞)| < 1 (motive profunde legate de stabilitate interna si “small–gain”) ceea ce asigura automat buna definire in sens strict.
CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
12
Bucla de Reactie (Feedback)
3. Stabilitatea Interna a Buclei de Reactie
Problema (fundamentala): Ce notiune de stabilitate este adecvata sistemului din Figura 2 (stabilitate externa stricta, BIBO, asimptotica, Lyapunov etc.)? Raspuns: Niciuna nu este adecvata sistemului in bucla inchisa... Ce functii de transfer ne intereseaza de fapt ? In primul rand transferul I/O al sistemului in bucla r → y ! Dar chiar daca acest transfer este strict stabil este posibil ca alt transfer de la un exogen la un semnal intern al buclei sa nu fie stabil rezultand in distrugerea unei parti sau a intregului sistem !!! Deci avem nevoie ca toate functiile de transfer r, d, n → x1, x2, x3, v, y, u, sa fie SIMULTAN stabile pentru a fi siguri ca totul este OK ! CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
13
Stabilitatea Interna a Buclei de Reactie
s Exemplul 1. In Figura 2 fie C(s) = s+1 , P (s) = s21−1 , F (s) = 1. Functia de transfer r → y este strict stabila (in sens BIBO) dar functia de transfer de la d la y nu este. s Exemplul 2. In Figura 2 fie C(s) = s+1 , P (s) = s21+1 , F (s) = 1. Toate functiile de transfer exogen → semnal intern al buclei sunt strict stabile (in sens BIBO). Definitia 3. Sistemul in bucla de reactie din Figura 2 se numeste intern stabil daca toate transferurile in bucla inchisa sunt strict stabile (i.e., au polii in C−).
Aparent trebuie sa verificam 18 functii de transfer dar de fapt sunt suficiente doar 9. Aratati de exemplu ca urmatoarele functii de transfer sunt suficiente pentru verificarea stabilitatii interne r, d, n → x1, x2, x3. Este relativ complicat sa examinam chiar si 9 numitori si sa le calculam zerourile. CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
14
Stabilitatea Interna a Buclei de Reactie
Scriem fctiile de transfer rationale sub forma unor c˘aturi de polinoame coprime NP P = , MP
NC C= , MC
NF F = MF
(2)
si definim polinomul caracteristic al sistemului in bucla inchisa (din Figura 2) ca produsul numaratorilor + produsul numitorilor celor trei functii de transfer, χ = NP NC NF + MP MC MF . Polii sistemului in bucla inchisa sunt zerourile polinomului caracteristic χ. Teorema 4. Sistemul in bucla de reactie este intern stabil daca si numai daca polii sistemului in bucla inchisa sunt in C−.
Demonstrat¸ie. Pentru simplitate presupunem F = 1 (argumentatia in cazul genCAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
15
Stabilitatea Interna a Buclei de Reactie
eral este similara dar este mai greu de urmarit). Din (1) avem
x1 1 1 x2 = C 1 + PC x3 PC
−P 1 P
−1 r −C d 1 n
si inlocuind (2) obtinem
MP MC x1 1 MP NC x2 = NP NC + MP MC x3 NP NC
−NP MC MP MC NP MC
−MP MC r −MP NC d n MP MC
(3)
in care polinomul de la numitor este exact polinomul caracteristic χ. Suficienta: Sistemul in bucla inchisa este intern stabil daca polinomul caracteristic are toate zerourile in C−. Necesitatea: Implica un argument mai subtil. Presupunem ca sistemul in bucla inchisa este intern stabil. Atunci toate cele noua functii de transfer in (3) sunt CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
16
Stabilitatea Interna a Buclei de Reactie
strict stabile (in sens BIBO), i.e., au poli numai in C−. Aceasta nu implica automat ca NP NC + MP MC are zerourile in C− intrucat este posibil sa aibe un zerou in afara care sa fie zerou si al tuturor numaratorilor din (3) si deci sa se simplifice. In orice caz, polinomul χ nu are un zerou comun cu toti numaratorii din (3) asa cum demonstram prin reducere la absurd. Fie s0 a.i. (NP NC + MP MC )(s0) = 0. P.p. ca este zerou si al tutoror numaratorilor, in particular MP MC (s0) = 0. Apar doua situatii posibile: i)MP (s0) = 0; ii)MC (s0) = 0. Cazul i) MP (s0) = 0; Automat NP (s0) 6= 0 (MP este coprim cu NP ) si rezulta din elementul (1,2) al matricii ca MC (s0) = 0 si din elementul (3,1) ca NC (s0) = 0 ceea ce nu este posibil din nou din coprimitatea lui NC si MC . Cazul ii) MC (s0) = 0. Automat atunci NC (s0) 6= 0 si rationamentul se repeta ca mai sus folosind elementele (2,3) si (3,1) ale matricii rezultand ca MP (s0) = 0 si NP (s0) = 0, ceea ce contrazice coprimitatea lui MP si NP . Teorema de mai sus ne da o modalitate sintetica de verificat stabilitatea interna a unei bucle de reactie: se verifica locatia in C− a zerourilor unui polinom χ (de exemplu calculand efectiv zerourile prin calculul valorilor proprii ale matricii CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
17
Stabilitatea Interna a Buclei de Reactie
companion asociate sau, mai simplu, folosind criteriul lui Hurwitz). Teorema 5 (Test de Stabilitate Interna). Sistemul in bucla inchisa este intern stabil daca si numai daca urmatoarele doua conditii sunt simultan indeplinite: a) Functia de transfer 1 + P CF are zerourile in C−; b) Nu au loc simplificari in C+ ∪ C0 cand formam produsul PCF. Demonstrat¸ie. Sistemul in bucla inchisa este intern stabil daca si numai daca toate cele 9 functii de transfer
1 1 C 1 + P CF PC
−P F 1 P
−F −CF 1
sunt stabile. Necesitatea: Presupunem ca sistemul in bucla inchisa este intern stabil. Rezulta CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
18
Stabilitatea Interna a Buclei de Reactie
in particular ca 1+P1CF este stabila, deci 1 + P CF are zerourile in C− ceea ce NP NC NF demonstreaza necesitatea lui a). Fie P = M ,C=M ,F =M . Din Teorema P C F 4 rezulta ca polinomul caracteristic χ = NP NC NF + MP MC MF are zerourile in C−. Prin urmare perechea (NP , MC ) nu are zerouri comune in Re s ≥ 0 si similar NP NC NF . Deci si b) este pentru toate celelalte perechi corespunzand lui P CF = M P MC MF adevarata ceea ce incheie necesitatea. Suficienta: Presupunem adevarate a) si b). Factorizam P, C, F ca mai sus si fie s0 un zerou al polinomului caracteristic, i.e., (NP NC NF + MP MC MF )(s0) = 0.
(4)
Aratam prin reducere la absurd ca Re s < 0. Presupunem contrariul, Re s ≥ 0. Daca MP MC MF (s0) = 0 rezulta MP MC MF (s0) = 0 ceea ce violeaza b). Deci NP NC NF MP MC MF (s0) 6= 0 si impartind cu el in (4) obtinem 1 + M (s0) = 0 de P MC MF unde (1 + P CF )(s0) = 0 ceea ce violeaza a).
CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
19
Stabilitatea Interna a Buclei de Reactie
Concluziile “la zi”
• Un sistem se comporta “civilizat” doar daca avem stabilitate interna, adica indiferent unde se injecteaza un semnal exogen de energie finita toate semnalele din sistem vor fi de energie finita; • Stabilitatea interna nu se poate asigura cu conexiunile serie sau paralel ci doar cu bucla de reactie; • Stabilitatea interna se verifica pe baza faptului ca cele 18 functii de transfer din bucla de reactie sunt simultan strict stabile dar exista teste mult mai simple (vezi Teoremele 4 si 5); • Ramane sa investigam problema de sinteza: Dandu-se un sistem nominal oarecare P exista intotdeauna un regulator C care asigura stabilitatea interna ? Daca DA se cere constructia clasei regulatoarelor C ce asigura stabilitatea interna.
CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
20
Stabilitatea Interna a Buclei de Reactie
4. Stabilizarea Consideram sistemul (mai simplu) cu bucla de reactie unitara din Figura 3. Aceasta diagrama arata situatia teoretica tipica in controlul automat (F = 1) in care se da P si se cere C ce satisface anumite cerinte: stabilizeaza intern, asigura performante, tolereaza incertitudini de modelare, limiteza comenzi, etc. Cu toate ca in general F 6= 1, dezvoltarile teoretice sunt destul de complexe chiar in acest caz mai simplu pentru a-l analiza separat. Ipoteza: P este strict propriu (bucla este automat bine definita in sens strict). d r
e
-
y
u P
C
Fig. 3: Sistem cu bucla de reactie unitara CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
21
Stabilizarea
Problema fundamentala: Dandu-se P exista intotdeauna un C care stabilizeaza intern sistemul in bucla de reactie? Daca DA, cati exista ? Cum ii putem caracteriza? Raspuns: DA, exista o infinitate de C care stabilizeaza intern si ei se pot da explicit prin intermediul parametrizarii lui Youla ! Parametrizarea lui Youla: Cazul P Stabil Deoarece cazul general este relativ complicat, incepem sa dezvoltam mecanismul necesar intr-un caz mai simplu: P stabil (P ∈ S, unde S este inelul comutativ al functiior de transfer rationale proprii si stabile in sens strict). Teorema 6. Presupunem ca P ∈ S. Clasa tuturor C pentru care sistemul in bucla de reactie din Fig. 3 este intern stabil este data de
Q 1 − PQ
CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
:
Q∈S .
22
(5)
Stabilizarea
Teorema afirma doua lucruri: oricare ar fi C dat de (5) (cu un Q ∈ S arbitrar) el stabilizeaza intern si, pe de-alta parte, pentru oricare C care stabilizeaza intern se Q gaseste un Q a.i. C = 1−P Q , cu Q ∈ S. Demonstrat¸ie. Presupunem ca C stabilizeaza intern. Fie Q functia de transfer de la r la u C . Q := 1 + PC Evident Q ∈ S si C =
Q 1−P Q .
Reciproc, fie Q ∈ S. Definim Q C := . 1 − PQ
(6)
Sistemul in bucla inchisa este intern stabil daca si numai daca cele 9 functii de CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
23
Stabilizarea
transfer
1 1 C 1 + PC PC
−P 1 P
−1 −C 1
sunt proprii si stabile. Substituind expresia (6) pentru C aceasta matrice devine
1 − P Q −P (1 − P Q) −(1 − P Q) . Q 1 − PQ −Q PQ P (1 − P Q) 1 − PQ
(7)
Cum Q ∈ S si P ∈ S este clar ca toate elementele acestei matrici sunt proprii si strict stabile. Observatia 7. Toate functiile de transfer in bucla inchisa sunt afine in parametrul liber Q, i.e., sunt de forma T1 +T2Q pentru anumiti T1 ∈ S, T2 ∈ S. Acest fapt simplifica major orice calcule necesare pentru alegerea parametrului Q a.i. sistemul in bucla inchisa sa satisfaca cerinte suplimentare (se poate interpreta ca o liniarizare). CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
24
Stabilizarea
Trecem in continuare la analiza cazului general (P nu este neaparat stabil). In acest scop introducem factorizarile coprime peste S. Factorizari Coprime Presupunem ca P nu este stabil si vrem sa gasim in continuare un C care stabilizeaza intern. Cum procedam ? Ideea de baza: Factorizam P peste S ! N , unde (N, M ) sunt De ce nu peste polinoame ? Sa presupunem ca scriem P = M polinoame coprime. Atunci exista doua alte polinoame X si Y (ce se pot construi de exemplu pe baza algoritmului lui Euclid) ce satisfac identitatea lui Bezout
NX + MY = 1 (ideea calauzitoare este sa folosim Teorema 1 care afirma ca sistemul in bucla inchisa este intern stabil daca si numai daca polinomul caracteristic nu are zerouri CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
25
Stabilizarea
in Re s ≥ 0). Daca am seta pe baza identitiatii Bezout C = X Y atunci polinomul caracteristic verifica N X + M Y = 1 si deci nu are zerouri in Re s ≥ 0. De aici “concluzia” ca C stabilizeaza intern. Ce este gresit ? Y ar putea fi nul (deci C nu se poate construi astfel) sau ∂Y < ∂X (rezulta un regulator impropriu )! Exemplul 8. Fie P (s) = 1s pentru care avem N (s) = 1, M (s) = s. O solutie a ecuatiei Bezout N X + M Y = 1 este X(s) = 1 si Y (s) = 0 pentru care C := X Y nu este definit. Alta solutie este X(s) = −s + 1, Y (s) = 1, pentru care C := X Y = −s + 1 nu este propriu. Pentru a remedia aceasta situatie cerem ca M, N, X, Y sa fie elemente ale lui S si deci procedam la factorizari coprime peste S ! Doua functii in S se numesc coprime daca exista alte doua functii X, Y ambele in S a.i. sa aibe loc identitatea lui Bezout N X + M Y = 1. CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
26
Stabilizarea
In particular, identitatea de mai sus implica ca N si M nu au zerouri comune in Re s ≥ 0 sau la ∞. Daca ar exista un astfel de s0 atunci am avea 0 = N (s0)X(s0) + M (s0)Y (s0) 6= 1. Conditia este si suficienta pentru coprimitate: daca N si M nu au zerouri comune in Re s ≥ 0 sau la ∞ atunci sunt coprime (Demonstratia: Exercitiu ! ) Factorizare coprima: Fie G matrice real rationala. O reprezentare de forma G=
N , M
N, M ∈ S,
se numeste factorizare coprima a lui G peste S. Prezentam in continuare un mecanism (algoritm) de constructie a celor 4 functii din S ce satisfac cele 2 ecuatii: G=
N , M
CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
N X + M Y = 1. 27
Stabilizarea
n Constructia lui M si N : Fie G rationala proprie cu coeficienti reali si fie G = m o factorizare coprima peste polinoame (se obtine direct prin simplificarea oricaror N factori polinomiali comuni). Evident ∂n ≤ ∂m =: k. Atunci G = M cu
n N= , k (s + 1)
m M= (s + 1)k
este o factorizare coprima peste S a lui G. 1 2 Exemplul 9. Fie G = (s−1) 2 . Atunci k := 2, n(s) = 1, m(s) = (s − 1) si obtinem factorizarea coprima n(s) 1 N (s) = = , 2 2 (s + 1) (s + 1)
m(s) (s − 1)2 M (s) = = . 2 2 (s + 1) (s + 1)
Observatia 10. Asa cum se observa si in exemplul de mai sus, k este fixat de cerintele de coprimitate ale celor doi factori. Intr-adevar, un k mai mic creaza un M impropriu pe cand un k mai mare creaza doi factori M si N avand zerouri comune la infinit. CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
28
Stabilizarea
Deci N si M se obtin facil. Obtinerea in continuare a lui X si Y este considerabil mai dificila necesitand algoritmul lui Euclid. Algoritmul Euclid calculeaza cel mai mare divizior comun a doua polinoame date n(λ) si m(λ). Cand n(λ) si m(λ) sunt coprime, algoritmul lui Euclid se poate folosi pentru calculul polinoamelor x(λ) si y(λ) ce satisfac identitatea lui Bezout n(λ)x(λ) + m(λ)y(λ) = 1.
CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
29
Stabilizarea
Algoritmul lui Euclid Intrari: Polinoamele n(λ) si m(λ). Daca ∂m > ∂n se interschimba m si n. Pasul 1: Imparte n la m pentru a obtine n = mq1 + r1,
∂r1 < ∂m
(gradul restului mai mic strict decat gradul catului). Pasul 2: Imparte m la r1 pentru a obtine m = r 1 q2 + r 2 ,
∂r2 < ∂r1.
········· Pasul k: Imparte rk−2 la rk−1 pentru a obtine rk−2 = rk−1qk + rk , CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
∂rk < ∂rk−1. 30
Stabilizarea
Opreste–te la Pasul k pentru care rk este o constanta nenula. Ce am obtinut ? Scriind ecuatiile obtinute in forma compacta obtinem
1 q2 −1
0 1 q3 ...
0 0 1 ... −1
... qk
1
r1 r2 r3 .. rk
=
1 −q1 0 1 n 0 0 . m .. .. 0 0
Prima matrice din membrul stang este inversabila si are inversa tot o matrice polinomiala (determinantul ei este o constanta) obtinandu-se resturile sub forma
r1 r2 r3 .. rk
=
1 q2 −1
0 1 q3 ...
0 0 1 ... −1
CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
−1 ... qk
1 31
1 −q1 0 1 n 0 0 . m .. .. 0 0 Stabilizarea
Deci rk (λ) := qe(λ)n(λ) + qb(λ)m(λ) in care qe si qb sunt polinoame functie de qi(λ). Cum rk = cst. 6= 0, fie x(λ) := qer(λ) , y(λ) := qbr(λ) care sunt polinoamele cerute. k
k
Obtinerea Factorizarii Coprime peste S Am vazut algoritmul Euclid si ca rezultat identitatea Bezout pentru polinoame. Avem insa nevoie de identitatea Bezout peste functii din S (nu peste polinoame). Cum procedam ? Facem o transformare de variabila a.i. polinoamele in λ sa genereze functii in S. Intrari: G Pasul 1: Daca G este stabila, setam N = G, M = 1, X = 0, Y = 1 si STOP. Altfel continua; e e ca un cat de doua Pasul 2: Transforma G(s) in G(λ) luand s := 1−λ . Scrie G λ polinoame coprime n(λ) e G(λ) = . m(λ)
CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
32
Stabilizarea
Pasul 3: Foloseste algoritmul Euclid (peste polinoame) si gaseste x(λ) si y(λ) a.i. nx + my = 1. Treci de la n(λ), m(λ), x(λ), y(λ) la N (s), M (s), X(s), Y (s) facand tranformarea 1 inversa de variabila λ = s+1 . Parametrizarea lui Youla: Cazul General (P oarecare) Cu aceste preliminarii asigurate putem trece la constructia parametrizarii Youla pentru cazul in care P este arbitrar (dar propriu). N Fie P = M o factorizare coprima peste S si fie X si Y doua functii in S satisfacand identitatea lui Bezout NX + MY = 1 (8)
(toate acestea sunt furnizate de procedura elaborata anterior). Teorema 11 (Parametrizarea lui Youla). Multimea tuturor C pentru care sisCAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
33
Stabilizarea
temul in bucla de reactie din Figura 3 este intern stabil este data de X + MQ : Q∈S . Y − NQ
(9)
Exercitiu: Aratati ca Teorema 6 se obtine prin particularizarea Teoremei 11 atunci cand P ∈ S ! Demonstratia Teoremei 2 se face pe baza unei leme preliminare. NC N Lema 12. Fie P = M si C = M factorizari coprime peste S. Sistemul cu bucla C de reactie este intern stabil daca si numai daca (N Nc + M MC )−1 ∈ S.
Demonstrat¸ie. Demonstratia lemei fiind aproape identica cu cea a Teoremei 5 este lasata drept exercitiu ! CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
34
Stabilizarea
Demonstratia Teoremei 11. Fie Q ∈ S si definim X + MQ C := . Y − NQ Pentru a arata ca sistemul in bucla inchisa este intern stabil definim NC := X + M Q,
MC := Y − N Q
si incercam sa aplicam Lema precedenta. Pentru aceasta trebuie sa aratam succesiv Nc −1 ca C = M este o factorizare coprima si ca (N N + M M ) ∈ S. Intr-adevar, c c c avem ca N X + M Y = 1 de unde rezulta automat ca N NC + M Mc = 1 ceea ce demonstreaza prima parte a Teoremei. Reciproc, fie C un regulator ce stabilizeaza intern bucla de reactie. Trebuie sa aratam ca exista Q ∈ S a.i. X + MQ C= . (10) Y − NQ CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
35
Stabilizarea
NC −1 Fie C = M o factorizare coprima peste S si definim V := (N N + M M ) . C C C Din Lema 1 rezulta ca V ∈ S. Avem ca
C=
NC V MC V
(11)
si incercam sa alegem Q a.i. (10) sa coincida cu (11) in sensul ca NC V = X +M Q V −X si MC V = Y − N Q. Il definim pe Q din prima ecuatie rezultand ca Q = NC M si calculand Y − NQ = Y −
N (NC V − X) M Y + N X − N NC V = M M
1 − N NC V M MC V = = = MC V M M arata ca o verifica de fapt si pe a doua. A ramas sa aratam ca Q astfel definit CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
36
Stabilizarea
apartine lui S. Am vazut ca Q verifica MC V = Y − N Q,
NC V = X + M Q.
Scazand a doua ecuatie multiplicata cu Y din prima multiplicata cu X obtinem MC V X − NC V Y = XY − XY − (N X + M Y )Q ⇔ Q = NC V Y − MC V X si ultimul membru drept apartine lui S intrucat toate elementele apartin lui S. Deci Q ∈ S. Observatia 13. Analog ca in cazul in care P era stabila, toate functiile de transfer in bucla inchisa sunt functii afine de Q daca parametrizam C ca in enuntul teoremei in functie de Q. De exemplu functia de transfer de la r si d la ǫ devine 1 P ǫ= r− d = M (Y − N Q)r − N (Y − N Q)d. 1 + PC 1 + PC CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
37
Stabilizarea
Acest fapt va fi esential in sectiunile urmatoare in care parametrul Q se va determina a.i. sa satisfaca cerinte suplimentare de reglare (urmarirea asimptotica a unui semnal referinta si rejectia unui semnal de tip perturbator).
CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
38
Stabilizarea
5. Performante Asimptotice
Ce am obtinut pana in prezent ? Pentru o bucla de reactie standard (F = 1) am reusit caracterizarea clasei tuturor compensatoarelor care asigura stabilitatea interna (cea mai larga clasa ce ne intreseaza in aplicatii practice !) Ce mai dorim de la un sistem de reglare automat ? Minimal dorim sa-i asiguram o comportare dorita la anumite clase de semnale date si in conditiile in care pot aparea semnale perturbatoare si/sau zgomote. Ideal: Dorim ca la semnale precizate de intrare u ∈ U iesirii sistemului sa-i corespunda un semnal dorit de iesire y ∈ Y. Mai precis, dorim ca fiecarui u ∈ U sa-i asociem un y ∈ Y deci dorim ca sistemul sa reprezinte o aplicatie din U in Y precizata. Este realist sa cerem asa ceva ? In general NU !!! De ce ? Sunt mai multe motive: CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
39
Performante Asimptotice
• u si y sunt functii de timp (sau rationale in domeniul transformatelor Laplace) iar sistemul este liniar, invariant in timp, descris de o transformata Laplace rationala proprie si stabila (cel putin in bucla inchisa). Deci pentru o pereche (u0, y0) fixata exista cel mult un sistem T (rezulta din y0 = T u0). Daca dorim ca la alta intrare u1 sa corespunda o alta iesire y1 rezulta in general alt sistem T ! Concluzie: se poate cere asa ceva cel mult pentru o pereche de semnale ! • Este posibil asa ceva macar si pentru O SINGURA pereche de semnale? Nici macar ! Raportul uy00 poate rezulta intr-un sistem instabil si deci neinteresant pentru aplicatii (semnalele de intrare interesante u sunt in general de tip persistent ca de exemplu treapta, sinusoide, rampe, etc.) • Mai mult, din raportul uy00 pot rezulta sisteme improprii ! Ce este de facut? Relaxam cerintele pastrand esenta exigentelor! In general nu ne intereseaza ca un semnal de iesire sa aibe exact forma dorita de noi ci mai curand ne intereseaza ca dupa trecerea regimului tranzitoriu semnalul sa aibe o comportare dorita rezultand deci anumite cerinte de performanta asimptotica ! Clasa de semnale de intrare: semnale persistente (pentru noi ≡ semnale cu CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
40
Performante Asimptotice
transformata Laplace rationala strict proprie radacinile antistabile, i.e., in afara lui C−).
us (s) uj (s)
in care polinomul uj (s) are toate
De ce facem astfel de ipoteze asupra semnalului? • Transformata Laplace rationala: Lucram cu sisteme dinamice descrise de fctii de transfer rationale si deci este normal ca semnalele sa fie tot rationale (solutii ale unor ecuatii diferentiale ordinare in conditii initiale arbitrare). • Strict proprii: Semnalul in domeniul timp dorim sa fie functie in sens regulat (nu semnal generalizat). • Radacini antistabile: Putem considera semnale generale dar cele interesante din punct de vedere al proprietatilor asimptotice sunt doar cele antistabile. De ce ? Raspunsul unui sistem liniar y = T u la o intrare u = u+ + u− (u+ partea antistabila si u− partea stabila) este y = y+ + y−, CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
y+ = T u+, 41
y− = T u−. Performante Asimptotice
Deoarece sistemul este neaparat stabil (in bucla inchisa), rezulta ca y− are toate radacinile in C− si deci limt→∞ y−(t) = 0 si dpdv asimptotic conteaza numai componenta antistabila. Ipoteze: Presupunem configuratia clasica de reglare din Figura 4
d r
e
-
y
u P
C
Fig. 4: Sistem cu bucla de reactie unitara (F = 1) in care semnalele externe r si d sunt presupuse de tip persistent. Semnalul r numit referinta reprezinta semnalul pe care dorim sa-l urmareasca iesirea sistemului CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
42
Performante Asimptotice
y iar semnalul d este semnalul perturbator pe care il dorim rejectat la iesirea sistemului (omitem momentan o discutie separata asupra lui n deorece F = 1 si deci presupunem ca este disponibila iesirea y (prim masurare exacta); mai mult, n fiind in general zgomot alb rejectia sa se poate trata doar cu instrumente specifice statisticii matematice) ! Problema fundamentala a reglarii: Pentru configuratia de reactie din Figura 4 sa se gaseasca un sistem (numit compensator regulator) a.i. sistemul in bucla inchisa sa indeplineasca simultan cerintele: Stabilizare (S): Sa fie intern stabil, adica C sa fie un compensator stabilizator; Reglare (R): Sa indeplineasca cerintele de reglare asimptotica adica lim ǫ(t) = 0 ∀r ∈ R,
t→∞
lim ǫ(t) = 0
t→∞
CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
∀d ∈ D, 43
Performante Asimptotice
adica C sa fie un compensator regulator pentru clasa referintelor R si clasa pertubatiilor D. Observatia 14. • Cerinta de reglare (performanta asimptotica) nu are sens fara asigurarea simultana a conditiei de stabilizare ! Nu are deci sens sa abordam separat problema reglarii de cea a stabilizarii de exemplu prin parametrizarea clasei tuturor regulatoarelor si ulterior intersectarea cu clasa celor care stabilizeaza. Problema se abordeaza prin deducerea subclasei compensatoarelor stabilizatoare ce asigura in plus si reglarea ! • Cerinta de reglare expliciteaza de fapt doua cerinte individuale de comportare la doua clase de semnale de intrare: Urmarirea referintei (Rr): lim ǫ(t) = 0,
t→∞
∀r ∈ R
,d = 0
∀d ∈ D
, r = 0.
Rejectia perturbatiei (Rd): lim ǫ(t) = 0,
t→∞
CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
44
Performante Asimptotice
• Ambele clase de semnale R, D sunt presupuse cunoscute (date prin cerinta de proiectare). Cele doua cerinte se considera separat rezultand in final si compunerea efetcelor limt→∞ ǫ(t) = 0, ∀r ∈ R, ∀d ∈ D (acest fapt este o consecinta a principiului superpozitiei aplicabil sistemelor liniare). • Cerinta de urmarire a referintei se poate scrie echivalent lim y(t) = lim r(t)
t→∞
t→∞
∀r ∈ R
, d = 0.
Reformularea problemei reglarii Nc N Fie P = M si C = M factorizari coprime ale lui P si respectiv ale lui C peste S c n si fie r = rrm , d = ddmn factorizari coprime peste polinoame. Deorece r si d sunt presupuse semnale persistente avem automat ca
∂rn < ∂rm,
∂dn < ∂dm
si radacinile lui rm si dm sunt in C+ ∪ C0. CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
45
Performante Asimptotice
Expresia lui ǫ ca functie de semnalele de intrare d si r este 1 rn N Mc dn P M Mc ǫ= − . r− d= 1 + PC 1 + PC N Nc + M Mc rm N Nc + M Mc dm
(12)
Teorema valorii finale: Daca ǫ(s) este o transformata Laplace rationala fara poli in Re s ≥ 0 cu posibila exceptie a unui pol simplu in s = 0 atunci limt→∞ ǫ(t) exista si se poate calcula cu alternativ prin lim ǫ(t) = lim sǫ(s).
t→∞
s→0
Problema reglarii capata atunci urmatoarea formulare echivalenta: Problema reglarii: Sa se gaseasca doua elemente in S notate Nc si Mc, cu proprie, care satisfac simultan cerintele: Stabilizare (S’):
1 N Nc +M Mc
Nc Mc
∈S
CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
46
Performante Asimptotice
Reglare (R’): Polii lui sǫ(s) ⊂ C− si lim sǫ(s) = 0|∀r∈R,d=0,
s→0
lim sǫ(s) = 0|∀d∈D,r=0.
s→0
Observatia 15. Chiar in aceasta formulare problema este relativ complicata intrucat cele doua conditii (S’) si (R’) trebuie asigurate simultan ! Asa cum vom vedea putin mai tarziu, problema se simplifica considerabil daca folosim pentru Nc si Mc expresiile deduse la stabilizare, adica daca scriem formula parametrizata a compensatoarelor stabilizatoare si impunem sa satisfaca exclusiv conditia (R’), (S’) fiind automat satisfacuta in acest caz. In aceasta idee este formulata si teorema reglarii din sectiunea urmatoare.
CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
47
Performante Asimptotice
6. Solutia Problemei Reglarii Teorema 16. Presupunand conditia (S) (sau echivalent (S’)) din problema reglarii indeplinita, conditia (R) (sau echivalent (R’)) este indeplinita daca si numai daca urmatoarele doua conditii sunt simultan indeplinite: (i)
1 1 1 × ∈ S ⇔ Z(rm) ⊂ Z( ) ⇔ Z(rm) ⊂ P(P ) ∪ P(C) 1 + P C rm 1 + PC
(ii)
P P 1 × ∈ S ⇔ Z(dm) ⊂ Z( ) ⇔ Z(dm) ⊂ Z(P ) ∪ P(C) 1 + P C dm 1 + PC
Demonstrat¸ie. Sa observam intai ca sirurile de echivalente din enunt rezulta automat din conditia ca rm si dm au toate zerourile in C+ ∪ C0 si sistemul in bucla inchisa este intern stabil. Conditiile sunt suficiente: Intr–adevar, conditiile fiind indeplinite rezulta din (12) CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
48
Solutia Problemei Reglarii
ca ǫ(s) are toti polii in C−. Mai mult, deoarece r si d sunt descrise de rationale strict proprii rezulta si ca toti polii lui sǫ(s) sunt in C−. Deoarece S × r1m ∈ S si P S × d1m ∈ S avem ca s nu este pol al acestor rationale si din (12) rezulta lim sǫ(s) = 0. s→0
Deci conditia (R’) este in totalitate indeplinita. Conditiile sunt necesare: Deorece (R’) este indeplinita, rezulta din (12) ca simultan P 1 rn dn |d=0, ǫ= |r=0. (13) ǫ= 1 + P C rm 1 + P C dm 1 Cum sistemul este intern stabil si deci 1+P C ∈ S iar Z(rm) ⊂ C+ ∪ C0 rezulta automat din conditia (R’) folosita in prima relatie (13) ca rm trebuie sa dispara complet prin simplificare. Rationamentul pentru a doua conditie din (13) este similar rezultand in final necesitatea conditiilor (i) si (ii) din enunt. 1 Observatia 17. • Sa observam ca 1+P C are un zerou instabil in s0 (care sa simplifice corespunzator “modelul” semnalului referinta continut in rm ) daca CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
49
Solutia Problemei Reglarii
si numai daca functia de transfer in bucla deschisa L = P C are un pol acolo. • Teorema de mai sus se mai numeste si principiul modelului intern: pentru a avea urmarire asimptotica a semnalului referinta trebuie ca polii semnalului referinta sa apara ca poli in modelul intern al buclei deschise L. • O analiza asemanatoare se poate face si in privinta semnalului perturbator d. Exemple de aplicare: Sa presupunem ca avem un sistem P si dorim sa construim un regulator care sa urmaresca un semnal de tip treapta sau de tip rampa r(t) =
c, 0,
daca t ≥ 0, , daca t < 0,
r(t) =
ct, daca t ≥ 0, 0, daca t < 0,
unde c ∈ R∗. Alternativ, dorim sa rejectam de exemplu o perturbatie de tip sinusoidal, i.e. d(t) = sin(ωt)1(t). CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
50
Solutia Problemei Reglarii
Exemple tipice pentru referinta treapta il constituie reglarea automata a vitezei unui automobil (cruise control) sau reglarea temperaturii dintr-o camera cu ajutorul unui termostat ce comanda centrala termica. Un exemplu tipic pentru reglarea la rampa il constituie o farfurie de radar sau de TV prin satelit ce trebuie sa urmareasca orbita circulara a unui satelit (negeostationar). Un satelit ce se misca pe o orbita circulara cu o viteza unghiulara constanta acopera un unghi ce este functie liniara de timp (adica o rampa). Perturbatii sinusoidale apar in medii magnetice sau bune conducatoare de electricitate acolo unde este folosita de exemplu tensiunea alternativa. Aplicand teorema reglarii in aceste cazuri obtinem urmatoarea lema. Lema 18. Prespunem ca sistemul in bucla inchisa este intern stabil si d = 0. (a) Daca r este o treapta atunci are loc reglarea (i.e. limt→∞ ǫ(t) → 0) daca si 1 numai daca S := 1+P C are cel putin un zerou in origine (s = 0). (b) Daca r este o rampa atunci are loc reglarea (i.e. limt→∞ ǫ(t) → 0) daca si 1 numai daca S := 1+P C are cel putin doua zerouri in origine (s = 0). Prespunem ca sistemul in bucla inchisa este intern stabil si r = 0. (c) Daca d este o sinusoida d(t) = sin(ωt)1(t) atunci are loc rejectia perturbatiei (i.e. limt→∞ ǫ(t) → 0) daca si numai daca P are un zerou in s = jω CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
51
Solutia Problemei Reglarii
sau C are un pol s = jω (automat va avea si s = −jω deoarece sistemele au coeficienti reali).
Demonstrat¸ie. Rezulta direct din aplicarea transformatei Laplace asupra lui r(t) si d(t) si Teorema reglarii. Exemplul 19. Sa luam un exemplu banal. Fie P (s) = 1s , C(s) = 1. Functia de transfer de la r la ǫ este Tǫr
1 s = = 1 + s−1 s + 1
Prin urmare polul din bucla deschisa din s = 0 devine zerou al functiei de transfer de la referinta la eroare si acest zerou anuleaza polul lui r(s) = 1s rezultand un ǫ(s) fara poli instabili. Deci acest sistem asigura in bucla inchisa urmarirea unei referinte de tip treapta unitara. Cu toate ca teorema reglarii ne da un instrument teoretic extrem de util in CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
52
Solutia Problemei Reglarii
abordarea analitica a solutiei problemei reglarii, mai sunt inca de facut cativa mici pasi in explicitarea clasei compensatoarelor stabilizante si gasirea parametrului Q care satisface conditiile enuntate. Clasa compensatoarelor care asigura cerinta primordiala de stabilitate interna este Q N data de C = X+M Y −N Q in care Q este arbitrar in S si P = M si N X + M Y = 1, cu toate N, M, X, Y ∈ S. Functiile de transfer ce intervin in Teorema reglarii sunt date de Tǫr = S =
1 M Mc , = 1 + PC N Nc + M Mc
si
Tǫd = −P S = −
N Mc N Nc + M Mc
care devin dupa inlocuirea formulelor pentru Mc := Y − N Q si Nc := X + M Q, Tǫr = M (Y − N Q), CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
Tǫd = N (Y − N Q). 53
Solutia Problemei Reglarii
Scriind acum rm si dm in forma rm = kr (s − sr1)(s − sr2) . . . (s − srk ) dm(s) = kd(s − sd1)(s − sd2) . . . (s − sdℓ) unde kr , kd ∈ R si radacinile sri, sdj ∈ C+ ∪ C0, i = 1, . . . k, j = 1, . . . , ℓ apar in perechi complex conjugate. Cu aceste notatii, conditiile de interpolare enuntate in Teorema reglarii devin pentru urmarirea referintei M (sr1)(Y (sr1) − N (sr1)Q(sr1)) = 0, M (sr2)(Y (sr2) − N (sr2)Q(sr2)) = 0, .. M (srk )(Y (srk ) − N (srk )Q(srk )) = 0, CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
54
(14)
Solutia Problemei Reglarii
iar cele pentru rejectia perturbatiei devin N (sd1)(Y (sd1) − N (sd1)Q(sd1)) = 0, N (sd2)(Y (sd2) − N (sd2)Q(sd2)) = 0, .. N (sdℓ)(Y (sdℓ) − N (sdℓ)Q(sdℓ)) = 0.
(15)
• In ecuatiile de mai sus N, M, X, Y sunt elemente cunoscute (determinate anterior) in S si deci valorile lor in punctele sri si srj sunt numere reale (sau complexe) ce se pot calcula direct. Necunoscuta o constituie parametrul liber Q ∈ S care se determina a.i. conditiile de interpolare de mai sus sa fie indeplinite. • Daca sri sau sdj sunt reali, ecuatia corespunzatoare va avea toti coeficientii reali si evident si valoarea rezultata pentru Q(sri) sau Q(sdj ) va fi reala. Daca radacina corespunzatoare este complexa atunci automat valoarea pentru Q(sri) sau Q(sdj ) va fi complexa rezultand doua ecuatii corespunzatoare partii reale si celei imaginare avand ca solutii Re Q(·) si Im Q(·). Ecuatiile care rezulta pentru radacina complex conjugata sri sau srj vor fi identice cu cele obtinute pentru sri sau srj si nu mai este necesar sa le rezolvam/scriem. CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
55
Solutia Problemei Reglarii
• Parametrul Q este complet arbitrar in S insa conditiile de interpolare impun esentialmente conditii asupra zerourilor sale. In consecinta pentru simplificarea cat mai mult posibil a calculelor necesare se ia un Q ∈ S de o forma cat mai simpla de tipul a0 + a1s + . . . + ak+ℓ−1sk+ℓ−1 Q(s) = (s + 1)k+ℓ−1 sau Q(s) = a0 + a1
1 1 + . . . + ak+ℓ−1 . k+ℓ−1 s+1 (s + 1)
Numarul minim de parametri cu care se incearca gasirea lui Q este dat de numarul de conditii de interpolare ce trebuie satisfacute, i.e., k + ℓ si fixeaza gradul (minim) al numaratorului si numitorului lui Q la k + ℓ − 1 (Q trebuie sa fie propriu). Se observa ca pentru orice valori ale parametrilor a0, a1, . . . , ak+ℓ−1 avem Q ∈ S. • Daca modelul intern este asigurat de sistemul original P atunci ecuatiile (14) si (15) sunt satisfacute indiferent de valoarea lui Q. Intr–adevar, daca in cazul urmaririi referintei avem ca sri este pol al lui P , atunci automat M (sri) = 0 CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
56
Solutia Problemei Reglarii
si ecuatia respectiva M (sri)(Y (sri) − N (sri)Q(sri)) = 0, nu conduce la nici o restrictie asupra lui Q(sri). Similar pentru cazul rejectiei perturbatiei daca sdj este in modelul original P (s) sub forma unui zerou atunci ecuatia N (sdj )(Y (sdj ) − N (sdj )Q(sdj )) = 0, este automat satisfacuta pentru ca N (sdj ) = 0 si deci nu apare nici o restrictie asupra lui Q(sdj ). Aceste fapte ne permit reducerea complexitatii parametrului Q (si implicit a complexitatii regulatorului rezultant) in cazurile mentionate. • Daca apare necesitatea asigurarii unui model intern cu radacini multiple ecuatiile (14) si (15) trebuie completate cu variantele lor derivate de k − 1 ori, unde k este multiplicitatea radacinii lui r(s) sau d(s). • Ecuatiile (14) sunt satisfacute sau daca M (sri) = 0 caz in care ecuatia se elimina CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
57
Solutia Problemei Reglarii
si se scade cu 1 sau cu 2 gradul lui Q (caz real sau complex) sau daca Q(sri) =
Y (sri ) . N (sri )
Dupa eliminarea tuturor ecuatiilor triviale (generate de prezenta chiar si partiala a radacinilor in modelul intern) rezulta deci ca Q se alege a.i. sa satisfaca ecuatiile Q(sri) =
Y (sri) , N (sri)
Q(sdj ) =
Y (sdj ) N (srj )
ceea ce revine la gasirea parametrilor a0, a1, . . . ak+ℓ−1 ce satisfac sistemul de ecuatii 1 Y (sri) = a0 + a1 1 + . . . + ak+ℓ−1 , ∀i = 1, . . . , k, N (sri ) sri +1 (s +1)k+ℓ−1
Y (sdj ) N (sdj )
ri
= a0 + a1 s
1 dj +1
+ . . . + ak+ℓ−1 (s
CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
58
1 k+ℓ−1 , dj +1)
∀i = 1, . . . , ℓ.
Solutia Problemei Reglarii
Acest sistem este un sistem liniar de k + ℓ ecuatii si k + ℓ necunoscute a0, a1, . . . , ak+ℓ−1, avand matricea sistem de tip Vandermonde. Notam in continuare unitar cu si punctele de interpolare atat corespunzatoare referintei cat si perturbatiei (mai exact si := sri ptr. i = 1, . . . , k si si := sdi−k ptr i = k + 1, . . . , k + ℓ. Sistemul Vandermonde se rescrie Aax = b unde Y (s ) 1 1 1 1 1 . . . s1 +1 N (s1 ) (s1 +1)2 (s1 +1)k+ℓ−1 " a # 1 1 1 Y (s2) s2 . . . 0 N (s2) (s2 +1)2 (s2 +1)k+ℓ−1 a1 .. . . . . . .. .. .. .. , b := A := .. , ax := . . .. .. .. .. ... . . . . ak+ℓ−1 1
1 sk+ℓ +1
1 (sk+ℓ +1)2
...
1 (sk+ℓ +1)k+ℓ−1
Y (sk+ℓ ) N (sk+ℓ )
Sistemul are solutie unica daca si numai daca matricea A este inversabila sau det A 6= 0. Se stie ca pentru o matrice Vandermonde are loc formula det A = Π1≤i
si deci problema are solutie unica daca si numai daca punctele de interpolare CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
59
Solutia Problemei Reglarii
sunt distincte. • Daca punctele de interpolare nu sunt distincte (apar radacini si cu ordinul de multiplicitate m > 1 atunci se scrie ecuatia de baza si inca m − 1 derivate ale sale. Matricea A devine de tip Vandermonde extinsa avand cele m linii corespunzatoare lui si de tipul
1 0 0 ..
1 si+1
1 0 ..
1 (si+1)2 2 si1+1
2 ..
... ... ... ..
1 (si+1)k+ℓ−1
(k + ℓ − 1) (s +1)1k+ℓ−2 i (k + ℓ − 1)(k + ℓ − 2) (s +1)1k+ℓ−3 i ..
si se actualizeaza corespunzator coeficientul termenului liber componentelor derivate.
Y (si ) N (si )
ce corespunde
• Din cele de mai sus aparent reiese ca problema reglarii are intotdeauna solutie. Acest lucru nu este adevarat si rezulta din faptul ca este posibil ca N (si) = 0 caz in care automat M (si) 6= 0 iar ecuatia de interpolare M (si)(Y (si)−N (si)Q(si)) = 0 CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
60
Solutia Problemei Reglarii
poate fi satisfacuta daca si numai daca Y (si) = 0. Aceasta egalitate nu poate insa avea loc intrucat rezulta ca (N X + M Y )(sri) = 0 6= 1. Teorema urmatoare sintetizeaza conditiile necesare si suficiente de existenta a unei solutii a problemei reglarii. N Teorema 20. Fie P = M o factorizare coprima peste S si X, Y ∈ S a.i. n N X + M Y = 1. Fie r = rrmn si d = ddm semnale persistente de tip referinta si respectiv de tip perturbator factorizate coprim peste polinoame. Fie r1 si d1 c.m.m.d.c. (cel mai mare divizor comun – peste polinoame – ) al perechii (rm, M ) si respectiv al perechii (dm, N ) si fie rm rem = , r1
dm e dm = , d1
e := rem × dem. rd
Problema reglarii are o solutie daca si numai daca N nu are nici un zerou e comun cu rd.
CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
61
Solutia Problemei Reglarii
Demonstrat¸ie. Conditia este necesara: P.p. prin absurd ca si este un zerou comun atat al lui N (s) cat si red(s). Dupa simplificarea c.m.m.d.c. re1 si de1 in ecuatiile de interpolare rezulta ca si trebuie sa satisfaca ecuatia Y (si) − N (si)Q(si) = 0 care asa cum am vazut deja este posibila daca si numai daca N (si) 6= 0. De unde contradictia. e nu are zerouri comune cu N Conditia este suficienta: Intr–adevar, daca rd e rezulta ca N (si) 6= 0 pentru fiecare zerou al lui rd(s) si deci putem scrie un sistem Vandermonde corespunzator care are intotdeauna o solutie unica.
CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
62
Solutia Problemei Reglarii
Procedura pentru rezolvarea problemei reglarii
Pasul 1: Se rezolva problema stabilizarii folosind parametrizarea lui Youla pentru clasa tuturor compensatoarelor stabilizante; Pasul 2: Se analizeaza specificatiile de performanta asimptotice si se reduc la conditii de interpolare asupra parametrului Q; se trateaza distinct cazul cu radacini multiple si se analizeaza existenta solutiilor; Pasul 3: Daca problema are solutie se rezolva sistemul Vandermonde corespunzator si se determina parametrul Q care satisface deci conditiile de interpolare; Pasul 4: Se inlocuieste parametrul Q in expresia parametrizata a compensatorului si se obtine compensatorul regulator. Observatia 21. Toate dezvoltarile de mai sus se pot face folosind modele polinomiale insa natura intima a problemelor de reglare (cu asigurarea prealabila a stabilizarii) indica ca mult mai potrivita abordarea de mai sus ce foloseste factorizari coprime peste S ! Observatia 22. Se poate formula o problema conexa problemei de reglare deja CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
63
Solutia Problemei Reglarii
formulate, numita problema de reglare structural stabila. Aceasta cere ca pentru o vecinatatate intreaga (cat de mica) a modelului nominal compensatorul sa stabilizeze si sa continue sa regleze. Se poate arata relativ usor ca acesta problema are solutie daca si numai daca cel mai mic multiplu comun al lui rm b divide Y − N Q adica daca si numai daca si dm notat rd N (si) 6= 0, b ⇔ rd(s)
nu
∀si
a.i.
are
b i) = 0 rd(s
zerouri
comune
cu
N (s).
Acest fapt implica ca modelul semnalelor externe (exogene) r si d trebuie sa fie integral inclus in modelul regulatorului si nu poate fi folosita (in caz ca exista) partea comuna cu modelul nominal P (s). Din punct de vedere al aplicatiilor concrete ale reglarii, avand in vedere ca modelul nominal este aproape intotdeauna imprecis se impune deci includerea INTEGRALA a modelului exogenului in regulator (chiar daca este deja total/partial continut in P ). CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
64
Solutia Problemei Reglarii
In general aceasta masura de precautie nu este suficienta pentru multe aplicatii intrucat nu garanteaza rezolvarea problemei decat pentru o vecinatate arbitrar de mica a modelului nominal. Formularea corecta si rezolvarea completa a problemei se face in cadrul teoriei robustetii in care se gasesc acei Q care maximizeaza vecintatea in care are loc stabilizarea si/sau performanta asimptotica.
CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
65
Solutia Problemei Reglarii
Alte cerinte de performanta realizabile cu Q Parametrul Q poate fi folosit pentru realizarea altor cerinte de performanta: • Obtinerea anumitei comportari dinamice dorite a sistemului in bucla inchisa prin asigurarea anumitor locatii a polilor in bucla inchisa) – (exercitiu: propuneti o metoda pentru aceasta !); • Asigurarea stabilizarii robuste ce permite cele mai mari incertitudini (intr-o anumita norma) asupra modelului nominal P cu pastrarea stabilitatii interne; • Performanta robusta ce permite asigurarea proprietatilor de tip asimptotic pentru o incertitudine cat mai mare in modelul nominal P ; • Asigurarea reglarii cu o clasa de regulatoare ce permit limitarea comenzii la o anumita valoare prescrisa; CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
66
Solutia Problemei Reglarii
• Sa se stabilizeze un sistem stabil cu un compensator stabil; • Problema stabilizarii simultane a doua sau mai multe sisteme nominale date folosind acelasi regulator • Combinatii ale tuturor sau doar unora dintre cerintele de mai sus. Desigur, combinand toate sau chiar o parte dintre aceste cerinte problemele se complica major si exista desigur situatii in care nu se pot asigura simultan toate cerintele. Un studiu mai detaliat al conditiilor in care anumite cerinte din cele de mai sus pot fi satisfacute se va face la Master (implica introducerea unui formalism matematic adecvat). Desigur exista si numeroase probleme deschise (a caror solutie nu a fost inca data) pe care sunteti invitati sa le incercati !
CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
67
Solutia Problemei Reglarii
Exemple de Probleme (tipice de examen) Exemplul 23. Fie un sistem nominal stabil P . Sa se gasesca toate regulatoarele care urmaresc o referinta treapta. Mai mult, sa se precizeze subclasa solutiilor structural stabile. Rezolvare: Orice reglare se face cu stabilizare prealabila. P fiind stabil, rezulta Q ca C = 1−P Q da clasa tuturor compensatoarelor stabilizatoare cand Q parcurge S. In cazul in care P este stabil, avem trivial N = P , M = 1, Y = 1, X = 0. Pentru un semnal de tip treapta r(t) = 1(t) avem r(s) = 1s si deci rm(s) = s cu singurul zerou in s = 0. Cum M (0) = 1 6= 0 rezulta ca singura varianta de a satisface ecuatia M (0)(Y (0) − N (0)Q(0)) = 0 este sa avem P (0) = N (0) 6= 0. In concluzie problema are solutie daca si numai daca s = 0 nu este zerou al lui 1 satisface cerinta de reglare, i.e., P caz in care orice Q ∈ S cu Q(0) = P (0) C=
Q : Q ∈ S, 1 − PQ
CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
Q(0) = 68
1 . P (0) Solutia Problemei Reglarii
Aceasta expresie da si clasa solutiilor structural stabile (explicati de ce !!!). 1 Exemplul 24 (Exemplu detaliat la seminar). Fie P (s) = (s−1)(s−2) . Sa se gaseasca un regulator ce asigura urmarirea unei referinta treapta r(t) = 1(t) si rejectia unei perturbatii sinusoidale d(t) = sin10t. Rezolva orice regulator gasit problema structural stabila ? Schita de rezolvare: Trebuie gasita intai clasa compensatoarelor stabilizante. Q P fiind instabila aceasta are forma C = X+M Y −N Q cu Q arbitrar in S. Deci trebuie intai gasiti N, M, X, Y folosind procedura de la pagina 29. Mai intai calculam 2 1 − λ λ )= 2 , Pe (λ) := P ( λ 6λ − 5λ + 1
cu
n(λ) = λ2,
m(λ) = 6λ2 − 5λ + 1.
Aplicam algoritmul lui Euclid pentru n(λ) si m(λ) obtinand succesiv 1 q1(λ) = , 6 CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
5 1 r1(λ) = λ − , 6 6 69
Solutia Problemei Reglarii
36 6 1 q2(λ) = λ − , r2(λ) = 5 6 25 si ne oprim intrucat am obtinut un rest constant nenul. Ecuatiile verificate sunt n = mq1 + r1 m = r 1 q2 + r 2 de unde r2 = (1 + q1q2)m − q2n. Deci luam 1 + q1 q2 q2 = 5λ + 1. x = − = −30λ + 19, y = r2 r2 1 Revenind in variabila s prin transformarea inversa λ = s+1 obtinem 1 N (s) = , (s + 1)2
(s − 1)(s − 2) M (s) = (s + 1)2
1 19s − 1 X(s) = x( )= , s+1 s+1 CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
1 s+6 Y (s) = y( )= . s+1 s+1 70
Solutia Problemei Reglarii
Deci am deteminat toti C care asigura stabilitatea interna. 2 Avem r(s) = 1s si d(s) = s2100 de unde r (s) = s si d (s) = s + 100. m m +100 Observam ca nici o radacina a acestor doua polinoame nu apare ca pol respectiv ca zerou al sistemului initial P si deci problema de reglare structural stabila va avea aceeasi solutie cu cea obisnuita data de cele doua conditii de interpolare ce trebuie satisfacute:
M (0)(Y (0) − N (0)Q(0)) = 0, N (10j)(Y (10j) − N (10j)Q(10j)) = 0. Inlocuind valorile corespunzatoare ale lui N, M, Y obtinem echivalent Q(0) = Q(10j)
Y (0) N (0) = 6 Y (10j) =N (10j) =
−94 + 10j
⇔
Re Q(10j) = −94,
Im Q(10j) = 70.
Avem de satisfacut trei conditii de interpolare si deci vom lua un polinom Q CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
71
Solutia Problemei Reglarii
(in variabila
1 s+1 )
cu trei coeficienti deci de gradul 2:
Q(s) = a0 + a1
1 1 + a2 . 2 s+1 (s + 1)
Ramane sa determinam coeficientii a0, a1, a2 pe baza conditiilor de interpolare. Rezolvand sistemul liniar de tip Aax = b ce se obtine rezulta coeficientii a0 = −79, a1 = −723, a2 = 808. De aici rezulta expresiile −79s2 − 881s + 6 Q(s) = , 2 (s + 1)
−60s4 − 598s3 + 2515s2 − 1794s + 1 C(s) = s(s2 + 100)(s + 9)
care reprezinta solutia cautata. Exemplul 25. Sa presupunem ca in exercitiul precedent se cere realizarea unei urmariri a unei referinte de tip rampa, in contextul in care perturbatiile nu apar CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
72
Solutia Problemei Reglarii
(sunt nule). Semnalul rampa are transformata Laplace r(s) =
1 s2
si deci rm(s) = s2. Conditia de interpolare se pune astfel incat M (s)(Y (s) − N (s)Q(s)) sa aibe un zerou dublu in s = 0. Cum M (0) 6= 0 rezulta echivalent ca Y (s) − N (s)Q(s) trebuie sa aibe un zerou dublu in s = 0 si deci Q(s) trebuie sa fie de gradul 1 pentru a avea doi parametri liberi a0 si a1, i.e., 1 Q(s) = a0 + a1 . s+1 Conditiile de interpolare sunt deci Q(0) = CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
Y (0) =6 N (0) 73
Solutia Problemei Reglarii
si respectiv conditia asupra derivatei ′
′
Y (0)N (0) − N (0)Y (0) Q (0) = N (0)2 ′
din care rezulta sistemul corespunzator cu solutia a0 = 13, a1 = −7. Similar se scrie acum Q si respectiv C.
CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie
74
Solutia Problemei Reglarii
CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 1. Sisteme Dinamice pe Spatiul Starilor 2. Evolutia Starii, Tranzitia Intrare–Iesire 3. Echivalenta Sistemelor Liniare 4. Stabilitatea Sistemelor 5. Regimurile Permanent/Tranzitoriu/Stationar
CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR
75 SISTEME DINAMICE PE SPATIUL STARILOR
1. Sisteme Dinamice pe Spatiul Starilor
Clasa sistemelor considerate: • LINIARE • INVARIANTE IN TIMP • FINIT DIMENSIONALE • MULTI-INTRARE/MULTI-IESIRE (MIMO) Definitia 26. Se numeste sistem dinamic liniar, invariant in timp, cu timp continuu un cuadruplu de matrici constante (A, B, C, D), unde A ∈ Rn×n, CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR
76 Sisteme Dinamice pe Spatiul Starilor
B ∈ Rn×m, C ∈ Rp×n, D ∈ Rp×m ce se expliciteaza prin
x(t) ˙ = Ax(t) + Bu(t), y(t) = Cx(t) + Du(t)
x(to) = xo
(16)
unde x(t) ∈ Rn, u(t) ∈ Rm, y(t) ∈ Rp; u(t) → intrarea sistemului, u(·) ∈ U, U → spatiul functiilor (semnalelor) de intrare; y(t) → iesirea sistemului, y(·) ∈ Y, Y → spatiul functiilor (semnalelor) de iesire; x(t) → starea sistemului, x(·) ∈ X , X → spatiul starilor. Observatii: • Sistemul dinamic astfel definit admite o scriere matriciala ce expliciteaza de fapt un sistem de n ecuatii diferentiale cu n necunoscute (starile) iar iesirile sunt o combinatie liniara a starilor si intrarilor (FIG); • Sistemul este automat invariant in timp, liniar, finit dimensional si cauzal ! • Datorita invariantei in timp se poate lua intotdeauna to = 0 si deci conditia initiala se rescrie x(0) = xo; CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR
77 Sisteme Dinamice pe Spatiul Starilor
• Sistemul dinamic astfel definit se poate figura ca un sistem intrare–iesire in care starea joaca rolul de variabila de cuplare (FIG) ! • Sistemul este complet precizat de cele patru matrici (A, B, C, D); • Conditii uzuale: u(t) continua cel putin pe portiuni caz in care x(t) si y(t) rezulta functii continue;
CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR
78 Sisteme Dinamice pe Spatiul Starilor
2. Evolutia Starii, Tranzitia Intrare–Iesire Prima ecuatie a sistemului x(t) ˙ = Ax(t) + Bu(t),
x(0) = xo
este in fapt un sistem de n ecuatii diferentiale ordinare cu n necunoscute avand o solutie unica in cazul in care starea initiala xo si comanda u(t), t ≥ 0, sunt precizate (u(·) este continua pe portiuni). Din teoria ecuatiilor diferentiale ordinare solutia rezulta R t A(t−τ ) At x(t) = φ(t, xo, u(·)) = e xo + 0 e Bu(τ )dτ = φ(t, xo, 0) + φ(t, 0, u(·)) = xℓ(t) + xf (t). Functia φ : R × Rn × U → Rn se numeste functia de tranzitie a starii. Descompunerea aditiva de mai sus pune in evidenta superpozitia efectelor (datorate starii CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR
79 Evolutia Starii, Tranzitia Intrare–Iesire
initiale xo – regim liber – si respectiv comenzii u(·) – regim fortat). Matricea Φ(t) := eAt se numeste matricea de tranzitie a starii. Cu aceasta notatie solutia sistemului de ecuatii diferentiale se rescrie
x(t) = Φ(t)xo +
Z
t
Φ(t − τ )Bu(τ )dτ.
(17)
0
Problema: Ce inseamna si cum se calculeaza eAt ? Avem prin definitie ex = 1 +
1 1 1 x + x2 + . . . + xn + . . . 1! 2! n!
CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR
80 Evolutia Starii, Tranzitia Intrare–Iesire
care in cazul matricial devine At
e
1 1 1 2 = In + (At) + (At) + . . . + (At)n + . . . . 1! 2! n!
(18)
Calculul matricii de tranzitie a starii se bazeaza pe forma Jordan a matricii A si va fi explicitat mai tarziu. Reversibilitatea timpului: Deoarece Φ(t) 6= 0, ∀t finit, obtinem din (17) xo
Rt = Φ(−t)x(t) − 0 Φ(−t)Φ(t − τ )Bu(τ )dτ Rt = Φ(−t)x(t) − 0 Φ(−τ )Bu(τ )dτ
(19)
de unde rezulta ca in cazul sistemelor netede (cu timp continuu) starea initiala se poate intotdeauna recupera daca se cunoaste “unde s-a ajuns” si comanda care a generat starea respectiva. (FIG) Iesirea sistemului se obtine imediat ca o combinatie liniara de intrari si stari sub CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR
81 Evolutia Starii, Tranzitia Intrare–Iesire
forma (vezi (16) si (17)) Rt
y(t) = f (t, xo, u(·)) = Ce xo + 0 CeA(t−τ ) Bu(τ )dτ = f (t, xo, 0) + f (t, 0, u(·)) = yℓ(t) + yf (t). At
Matricile T (t) := CΦ(t)B,
Tc(t) :=
0, t < 0, T (t), t ≥ 0
se numesc matricea pondere respectiv matricea de raspuns cauzal la impuls. Mai mult Tc(t) = T (t)1(t) unde 1(t) := diag {1(t)} iar 1(t) este functia treapta (Heaviside). Cu aceste notatii Z t y(t) = CΦ(t)xo + Tc(t − τ )u(τ )dτ. 0
CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR
82 Evolutia Starii, Tranzitia Intrare–Iesire
In particular daca xo = 0 obtinem y(t) =
Z
t
Tc(t − τ )u(τ )dτ = yf (t)
0
ceea ce arata ca matricea de raspuns cauzal la impuls permite exprimarea iesirii atunci cand conditia initiala este nula. Mai precis, in conditii initiale nule sistemul dinamic se poate exprima ca un sistem de convolutie sub forma y(t) =
Z
∞
Tc(t − τ )u(τ )dτ = Tc(t) ∗ u(t), −∞
(u = 0 pentru t < 0 si Tc(t − τ ) = 0 pentru t − τ < 0). Daca m = p = 1 atunci Tc(t) = hc(t) si are semnificatia de raspuns cauzal al sistemului atunci cand la intrare se aplica un impuls Dirac u(t) = δ(t). Functie (Matrice) de Transfer CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR
83 Evolutia Starii, Tranzitia Intrare–Iesire
Restrangem intrarile la clasa functiilor original, i.e., U ⊂ O. Atunci automat x(t) si y(t) vor fi functii original, i.e. X ⊂ O si Y ⊂ O. In aceste conditii aplicand transformatele Laplace sistemului original (16) obtinem sx(s) − xo = Ax(s) + Bu(s), (20) y(s) = Cx(s) + Du(s), de unde tinand cont ca (sI − A) este a.p.t. nesingulara x(s) = (sI − A)−1xo + (sI − A)−1Bu(s) = xℓ(s) + xf (s). Avem deasemenea Φ(s) := L(Φ(t)) = L(eAt) = (sI − A)−1 care se numeste matricea rezolventa si deci Φ(t) = L−1((sI − A)−1). CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR
84 Evolutia Starii, Tranzitia Intrare–Iesire
Mai mult, Φ(s) = s−1I + s−2A + s−3A3 + . . . care are loc pentru |s| > R unde R := max{|λ|, λ ∈ Λ(A)}. Deasemenea Φ(s) = (sI − A)
−1
(sI − A)∗ G(s) = = χ(s) ν(s)
unde χ(s) := det(sI − A) si ν(s) sunt polinomul caracteristic respectiv minimal ale lui A. In operational iesirea devine y(s) = Cx(s)+Du(s) = C(sI−A)−1xo+C(sI−A)−1Bu(s)+Du(s) = yℓ (s)+yf (s). Matricea de transfer este prin definitie T (s) := L(Tc(t)) = C(sI − A)−1 B + D =: CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR
A B C D
85 Evolutia Starii, Tranzitia Intrare–Iesire
unde ultima expresie explicita se obtine comparand expresiile iesirii in domeniul timp si operational. Mai departe, e R(s) R(s) C(sI − A)∗B T (s) = +D = = = {Tij (s)} χ(s) χ(s) ν(s)
1≤i≤p 1≤j≤m
.
Matricea de transfer a unui sistem dinamic (in acceptiunea definitiei date) este o p × m matrice de functii rationale proprii. Ea permite explicitarea in operational a iesirii in functie de intrare atunci cand conditiile intiale sunt nule y(s) = T (s)u(s)
CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR
(xo = 0).
86 Evolutia Starii, Tranzitia Intrare–Iesire
3. Echivalenta Sistemelor Liniare e B, e C, e D) e avand acelasi Definitia 27. Doua sisteme liniare (A, B, C, D) si (A, numar de intrari si iesiri si aceeasi dimensiune a spatiului starilor (p = pe, m = m, e n=n e) se numesc echivalente (izomorfe) pe stare daca exista o transformare nesingulara T astfel incat e A e B e C e D
= T AT −1, = T B, = CT −1, = D.
Transformarea T este de fapt o schimbare de coordonate la nivelul marimii de CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR
87
Echivalenta Sistemelor Liniare
stare. Intr–adevar, daca
x(t) ˙ = Ax(t) + Bu(t), y(t) = Cx(t) + Du(t),
(21)
si definim pentru un T inversabil fixat
atunci obtinem
x e(t) := T x(t)
⇔
x(t) = T −1x e(t)
˙ T −1x e(t) = AT −1x e(t) + Bu(t), ⇒ −1 y(t) = CT x e(t) + Du(t), ˙ x e(t) = T AT −1x e(t) + T Bu(t), ⇒ −1 y(t) = CT x e(t) + Du(t), ( ˙ ex(t) + Bu(t), e x e(t) = Ae ex e y(t) = C e(t) + Du(t),
CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR
88
(22)
Echivalenta Sistemelor Liniare
unde e = T AT −1, A
e = T B, B
e = CT −1, D e = D. C
Propozitia 28 (Exercitiu). Doua sisteme echivalente pe stare care au conditiile initiale asemenea prin T si sunt supuse aceleiasi comenzi u(·) au traiectoriile de stare asemenea prin T si evolutii la iesire identice. e B, e C, e D) e se numesc Definitia 29. Doua sisteme dinamice (A, B, C, D) si (A, echivalente intrare–iesire daca au aceeasi functie de transfer, i.e., e e −1B e+D e = C(sI − A)−1B + D = T (s). Te(s) = C(sI − A) Observatii: a) Doua sisteme echivalente intrare–iesire trebuie sa aibe acelasi numar de intrari (m = m) e si acelasi numar de iesiri (p = pe). Este posibil insa ca dimensiunea vectorului de stare sa difere, i.e. n 6= n e. CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR
89
Echivalenta Sistemelor Liniare
b) Pentru doua sisteme echivalente intrare–iesire avem automat e D = T (∞) = Te(∞) = D.
CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR
90
Echivalenta Sistemelor Liniare
Relatia intre Echivalenta de Stare si Echivalenta Intrare–Iesire Propozitia 30. Doua sisteme echivalente pe stare sunt echivalente intrare–iesire. Demonstrat¸ie. Intr-adevar, e e −1B e+D e = CT −1(sI − T AT −1)−1T B + D Te(s) = C(sI − A) = CT −1(T (sI − A)T −1)−1T B + D = C(sI − A)−1B + D = T (s).
Observatii: a) Reciproca nu este in general valabila (este posibil ca pentru doua sisteme echivalente intrare–iesire) sa avem n 6= n e). (EX) b) Diferenta in definitiile echivalentei consta in aceea ca una este centrata pe stare pe cand cealalta este centrata pe functia de transfer (intrare–iesire). c) Pentru orice matrice de transfer exista o infinitate de realizari de stare. CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR
91
Echivalenta Sistemelor Liniare
d) Problema dimensiunii realizarii de stare este esentiala: exista o dimensiune ce este minima (realizare minimala), strict legata de anumite proprietati structurale.
CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR
92
Echivalenta Sistemelor Liniare
4. Stabilitatea Sistemelor Dinamice
Stabilitatea este o proprietate calitativa a sistemelor asociata comportarii dinamice a acestora. Daca stabilitatea se refera la comportarea lui x(t) se numeste stabilitate de tip Lyapunov iar daca se refera la y(t) se numeste stabilitate externa. Stabilitate Interna (Libera sau Lyapunov) Acest tip de stabilitate se refera la comportarea marimii de stare x(t) atunci cand intrarea este identic nula. Ecuatia relevanta este x(t) ˙ = Ax(t),
x(0) = xo.
Definitia 31. Un sistem dinamic se numeste intern stabil daca ∀ǫ > 0, ∃δ(ǫ) > 0 CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR
93
Stabilitatea Sistemelor Dinamice
a.i. ∀xo cu kxok < δ(ǫ) avem kx(t)k ≤ ǫ,
∀t ∈ R+.
Definitia 32. Un sistem dinamic s. n. intern asimptotic stabil daca ∀xo avem lim kx(t)k = 0.
t→∞
Observatii: a) Definitia este generala folosindu-se si in cazul sistemelor neliniare. In cazul liniar exista anumite consecinte simple deoarece avem solutia x(t) = eAtxo. b) Sistemul este intern asimptotic stabil daca si numai daca limt→∞ Φ(t) = 0. Evaluarea lui Φ(t) = eAt CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR
94
Stabilitatea Sistemelor Dinamice
Consideram succesiv urmatoarele cazuri: a) A este un bloc Jordan elementar cu valoare proprie 0; b) A este un bloc Jordan elementar oarecare; c) A oarecare.
a) In acest caz presupunem A ∈ Rn×n si
0 1 ... .. .. . . . A = J0 = 0 0 ... 0 0 ...
0 .. . 1 0
Evident A este nilpotenta cu indice de nilpotenta egal cu n, i.e. An = 0 si CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR
95
Stabilitatea Sistemelor Dinamice
An−1 6= 0. Folosind definitia exponentialei matriciale (18) obtinem in acest caz
At
e
0 .. = I n + 0 0
t 1!
.. 0 0
... ... ... ...
0 .. +· · ·+ t 1! 0
0 0 ... .. .. . . . 0 0 ... 0 0 ...
n−1
t (n−1)!
.. 0 0
=
1 .. 0 0
t 1!
.. 0 0
... ...
tn−1 (n−1)!
... ...
b) In acest caz presupunem A ∈ Rn×n si
A = Jo + Λo,
unde
λo 0 . . . .. .. . . . Λo = 0 0 ... 0 0 ...
0 .. = λoIn. 0 λo
Avem eAt = e(Jo+Λo)t = eJoteΛ0t (relatie ce are loc pentru ca Λo comuta cu Jo). CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR
96
Stabilitatea Sistemelor Dinamice
..
t 1!
1
Tinand cont ca eΛot = eλotIn obtinem in final
eAt
= eλot
1 .. 0 0
t 1!
.. 0 0
n−1
... ...
t (n−1)!
... ...
t 1!
..
1
.
c) Cazul general se reduce la cazurile precedente prin aducerea matricii A la forma canonica Jordan. Mai precis, ∀A ∈ Rn×n, ∃T ∈ Rn×n nesingulara a.i.
J = T AT −1 =
J1 0
...
0 Jk
unde J este o matrice Jordan (bloc diagonala avand pe diagonala blocuri elementare CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR
97
Stabilitatea Sistemelor Dinamice
Jordan Ji la valorile proprii ale matricii A). Matricea de tranzitie a starii devine eAt = eT
−1
JT t
= T −1eJtT = T −1
J1 t
e
0
... 0
eJk t
T.
Recapitulare: Polinom caracteristic, minimal, forma canonica Jordan, valori proprii, multiplicitati algebrice si geometrice; Teorema 33. 1. Sistemul dinamic (A, B, C, D) este intern asimptotic stabil daca si numai daca Λ(A) ⊂ C− (spectrul matricii de stare A este localizat in semiplanul stang deschis). 2. Sistemul dinamic (A, B, C, D) este intern stabil daca si numai daca Λ(A) ⊂ C− ∪ C0 iar valorile proprii care au partea reala nula sunt radacini simple ale polinomului minimal. Demonstratie: 1. Suficienta conditiilor rezulta automat din forma Jordan. Pentru necesitate pp ca sistemul este intern asimptotic stabil. Atunci rezulta ca Φ(t)xo → 0 pentru t → ∞, ∀xo ∈ Rn. Pp prin absurd ca nu este indeplinita conditia de CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR
98
Stabilitatea Sistemelor Dinamice
spectru. Atunci ∃ λ0 ∈ Λ(A) cu Re λo ≥ 0. Fie xo un vector propriu asociat lui λo. Atunci eAtxo = eλotxo 6→ 0 ceea ce contrazice ipoteza de stabilitate asimptotica. 2. Demonstratia este similara tinand cont ca eJit este marginita (Ji este bloc Jordan elementar) daca si numai daca v. p. corespunzatoare are partea reala sau strict negativa sau zero cu multiplicitatea cel mult unu. Observatii: a) Testarea stabilitatii interne pentru un sistem dinamic se reduce din punct de vedere procedural la calculul valorilor proprii ale matricii de stare A (aducerea matricii la forma Schur). b) Deoarece stabilitatea interna a unui sistem depinde exclusiv de locatia spectrului matricii de stare A uneori se foloseste abuziv terminologia de matrice (asimptotic) stabila. Ecuatia Lyapunov si Stabilitatea Sistemelor Liniare Ecuatia AT P + P A + Q = 0, CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR
A ∈ Rn×n ,
Q ∈ Rn×n 99
(23)
Stabilitatea Sistemelor Dinamice
in necunoscuta P ∈ Rn×n se numeste ecuatie Lyapunov (matriciala, algebrica, in timp continuu). Teorema 34. Daca matricea A este asimptotic stabila (Λ(A) ⊂ C−) atunci ecuatia Lyapunov are o solutie unica data explicit de expresia P :=
Z
∞
AT t
e
QeAtdt.
(24)
0
Demonstrat¸ie. Sa observam intai ca deoarece A este asimptotic stabila expresia (24) este bine definita (integrala nedefinita este convergenta). Calculand T
A P + PA = =
R∞
T AT t At (A e Qe 0 ∞ T A t At
e
Qe
0
AT t
+e
= −Q
At
Qe A)dt =
R∞ 0
d AT t At (e Qe )dt dt
concluzionam ca intr-adevar P dat de (24) este o solutie a ecuatiei Lyapunov. CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR
100
Stabilitatea Sistemelor Dinamice
Ramane sa aratam ca P este unica solutie. Consideram aplicatia liniara 2
2
P : Rn → Rn ,
P(P ) := AT P + P A. 2
Aceasta aplicatie este insa surjectiva deoarece tocmai am aratat ca ∀Q ∈ Rn ⇒ n2 ∃P ∈ R (dat de (24)) a.i. P(P ) = −Q. Deoarece o aplicatie liniara si surjectiva este automat injectiva (si deci bijectiva) rezulta ca pentru Q fixat P dat de (24) este unica solutie a ecuatiei Lyapunov (23). In particular, P = P −1(−Q). Observatii: a) Daca Q = QT atunci rezulta automat din (24) ca P = P T . b) Daca Q = QT ≥ 0 atunci P = P T ≥ 0. c) Daca Q = QT > 0 atunci P = P T > 0. Ecuatia Lyapunov se foloseste in special in teoria sistemelor neliniare pentru testarea stabilitatii. In cazul liniar avem urmatorul rezultat (un fel de reciproca). Teorema 35 (Lyapunov). Presupunem ca ∃P = P T > 0 si Q = QT ≥ 0 a. i. AT P + P A + Q = 0. CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR
101
Stabilitatea Sistemelor Dinamice
Atunci Λ(A) ⊂ C− 0. Demonstrat¸ie. Fie λ ∈ Λ(A) o valoare proprie a lui A si x un vector propriu asociat, i.e., 6 0). Ax = λx (λ ∈ C, x ∈ Cn, x = Hermitizand aceasta ecuatie (transpus + conjugat) obtinem xH AT = λxH , iar din ecuatia Lyapunov avem succesiv xH AT P x + xH P Ax = −xH Qx; λxH P x + λxH P x = −xH Qx; 2 Re(λ)xH P x = −xH Qx. Deoarece xH P x > 0 si −xH Qx ≤ 0 rezulta automat Re(λ) ≤ 0. CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR
102
Stabilitatea Sistemelor Dinamice
Observatii: a) Daca in teorema de mai sus intarim ipotezele a.i. P > 0, Q > 0 atunci rezulta ca A este asimptotic stabila (Λ(A) ⊂ C−). b) Indicatii procedurale de testare a (semi)pozitivitatii si rezolvare a ecuatiilor Lyapunov. c) Ecuatia Lyapunov se poate folosi pentru a testa stabilitatea unui sistem prin rezolvarea unui sistem de ecuatii liniare (o problema considerabil mai simpla dpdv teoretic decat calculul valorilor proprii ale matricii A).
CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR
103
Stabilitatea Sistemelor Dinamice
5. Regimurile Permanent/Tranzitoriu/Stationar ale Sistemelor
Fie sistemul
x˙ = Ax + Bu, y = Cx + Du avand matricea de transfer
x(0) = xo,
(25)
T (s) = C(sI − A)−1B + D. Pentru a pune in evidenta regimurile permanent si tranzitoriu ale unui sistem facem ipotezele: a) Sistemul este intern asimptotic stabil, i.e., Λ(A) ⊂ C−; b) Comanda u este produsa de regimul liber al unui sistem antistabil
x˙ e = Aexe, u = Cexe
CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR
xe(0) = xeo,
(26) 104 Regim Permanent/Tranzitoriu/Stationar
cu Λ(Ae) ⊂ C+ ∪ C0. Comanda are deci expresia u(t) = CeeAe txeo si cum Λ(Ae) ⊂ C+ ∪ C0 rezulta ca u este un semnal persistent (in particular, daca Ae = 0 avem u = Cexeo = cst). Deoarece sistemul (A, B, C, D) este asimptotic stabil putem afirma intuitiv ca dupa un timp suficient de lung (asimptotic) starea sistemului va urma semnalul de intrare produs de sistemul instabil (generatorul de semnal u). Prin urmare incercam sa vedem daca se poate pune in evidenta la nivelul starii x o descompunere de tipul x(t) = ξ(t) + V xe(t) (27) unde limt→∞ ξ(t) = 0 (componenta tranzitorie) si V xe(t) este proportionala cu u(t) = Cexe(t) (componenta permanenta). Inlocuind (27) in (25) obtinem ξ˙ + V x˙ e = Aξ + AV xe + BCexe CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR
105 Regim Permanent/Tranzitoriu/Stationar
sau inca
ξ˙ = Aξ + (AV − V Ae + BCe)xe. Deoarece Λ(A) ∩ Λ(Ae) = ∅ rezulta ca ecuatia Sylvester
(28)
AV − V Ae + BCe = 0 are o solutie unica V . Punand acest V in (27) si (28) regimul dinamic devine ξ˙ = Aξ, ξ(0) = ξ0 si cum sistemul original este asimptotic stabil avem ca limt→∞ ξ(t) = 0. Prin urmare, in ipotezele facute exista si este unic V a.i. sa avem descompunerea x(t) = xp(t) + xt(t) in regim permanent si respectiv regim tranzitoriu xp(t) := V xe, CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR
xt(t) := ξ(t).
(29) 106 Regim Permanent/Tranzitoriu/Stationar
Observatii: a) Descompunerea in regim permanent si tranzitoriu se face in raport cu clasa de semnale exogene {u(·)|u(t) = CeeAetxeo, xeo ∈ Rne }. b) Descompunerea in regim permanent si tranzitoriu este specifica sistemelor liniare (apare numai in context liniar) pe cand descompunerea in regim liber si fortat are loc si in cazul sistemelor neliniare. c) Daca Ae = 0 atunci avem de-a face cu un regim stationar (intrari constante), xe(t) = xeo, ∀t ≥ 0, ecuatia Sylvester are solutia V = −A−1BCe si obtinem xp(t) = −A−1BCexeo = −A−1BCu0, yp(t) = −CA−1 BCexe0 + Du0 = −CA−1Bu0 + Du0 = T (0)u0, unde u0 := Cexe0 si T (s) = C(sI − A)−1 B + D este matricea de transfer a sistemului. d) Daca Ae = jωI, Ce = I, avem u = uoejωt iar ecuatia Sylvester devine AV − jωV + B = 0 CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR
107 Regim Permanent/Tranzitoriu/Stationar
avand solutia unica V = (jωI − A)−1B. Regimul permanent este atunci yp = C(jωI − A)−1Buoejωt = T (jω)uoejωt unde uo = Cexeo. Exercitiu: Puneti in evidenta regimurile liber/fortat, permanent/tranzitoriu pentru un circuit RLC cu intrarea generata de un sistem cu matricea de stare Ae avand doua radacini pur imaginare complex conjugate. Specificati regimul stationar pentru acest circuit.
CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR
108 Regim Permanent/Tranzitoriu/Stationar
CAPITOLUL 3: PROPRIETATI STRUCTURALE Exista anumite proprietati fundamentale ale sistemelor dinamice pe spatiul starilor care influenteaza decisiv posibilitate de analiza si sinteza: controlabilitate, observabilitate, minimalitate, stabilizabilitate, detectabilitate. Aceste proprietati se reflecta in anumite proprietati structurale ale matricilor sistemice (A, B, C, D). 1. Controlabilitatea 2. Observabilitatea 3. Descompunere Structurala 4. Realizabilitate 5. Conexiunea Sistemelor
CAPITOLUL 3: PROPRIETATI STRUCTURALE
109
PROPRIETATI STRUCTURALE
1. Controlabilitatea (“Posibilitatea de a Controla”)
Controlabilitatea este o proprietate calitativa ce caracterizeaza abilitatea unui sistem x(t) ˙ = Ax(t) + Bu(t), x(0) = xo (30) y(t) = Cx(t) + Du(t), de a putea tranzita dintr-o stare in alta prin intermediul unei anumite comenzi (control). Pentru controlabilitate este relevanta numai prima ecuatie din (43) si solutia corespunzatoare A(t)
x(t) = e
xo +
Z
t
eA(t−τ ) Bu(τ )dτ,
t ≥ 0.
(31)
0
Stare/Sistem Controlabil(a) Definitia 36. O stare x ∈ Rn se numeste controlabila la momentul t > 0 daca exista o comanda u(·) ∈ U care transfera xo = 0 (originea) in starea x(t) = x. CAPITOLUL 3: PROPRIETATI STRUCTURALE
110
Controlabilitatea
Observatii: a) Aparent pentru a stabili controlabilitatea unei stari la momentul t trebuie rezolvata ecuatia functionala (31) in necunoscuta u(·) : [0, t] → Rn (cu xo = 0). b) Conform definitiei, controlabilitatea unei stari x depinde de perechea de matrici (A, B) si de momentul t > 0. Vom vedea ca de fapt controlabilitatea este o proprietate ce depinde exclusiv de perechea (A, B) (este independenta de t). Gramian de Controlabilitate Pentrul studiul controlabilitatii se introduce Gramianul de Controlabilitate la momentul t > 0 definit de Lc(t) =
Z
t A(t−τ )
e
T AT (t−τ )
BB e
dτ.
(32)
0
Observatii:a) Lc(t) = Lc(t)T ; b) Lc(t) ≥ 0; c) Pentru orice matrice simetrica X = X T ∈ Rn×n avem Ker (X) ⊥ Im (X) si CAPITOLUL 3: PROPRIETATI STRUCTURALE
111
Controlabilitatea
Rn = Ker (X) ⊕ Im (X). Cum se obtine asa ceva ? Caracterizarea Controlabilitatii prin Gramianul de Controlabilitate Teorema 37. Starea x este controlabila la momentul t > 0 daca si numai daca x ∈ Im Lc(t). Demonstrat¸ie. Necesitatea: Presupunem ca x este controlabila la momentul t > 0 adica ∃u(·) a.i. Z t x= eA(t−τ ) Bu(τ )dτ. 0
Avem x = xK + xI unde xK ∈ Ker Lc(t), xI ∈ Im Lc(t). Aratam ca xK = 0. Intr-adevar, Z t xTK eA(t−τ ) Bu(τ )dτ (33) xTK x = kxK k2 = 0
si pentru a arata ca xK = 0 este suficient sa aratam ca xTK eA(t−τ ) B = 0,
CAPITOLUL 3: PROPRIETATI STRUCTURALE
112
Controlabilitatea
∀τ ∈ [0, t]. Aceasta identitate rezulta insa automat din sirul de egalitati
0=
xTK Lc(t)xK
=
Z
t 0
T
xTK eA(t−τ ) BB T eA (t−τ )xK dτ
=
Z
t
T AT (t−τ )
kB e
xK k2dτ
0
T
si din analiticitatea functiei B T eA (t−τ ) xK pe [0, t]. Suficienta: Presupunem ca x ∈ Im Lc(t) ceea ce este echivalent cu
x = Lc(t)z =
Z
t
T
eA(t−τ ) BB T eA
(t−τ )
zdτ
(34)
0
pentru un z ∈ Rn potrivit ales. Definim T AT (t−τ )
u(τ ) := B e CAPITOLUL 3: PROPRIETATI STRUCTURALE
z,
τ ∈ [0, ∞) 113
(35) Controlabilitatea
care introdus in (34) arata ca x=
Z
t
eA(t−τ ) u(τ )dτ
0
sau ca starea x este controlabila la momentul t. Observatii: a) Deoarece z = Lc(t)#x comanda (35) se mai poate scrie ca T
u(τ ) := B T eA
(t−τ )
Lc(t)#x,
(36)
unde Lc(t)# este pseudoinversa (Moore-Penrose) a lui Lc(t). b) Daca x ∈ Im Lc(t) atunci comanda (36) duce starea initiala (originea) in starea x la momentul t iar daca x 6∈ Im Lc(t) atunci comanda (36) duce originea cat se poate de aproape de x la momentul t (adica transfera starea pe directia data de imaginea gramianului)! Caracterizarea Controlabilitatii prin Matricea de Controlabilitate CAPITOLUL 3: PROPRIETATI STRUCTURALE
114
Controlabilitatea
Din cele discutate pana acum controlabilitatea unei stari depinde de momentul de timp t > 0. In continuare vom vedea ca de fapt proprietatea de controlabilitate este independenta de t. Introducem matricea de controlabilitate asociata unui sistem dinamic (sau mai precis unei perechi matriciale (A, B), A ∈ Rn×n, B ∈ Rn×m): R :=
B
AB
2
A B
n−1
... A
B
.
(37)
Matricea de controlabilitate are dimensiune n × (nm). Teorema 38. Fie t > 0 fixat. Atunci x ∈ Im Lc(t) ⇔ x ∈ Im R, i.e., Im Lc(t) = Im R.
(38)
Demonstrat¸ie. Sa observam mai intai ca Lc(t) fiind simetrica conditia (49) este CAPITOLUL 3: PROPRIETATI STRUCTURALE
115
Controlabilitatea
echivalenta cu Ker Lc(t) = Ker RT sau inca Lc(t)x = 0 ⇔ xT R = 0,
x ∈ Rn.
(39)
Aratam intai implicatia directa. Avem Lc(t)x = 0 ⇔
Z
t T A(t−τ )
x e
T AT (t−τ )
BB e
xdτ = 0 ⇔
0
Z
t
kxT eA(t−τ ) Bk2dτ = 0. 0
Rezulta succesiv ca xT eA(t−τ ) B = 0, xT eAτ B = 0,
∀0 ≤ τ ≤ t, ∀τ ∈ R,
ultima egalitate rezultand din analiticitatea functiei xT eAτ B (daca o functie analitica este nula pe un interval deschis atunci este nula pe toata axa reala, iar CAPITOLUL 3: PROPRIETATI STRUCTURALE
116
Controlabilitatea
[0, t] contine automat un interval deschis). Mai departe obtinem ca dk T AT τ [B e x]τ =0 = 0, k dt
k = 0, 1, 2, . . .
de unde xT B = 0,
xT AB = 0, , . . . , xT Ak B = 0, . . . 2 n−1 T B = 0 sau xT R = 0. B AB A B . . . A ceea ce este echivalent cu x T Aratam acum implicatia inversa. Fie x = 6 0 a.i. x R = 0. Atunci xT B AB A2B . . . An−1B = 0 sau inca xT B = 0,
xT AB = 0,
, . . . , xT An−1 B = 0.
Din teorema Hamilton–Cayley rezulta imediat ca xT Ak B = 0, CAPITOLUL 3: PROPRIETATI STRUCTURALE
∀k ≥ 0. 117
Controlabilitatea
Definim functia analitica φ(τ ) := xT eAτ B, φ : [0, t] ⇒ Rm. Din relatiile de mai sus rezulta ca toate derivatele evaluate in zero sunt nule, i.e., φ(0) = 0, φ(1)(0) = 0, . . . φk (0) = 0. Din analiticitate rezulta automat ca φ(τ ) = 0, si mai departe ca xT Lc(t)x =
Z
∀τ ∈ [0, t]
t
φ(τ )φ(τ )T dτ = 0. 0
Cum Lc(t) ≥ 0 rezulta in continuare Lc(t)x = 0 q.e.d. Observatii: a) O stare x ∈ Rn este controlabila independent de momentul t > 0. Proprietatea este intrinseca starii x si perechii (A, B). b) Se poate arata ca daca extindem clasa de semnale de intrare la functii generalizate (incluzand distributii) atunci daca x este controlabila exista o comanda care duce originea in acea stare intr-un timp infinit mic (nul) – fenomene de tip Bushow. CAPITOLUL 3: PROPRIETATI STRUCTURALE
118
Controlabilitatea
c) Putem introduce definitia echivalenta: o stare x s.n. controlabila daca exista t > 0 si o comanda u(·), u : [0, t], a.i. traiectoria satisface x(t) = x. Corolarul 39. R := Im R = Im Lc(t), ∀t > 0. Introducem notiunea de sistem controlabil (sau pereche (A, B) controlabila) cu semnificatia ca fiecare stare x ∈ Rn este controlabila. Avem atunci urmatorul rezultat central. Teorema 40. Fie perechea (A, B). 1. O stare x este controlabila daca si numai daca x ∈ R. 2. Perechea (A, B) (sau sistemul corespunzator) este controlabila (controlabil) daca si numai daca R = Rn (sau, echivalent, rank R = n). Observatie: Din punct de vedere procedural controlabilitatea unui sistem se poate testa verificand ca rangul matricii de controlabilitate este n, i.e. rank R = n. Pentru testarea controlabilitatii exista un algoritm dedicat foarte eficient numit “controllability staircase”. Cu toate ca acest algoritm este numeric stabil atragem atentia ca problema testarii controlabilitatii este o problema “ill–posed” (prost CAPITOLUL 3: PROPRIETATI STRUCTURALE
119
Controlabilitatea
conditionata numeric). Gramian de Controlabilitate in Timp Infinit Daca matricea A este asimptotic stabila (Λ(A) ⊂ C−) atunci limita lim Lc(t)
t→∞
este finita, se noteaza cu Lc ∈ Rn×n = LTc ≥ 0 si este numita gramian de controlabilitate asimptotic. El verifica automat ecuatia Lyapunov ALc + LcAT + BB T = 0 si are expresia explicita Lc :=
Z
∞
T
eAτ BB T eA τ dτ.
0
CAPITOLUL 3: PROPRIETATI STRUCTURALE
120
Controlabilitatea
Observatie: Ecuatia Lypunov verificata de gramianul asimptotic are solutie unica. Aceasta ecuatie are insa solutii (unice) in conditii mult mai generale decat atunci cand A este stabila. Propozitia 41. Daca A este asimptotic stabila si perechea (A, B) este controlabila atunci Lc > 0. Demonstrat¸ie. Rationam prin reducere la absurd. Stim ca Lc ≥ 0 si pp ca ∃x 6= 0 a.i. Lcx = 0. Atunci din ecuatia gramianului rezulta succesiv ca B T Ker Lc = 0, Ker Lc este AT invariant, B T AT Ker Lc = 0, . . . B T (AT )k Ker Lc = 0, ∀k ≥ 0. De aici rezulta ca pentru orice x 6= 0, x ∈ Ker Lc, avem xT R = 0 ceea ce contrazice ipoteza ca rank R = n si deci ipoteza ca (A, B) este controlabila.
CAPITOLUL 3: PROPRIETATI STRUCTURALE
121
Controlabilitatea
Semnificatia Gramianului de Controlabilitate in Timp Infinit Presupunem A stabila, perechea (A, B) controlabila si deci Lc > 0. Atunci avem Λ(Lc) = {σ1, σ2, . . . , σn}, σi > 0, unde indexarea s-a facut in ordine descrescatoare (i = 1, . . . , n). Fie xi vectori proprii ce formeaza o baza ortonormata (xi ⊥ xj , kxi k = 1). Ne propunem sa calculam energia corespunzatoare comenzii ce duce originea in starea xi. Avem xi =
Z
∞
eA(t−τ ) Bui(τ )dτ = Lczi
0
unde
T AT τ
ui(τ ) = B e
T AT τ
zi = B e
L−1 c xi
T AT τ
=B e
1 xi . σi
Energia comenzii este 1 2 kui(τ )k2 = 2 σi
Z
0
∞
T Aτ T AT τ xi e BB e xidτ
CAPITOLUL 3: PROPRIETATI STRUCTURALE
1 T 1 T 1 = 2 xi Lcxi = 2 xi σixi = . σi σi σi 122
Controlabilitatea
Din aceasta expresie concluzionam ca gramianul de controlabilitate asimptotic masoara efortul energetic al sistemului pentru a transfera originea pe sfera unitate (cu cat Gramianul este mai mare – mai pozitiv – avem nevoie de o energie a comenzii mai mica). Valorile proprii ale gramianului pun in evidenta nivelele energetice ale sistemului si dau o procedura efectiva de reducere dimensionala. Subspatii controlabile Se introduc Rk :=
B
AB
k−1
... A
B
,
Rk := Im Rk ,
k ≥ 1,
numite matricea de controlabilitate respectiv subspatiul controlabil in k pasi (semnificatia numelui va deveni clara la studiul sistemelor cu timp discret). Rk poseda urmatoarele proprietati: a) Rk+1 = Im B + ARk = Rk + Ak Im B, unde Ro := {0}; b) Ro ⊂ R1 ⊂ . . . Rk ⊂ . . . adica subspatiile formeaza un lant crescator. In limbaj CAPITOLUL 3: PROPRIETATI STRUCTURALE
123
Controlabilitatea
matricial avem rank Ro ≤ rank R1 ≤ · · · ≤ Rk ≤ · · · . Din finitudinea dimensionala rezulta ca aceste incluziuni nu pot fi stricte decat pentru un numar finit de subspatii (maxim n) si exista un subspatiu Rν , pentru un ν suficient de mare, care le va contine pe toate celelalte. Sa observam ca daca ν este cel mai mic indice pentru care Rν+1 = Rν atunci Rν+1 = Rν+2 = . . . = R. Acest indice ν se numeste indice de controlabilitate iar Rν = R := Im R adica Rν este exact subspatiul controlabil (al perechii (A, B)); c) R este A–invariant si contine Im B. Intr–adevar, avem ca R = Im B + AR; d) R este cel mai mic subspatiu A–invariant care contine Im B. Intr–adevar, fie V un spatiu A–invariant care contine Im B. Aratam prin inductie ca Rk ⊂ V de unde concluzia ca R ⊂ V. Deoarece Im B ⊂ V rezulta ca R1 ⊂ V. Presupunem ca Rk ⊂ V si aratam ca Rk+1 ⊂ V. Intr–adevar, Rk+1 = Im B + ARk . Dar Im B ⊂ V si ARk ⊂ V (deoarece V este A–invariant si din ipoteza Rk ⊂ V) de unde concluzia. Cu alte cuvinte, subspatiul controlabil R este solutia infimala in subspatii a ecuatiei T = Im B + AT CAPITOLUL 3: PROPRIETATI STRUCTURALE
124
Controlabilitatea
in necunoscuta T . Mai precis, R = inf{T |T = AT + Im B} = inf{T |AT ⊂ T
si Im B ⊂ T }.
Recapitulare: Subspatii invariante, spectru restrans la un subspatiu, operatii cu subspatii, suma directa, completari ortogonale etc. Ce inseamna ca subspatiul V de dimensiune ρ este A–invariant ? Avem AV ⊂ V iar daca V = Im V , unde V este o n × ρ matrice baza pentru V atunci automat AV = V J unde J este o matrice patrata ρ × ρ cu Λ(J) ⊂ Λ(A). Facand o completare pana la o matrice nesingulara S = V W si notand T := S −1 obtinem b := T AT −1 = A
CAPITOLUL 3: PROPRIETATI STRUCTURALE
A1 A3 O A2
125
. Controlabilitatea
Ce inseamna ca subspatiul V de dimensiune ρ este A–invariant si contine Im B ? Repetand schimbarea de coordonate si aplicand-o corespunzator si lui B avem b := T AT −1 = A
A1 A3 O A2
b = TB = B
,
B1 O
deoarece Im B ⊂ V. Cu aceasta schimbare de coordonate, matricea de controlab B) b este bilitate corespunzatoare a perechii (A, b= R
B1 A1B1 O O
A21B1 O
··· ···
An−1 B1 1 O
}ρ
.
Daca spatiul A–invariant (ce contine si Im B) in raport cu care s-a facut descompunerea este chiar R, atunci perechea (A1, B1) este automat controlabila si avem b = ρ = ν (indicele de controlabilitate). ca rank R = rank R Teorema 42 (Teorema de Descompunere Controlabila). Un sistem dinamic oarecare descris de (A, B, C, D), A ∈ Rn×n, B ∈ Rn×m, C ∈ Rp×n, D ∈ Rp×m este CAPITOLUL 3: PROPRIETATI STRUCTURALE
126
Controlabilitatea
b B, b C, b D) avand structura intotdeauna echivalent pe stare cu un sistem (A, b = T AT −1 = A
b = TB = B
B1 O
}ν , }n − ν
}ν }n − ν
A1 A3 O A2 |{z} |{z} ν n−ν
b = CT −1 = C
(40)
,
C1 C2 , |{z} |{z} ν n−ν
(41)
in care perechea (A1, B1) este controlabila. Mai mult, sistemele (A, B, C, D), b B, b C, b D) si (A1, B1, C1, D) sunt echivalente intrare–iesire, i.e., (A, T (s) =
A B C D
CAPITOLUL 3: PROPRIETATI STRUCTURALE
=
"
b B b A b D C
#
=
127
A1 B1 C1 D
.
Controlabilitatea
Observatii: a) Teorema afirma in particular ca dandu-se un sistem dinamic putem intotdeauna gasi un alt sistem echivalent intrare–iesire care este controlabil (avand dimensiunea spatiului starilor mai mica sau egala cu cea a sistemului initial). b) Obtinerea descompunerii controlabile se bazeaza in mod esential pe matricea S = T −1 care se poate obtine facand o completare pana la o inversabila a oricarei baze V a subspatiului controlabil R = Im R (consecinte procedurale). c) Proprietatea de controlabilitate este invarianta in raport cu relatia de echivalenta pe stare. Mai precis, un sistem este controlabil daca si numai daca orice sistem echivalent pe stare este controlabil. Criteriul lui Popov–Belevitch–Hautus (PBH) Folosind teorema de descompunere controlabila se poate obtine un criteriu extrem de util pentru testarea controlabilitatii unei perechi (A, B). Teorema 43 (Criteriul lui Hautus). Perechea (A, B), A ∈ Rn×n, B ∈ Rn×m, este CAPITOLUL 3: PROPRIETATI STRUCTURALE
128
Controlabilitatea
controlabila daca si numai daca rank
sI − A B
∀s ∈ C.
= n,
(42)
Demonstrat¸ie. Necesitatea: Pp prin absurd ca (42) nu este satisfacuta. Atunci exista s0 ∈ C si un vector x0 6= 0, x0 ∈ Cn a.i. xT0 De aici rezulta imediat ca xT0 R
=
xT0
s0 I − A B
B
AB
= 0.
n−1
...A
B
=0
si deci perechea (A, B) nu este controlabila intrucat rank R < n. Suficienta: Pp din nou prin reducere la absurd ca (A, B) nu este controlabila CAPITOLUL 3: PROPRIETATI STRUCTURALE
129
Controlabilitatea
(ν < n). Atunci conform teoremei de descompunere controlabila exista un sistem echivalent pe stare avand perechea (A1, B1) controlabila. Avem succesiv rank
sI − A B
−1
T O = rank T sIn − A B O I sIν − A1 −A3 B = rank . O sIn−ν − A2 O
Rangul ultimei matrici este insa mai mic decat n pentru orice s ∈ Λ(A2) ceea ce contrazice (42). Observatii: a) Pentru a decide controlabilitatea unei perechi (A, B) este suficient sa testam criteriul lui Hautus pentru s ∈ Λ(A). Intr–adevar, pentru s ∈ C − Λ(A) avem automat rank (sI − A) = n si deci criteriul este indeplinit. b) Observatia de mai sus justifica introducerea de valoare proprie (sau mod) controlabila/necontrolabila: O valoare proprie a lui A s.n. controlabila (necontrolabila) daca satisface (nu satisface) criteriul lui Hautus. Din teorema de descompunere CAPITOLUL 3: PROPRIETATI STRUCTURALE
130
Controlabilitatea
controlabila rezulta imediat ca o valoare proprie λ a lui A este controlabila (necontrolabila) daca si numai daca λ ∈ Λ(A1) (λ ∈ Λ(A2)). c) Din demonstratia de mai sus rezulta ca daca doua sisteme (A, B, C, D) si e B, e C, e D) e sunt echivalente pe stare cu matricea de echivalenta T atunci matri(A, e satisfac cile de controlabilitate corespunzatoare R si R e = T R. R
“Controlabilitatea este o proprietate generica” Teorema 44. Fie Fn,m := {(A, B)|A ∈ Rn×n, B ∈ Rn×m} familia tuturor perechilor (A, B) cu n si m fixati. Submultimea M ⊂ F a perechilor necontrolabile formeaza o suprafata algebrica iar submultimea perechilor controlabile n2 +nm este densa in R . Cu alte cuvinte, controlabilitatea este o proprietate generica in F (o pereche (A, B) selectata la intamplare din F este controlabila sau, echivalent, probabilitatea de a selecta o pereche necontrolabila este nula). Nul Controlabilitate CAPITOLUL 3: PROPRIETATI STRUCTURALE
131
Controlabilitatea
Am vazut ca proprietatea de controlabilitate exprima esentialmente capacitatea de a aduce un sistem din origine intr-o stare arbitrara. Introducem acum conceptul de nul controlabilitate (cu consecinte interesante in special in cazul sistemelor cu timp discret). Definitia 45. O stare x ∈ Rn se numeste nul controlabila la momentul t fixat daca exista o comanda u(·) care transfera starea x0 = x in starea x(t) = 0 (in origine). Exercitii: a) Aratati ca o stare este controlabila daca si numai daca este nul controlabila. b) Perechi cu matricea B monica. (Explicitare)
CAPITOLUL 3: PROPRIETATI STRUCTURALE
132
Controlabilitatea
2. Observabilitatea Observabilitatea este o proprietate calitativa a sistemului x(t) ˙ = Ax(t) + Bu(t), x(0) = xo y(t) = Cx(t) + Du(t),
(43)
de a determina o stare din prelucrarea marimii masurate y. Pentru observabilitate este relevanta evolutia sistemului in regim liber, i.e., sub comenzi externe nule, x(t) ˙ = Ax, y = Cx,
x(0) = xo,
(44)
deci observabilitatea este o proprietate in caracterizarea careia intervine numai perechea de matrici (C, A) – observati ordinea in pereche – . Din (44) rezulta y(τ ) = CeAτ xo, CAPITOLUL 3: PROPRIETATI STRUCTURALE
τ ≥ 0. 133
(45) Observabilitatea
Stare/Sistem Observabil(a) Pentru studiul observabilitatii este mai simplu sa introducem notiunea de stare neobservabila in loc de cea de stare observabila. Definitia 46. O stare x ∈ Rn se numeste neobservabila la momentul t > 0 daca pentru x(0) = x regimul liber al iesirii y este identic zero pe intervalul [0, t], i.e., y(τ ) = 0, 0 ≤ τ ≤ t, cu y(τ ) furnizat de (45). Notiunea de stare observabila se obtine prin negarea definitiei de mai sus. Gramian de Observabilitate Pentrul studiul observabilitatii se introduce Gramianul de Observabilitate la momentul t > 0 definit de Lo(t) =
Z
t
T
eA τ C T CeAτ dτ.
(46)
0
CAPITOLUL 3: PROPRIETATI STRUCTURALE
134
Observabilitatea
Observatii: a) Lo(t) = Lo(t)T ; b) Lo(t) ≥ 0; c) Se poate obtine din nou o descompunere ortogonala a lui Rn in raport cu Ker Lo si Im Lo. Caracterizarea Observabilitatii prin Gramianul de Observabilitate Teorema 47. Fie t > 0 fixat (se poate si t ≥ 0). Starea x este neobservabila la momentul t > 0 daca si numai daca x ∈ Ker Lo(t). Mai mult, daca o stare este neobservabila la un t > 0 atunci este neobservabila la orice alt moment de timp T > 0. Demonstrat¸ie. Necesitatea: Presupunem ca x este neobservabila la momentul t > 0 adica y(τ ) = CeAτ x = 0, 0 ≤ τ ≤ t. De aici rezulta T
2
0 = y (t)y(t) = ky(t)k =
Z
t
T AT τ
x e
C T CeAτ xdτ = xT Lo(t)x,
(47)
0
de unde rezulta ca Lo(t)x = 0 sau inca x ∈ Ker Lo(t), q.e.d. CAPITOLUL 3: PROPRIETATI STRUCTURALE
135
Observabilitatea
Suficienta: Avem x ∈ Ker Lo(t) de unde rezulta xT Lo(t)x = 0 si folosind lantul de egalitati din (47) obtinem ky(τ )k2 = 0, 0 ≤ τ ≤ t. Sa observam in plus ca deoarece y(τ ) este analitica si nula pe un interval inchis nenul rezulta ca y(T ) = 0 pentru orice T > 0, q.e.d.
Din cele discutate mai sus am vazut ca (ne)observabilitatea unei stari nu depinde de momentul de timp. In continuare vom obtine o caracterizare a subspatiului starilor neobservabile pe baza matricii de observabilitate – notiune duala celei de matrice de controlabilitate.
Caracterizarea Observabilitatii prin Matricea de Observabilitate CAPITOLUL 3: PROPRIETATI STRUCTURALE
136
Observabilitatea
Introducem matricea de observabilitate asociata unui sistem dinamic :
Q :=
C CA CA2 .. CAn−1
(48)
(sau mai precis unei perechi matriciale (C, A), C ∈ Rp×n, A ∈ Rn×n). Matricea de observabilitate are dimensiune (np) × n. Teorema 48. Fie t > 0 fixat. Atunci x ∈ Ker Lo(t) ⇔ x ∈ Ker Q =: Q, i.e., Ker Lo(t) = Q.
(49)
Demonstrat¸ie. Exercitiu (demonstratie similara celei date pentru Teorema 38). CAPITOLUL 3: PROPRIETATI STRUCTURALE
137
Observabilitatea
Observatii: a) Avem deci ca Ker Lo(t) = Ker Q,
∀t > 0.
b) O stare x ∈ Rn este observabila/neobservabila independent de momentul t > 0 – cu anumite precautii se poate lua t ≥ 0. Proprietatea este intrinseca starii x si perechii (C, A). c) Se poate introduce definitia echivalenta: o stare x s.n. neobservabila daca exista t > 0 pentru care x este neobservabila la acest moment. Introducem notiunea de sistem observabil (sau pereche (C, A) observabila) cu semnificatia ca fiecare stare x ∈ Rn, x 6= 0 este observabila. Avem atunci urmatorul rezultat central. Teorema 49. Fie perechea (C, A). 1. O stare x este neobservabila daca si numai daca x ∈ Q. 2. Perechea (C, A) (sau sistemul corespunzator) este observabila (observabil) daca si numai daca singura stare neobervabila este 0, i.e. Q = {0} (sau, echivalent, rank Q = n). CAPITOLUL 3: PROPRIETATI STRUCTURALE
138
Observabilitatea
Gramian de Observabilitate in Timp Infinit Daca matricea A este asimptotic stabila (Λ(A) ⊂ C−) atunci limt→∞ Lo(t) este finita, se noteaza cu Lo ∈ Rn×n = LTo ≥ 0 si este numita Gramian de Observabilitate asimptotic. El verifica automat ecuatia Lyapunov AT Lo + LoAT + C T C = 0 si are expresia Lo :=
Z
∞
AT τ
e
C T CeAτ dτ.
0
Observatii: a) Similar ca in cazul controlabilitatii, observabilitatea unui sistem se poate testa dpdv procedural verificand ca rank Q = n (matricea Q este monica – rang intreg pe coloane). b) Daca perechea (C, A) este observabila atunci automat Lo(t) > 0 si Lo > 0. Gramianul de observabilitate asimptotic se poate calcula ca solutia unica a ecuatiei Lyapunov respective. CAPITOLUL 3: PROPRIETATI STRUCTURALE
139
Observabilitatea
c) Daca x ∈ Rn arbitrara, atunci putem descompune unic x = xI + xK , unde xI ∈ Im Lo(t) si xK ∈ Ker Lo(t) (deoarece Rn := Im Lo(t) ⊕ Ker Lo(t)). Atunci y(t) = CeAtx = CeAtxI + CeAtxK = CeAtxI . Deci cu exceptia sistemelor din Ker Lo(t), toate celelalte “se vad” la iesire. Subspatii neobservabile Se introduc
C CA , Qk := .. CAk−1
Nk := Ker Qk ,
k ≥ 1,
numite matricea de observabilitate respectiv subspatiul neobservabil in k pasi. Nk poseda urmatoarele proprietati: CAPITOLUL 3: PROPRIETATI STRUCTURALE
140
Observabilitatea
a) Nk = ∩ki=1Ker CAi−1 = ∩ki=1A−i+1Ker C (A−1 semnifica aici preimaginea si nu inversa !); b) Nk+1 = Ker C ∩ A−1Nk ; c) . . . ⊂ N2 ⊂ N1 ⊂ N0 := Rn adica subspatiile neobservabile Nk formeaza un lant descrescator. De aici rezulta ca exista un intreg µ, n ≥ µ ≥ 0, a.i. . . . Nµ+2 = Nµ+1 = Nµ 6= Nµ−1 6= . . . 6= N1 6= N0 sau pe scurt lim Nk = Nµ = Nn.
k→∞
Intregul µ se numeste indice de observabilitate iar Nµ = Nn se numeste subspatiul neobservabil a perechii (C, A). Avem ca N = Ker Q. CAPITOLUL 3: PROPRIETATI STRUCTURALE
141
Observabilitatea
In limbaj matricial obtinem 0 < rank Q1 < rank Q2 < rank Qµ = rank Qµ+1 = . . . . d) Din cele de mai sus obtinem ca N = Ker C ∩ A−1N sau inca AN ⊂ N , N ⊂ Ker C adica N este un subspatiu A–invariant continut in Ker C. Mai mult, se poate arata (exercitiu) ca N este cel mai mare subspatiu A–invariant continut in Ker C. Deasemenea, considerand ecuatia T = Ker C ∩ A−1T in necunoscuta T rezulta ca N este solutia sa supremala. CAPITOLUL 3: PROPRIETATI STRUCTURALE
142
Observabilitatea
Principiul Dualitatii Principiul dualitatii este un principiu fundamental in teoria sistemelor dinamice, aratand in ce conditii anumite proprietati structurale sunt echivalente. Teorema 50 (Principiul dualitatii). Subspatiul controlabil in k pasi al perechii (A, B) este complementul ortogonal al subspatiului neobervabil in k pasi al perechii (B T , AT ), i.e. Rk (A, B) = Nk (B T , AT )⊥. In particular, perechea (A, B) este controlabila daca si numai daca perechea (B T , AT ) este observabila. Pe baza principiului dualitatii se pot formula dualele tuturor rezultatelor obtinute in cazul controlabilitatii. Teorema 51 (Criteriul PBH). Perechea (C, A), C ∈ Rp×n, A ∈ Rn×n , este CAPITOLUL 3: PROPRIETATI STRUCTURALE
143
Observabilitatea
observabila daca si numai daca rank
sI − A C
∀s ∈ C.
= n,
(50)
Prin dualitate se introduc notiunile de valoare proprie (sau mod) observabil/neobservabil. Dam in continuare teorema de descompunere observabila in doua forme complet echivalente. Teorema 52 (Teorema de Descompunere Observabila). Un sistem dinamic oarecare descris de (A, B, C, D), A ∈ Rn×n, B ∈ Rn×m, C ∈ Rp×n, D ∈ Rp×m este b B, b C, b D) avand structura intotdeauna echivalent pe stare cu un sistem (A, b = T AT −1 = A
CAPITOLUL 3: PROPRIETATI STRUCTURALE
A1 A3 O A2 |{z} |{z} n−µ µ
}n − µ }µ
144
,
Observabilitatea
b = TB = B
B1 B2
}n − µ , }µ
b = CT −1 = C
O C2 , |{z} |{z} n−µ µ in care perechea (C2, A2) este observabila. Mai mult, sistemele (A, B, C, D), b B, b C, b D) si (A2, B2, C2, D) sunt echivalente intrare–iesire, i.e., (A, T (s) =
A B C D
=
"
b B b A b D C
#
=
A2 B2 C2 D
.
Teorema 53 (Teorema de Descompunere Observabila – varianta). Un sistem dinamic oarecare descris de (A, B, C, D), A ∈ Rn×n, B ∈ Rn×m, C ∈ Rp×n, b B, b C, b D) avand D ∈ Rp×m este intotdeauna echivalent pe stare cu un sistem (A, structura }µ b = T AT −1 = A1 O A A3 A2 }n − µ , |{z} |{z} µ n−µ CAPITOLUL 3: PROPRIETATI STRUCTURALE
145
Observabilitatea
b = TB = B
B1 B2
}µ , }n − µ
b = CT −1 = C
C1 O , |{z} |{z} µ n−µ
in care perechea (C1, A1) este observabila. Mai mult, sistemele (A, B, C, D), b B, b C, b D) si (A1, B1, C1, D) sunt echivalente intrare–iesire, i.e., (A, T (s) =
A B C D
CAPITOLUL 3: PROPRIETATI STRUCTURALE
=
"
b b B A b D C
#
=
146
A1 B1 C1 D
.
Observabilitatea
3. Teorema de Descompunere Structurala
Avem intai nevoie de reamintirea catorva rezultate de algebra matriciala: • Ecuatie Sylvester; • Subspatiu A–invariant si consecinte. Consideram un sistem definit de (A, B, C, D). Fie R subspatiul controlabil al perechii (A, B) si N subspatiul neobservabil al perechii (C, A). Fie X1 := R ∩ N
(51)
si introducem subspatiile X2 si X3 ca fiind complementii lui X1 in R si respectiv N , i.e., R = X1 ⊕ X2 , (52) N = X1 ⊕ X3 . CAPITOLUL 3: PROPRIETATI STRUCTURALE
(53) 147
Teorema de descompunere structurala
Fie deasemenea X4 complementul lui R ∪ N in Rn, i.e., Rn = (R ∪ N ) ⊕ X4 = X1 ⊕ X2 ⊕ X3 ⊕ X4
(54)
Subspatiile X2, X3 si X4 nu sunt unic definite. Deoarece AR ⊂ R,
Im B ⊂ R
(55)
AN ⊂ N ,
N ⊂ Ker C
(56)
AX1 ⊂ X1,
X1 ⊂ Ker C.
(57)
rezulta ca Fie Xi matrici baza pentru subspatiile Xi (i=1...4), Xi =< Xi > si T := CAPITOLUL 3: PROPRIETATI STRUCTURALE
X1 X2 X3 X4
−1
148
.
(58) Teorema de descompunere structurala
Atunci sistemul echivalent pe stare fata de transformarea (57) are forma
A11 O −1 b A = T AT = O O b = CT −1 = O C2 C
A12 A13 A22 O O A33 O O O C4 ,
A14 A24 , A34 A44
B1 B2 b B = TB = O O
(59)
structura ce rezulta din (51)-(58). Din teorema de descompunere controlabila rezulta ca perechea A11 A12 B1 , (60) O A22 B2
este controlabila iar din teorema de descompunere observabila rezulta ca perechea
CAPITOLUL 3: PROPRIETATI STRUCTURALE
C2 C4
,
A22 A24 O A44 149
(61) Teorema de descompunere structurala
este observabila. Aplicand criteriul PBH pentru perechea (60) rezulta rank
sI − A11 −A12 B1 O sI − A22 B2
= dim X1 + dim X2,
∀s ∈ C
de unde rezulta automat ca rank
sI − A2 B2
= dim X2,
∀s ∈ C
deci perechea (A22, B2) este controlabila. Aplicand criteriul PBH dual perechii (61) rezulta similar ca perechea (C2, A22) este observabila. In consecinta rezulta ca (sub)sistemul (A22, B2, C2, D) este controlabil si observabil (se mai numeste partea controlabila si observabila a sistemului initial) si inca
T (s) =
A B C D
CAPITOLUL 3: PROPRIETATI STRUCTURALE
=
"
b B b A b D C
#
=
150
A22 B2 C2 D
.
Teorema de descompunere structurala
Sintetizand cele de mai sus obtinem urmatorul rezultat remarcabil. Teorema 54 (Teorema de descompunere structurala). Orice sistem arbitrar b B, b C, b D) cu structura (59) (A, B, C, D) este echivalent pe stare cu un sistem (A, (unde unele blocuri pot avea dimensiune nula !) si echivalent intrare–iesire cu sistemul controlabil si observabil (A22, B2, C2, D).
CAPITOLUL 3: PROPRIETATI STRUCTURALE
151
Teorema de descompunere structurala
4. Realizabilitate Am vazut ca orice sistem dinamic descris de ecuatii de tipul x(t) ˙ = Ax(t) + Bu(t), x(to) = xo y(t) = Cx(t) + Du(t)
(62)
este automat invariant in timp, liniar, cauzal, finit dimensional. In particular, sistemul dinamic este un sistem de convolutie avand matrice de transfer data de T (s) = C(sI − A)−1B + D. Matricea de transfer descrie comportarea intrare–iesire in conditii initiale nule si este o matrice avand drept elemente functii rationale proprii. Problema naturala: Stiind ca matricea de transfer a unui sistem MIMO este rationala si proprie exista o descriere dinamica a sistemului de tipul (62) ? Mai CAPITOLUL 3: PROPRIETATI STRUCTURALE
152
Realizabilitate
precis, stiind ca T (s) este o matrice rationala proprie de dimensiune p × m exista intotdeauna patru matrici (A, B, C, D), unde A ∈ Rn×n, B ∈ Rn×m, C ∈ Rp×n, D ∈ Rp×m a.i. sistemul dinamic corespunzator (62) sa aibe matricea de transfer T (s), i.e., T (s) = C(sI − A)−1 B + D? Atunci cand exista, cele patru matrici (A, B, C, D) se numesc o realizare a rationalei T (s) (sau a sistemului avand ca matrice de transfer pe T (s)). INTREBARI NATURALE: • • • • • ! • •
Exista intotdeauna o realizare si daca da cum se poate obtine ? DA! Este realizarea unica ? NU ! Exista o realizare de dimensiune minima (maxima) ? DA (NU) ! Cum se pot caracteriza realizarile minimale ? Controlabile + observabile! Cum se pot obtine realizarile minimale ? Teorema de Descompunere Structurala Sunt realizarile minimale unice ? NU ! Ce relatie exista intre doua realizari minimale ? Sunt echivalente pe stare !
CAPITOLUL 3: PROPRIETATI STRUCTURALE
153
Realizabilitate
Problema existentei
Fie T (s) o p × m matrice rationala proprie data de
T (s) =
rij (s) pij (s)
1≤i≤p 1≤j≤m
,
grad(pij ) ≥ grad(rij ),
∀i, j,
in care rapoartele se considera ireductibile. Deoarece rationala este proprie avem ca D := T (∞) ∈ Rp×m (finit). Problema realizabilitatii rationalei proprii T (s) se reduce atunci la problema realizabilitatii rationalei strict proprii Te(s) = T (s) − D, i.e., trebuie sa gasim trei matrici (A, B, C) a.i.
CAPITOLUL 3: PROPRIETATI STRUCTURALE
Te(s) = C(sI − A)−1B. 154
Realizabilitate
Deoarece Te(s) este strict proprie avem
k−1 + K s + . . . + K s K 0 1 k−1 Te(s) = γ0 + γ1s + . . . + γk−1sk−1 + sk
(63)
unde γ(s) := γ0 + γ1s + . . . + γk−1sk−1 + sk este cel mai mic multiplu comun (monic) al numitorilor tuturor elementelor rationalei Te(s) iar Ki, i = 0, . . . , k − 1, sunt p × m matrici constante. O realizare a lui Te(s) este data de
A=
Om
Im
... Im
−γ0Im −γ1Im . . . −γk−1Im
CAPITOLUL 3: PROPRIETATI STRUCTURALE
Om .. ,B = , C = K0 K1 . . . Kk− Om Im (64) 155
Realizabilitate
Intr–adevar, cu
Im sIm Θ(s) := .. sk−1Im
se verifica direct ca
(sI − A)Θ(s) = Bγ(s) sau inca
Θ(s) = (sI − A)−1B. γ(s)
(65)
Cum CΘ(s) = K0 + K1s + . . . + Kk−1sk−1 inmultind (65) la stanga cu C si tinand cont de (63) obtinem Te(s) = C(sI − A)−1 B. Realizarea (A, B, C, D) astfel obtinuta este controlabila si de aceea se mai numeste realizarea standard controlabila a lui T (s). Controlabilitatea perechii (A, B) se poate testa imediat cu criteriul PBH. In general, realizarea obtinuta nu CAPITOLUL 3: PROPRIETATI STRUCTURALE
156
Realizabilitate
este insa observabila (poate fi!). O realizare standard observabila este data de
−γ0Ip K0 K1 −γ1Ip .. .. ... ,B = , C = Op Op . . . Ip . Ip −γk−1Ip Kk−1 (66) Aceasta realizare nu este in general controlabila. Om Ip A=
Observatie: Pentru matrici de transfer rationale de dimensiuni arbitrare nu exista in general posibilitatea sa scriem direct o realizare care sa fie simultan controlabila si observabila. Coeficienti Markov si Matrici Hankel Studiem acum relatiile care exista intre doua realizari ale unei matrici rationale proprii. In primul rand este clar ca cele doua matrici ”D” sunt egale. Dezvoltand Te(s) in serie Laurent in jurul punctului s = ∞ obtinem pentru ksk > r, unde r CAPITOLUL 3: PROPRIETATI STRUCTURALE
157
Realizabilitate
este ales suficient de mare, Te(s) = Γ1s−1 + Γ2s−2 + . . . .
(67)
Identificand coeficientii din (67) cu ajutorul lui (63) obtinem Kk−1 Kk−2 ... K0 0
= = ... = =
Γ1 Γ2 + γk−1Γ1 ... Γk + γk−1 Γk−1 + . . . + γ1Γ1 Γk+i + γk−1 Γk−1+i + . . . + γ0Γi,
i ≥ 1.
Coeficientii matriceali Γi ∈ Rp×m, i ≥ 1, s.n. coeficientii Markov ai matricei rationale T (s). Daca (A, B, C, D) este o realizare a lui T (s) atunci avem C(sI − A)−1B + D = D + CBs−1 + CABs−2 + CA2Bs−3 + . . . , CAPITOLUL 3: PROPRIETATI STRUCTURALE
158
(68) Realizabilitate
pentru ksk > rA, unde rA este raza spectrala a matricei A. Coeficientii D si CAi−1 B, i ≥ 1, se numesc coeficientii Markov ai sistemului (realizarii) (A, B, C, D). Identificand coeficientii in (67) si (68) obtinem Γo := D,
Γi = CAi−1B,
∀i ≥ 1.
(69)
Deci toate realizarile lui T (s) au aceeasi coeficienti Markov, identici cu cei ai lui T (s). Introducem matricile de tip Hankel
Γ1 Γ2 . . . Γj CB Γ2 Γ3 . . . Γj+1 CAB = Hij = .. .. Γi Γi+1 . . . Γj+i−1 CAi−1 B CAPITOLUL 3: PROPRIETATI STRUCTURALE
159
CAB CA2B CAiB
... ...
j−1
CA B CAj B . . . CAj+i−2B (70) Realizabilitate
C CA i−1 = (71) .. B AB . . . A B = QiRj i ≥ 1, j ≥ 1, CAi−1B unde Rj este matricea de controlabilitate in j pasi si Qi este matricea de observabilitate in i pasi. Din aceasta relatie rezulta ca pentru orice doua realizari e B, e C, e D) ale aceluiasi T (s) avem (A, B, C, D) si (A, e iR ej , QiRj = Q
∀i ≥ 1, j ≥ 1.
(72)
Observatie: Matricile Hankel cu toate ca au dimensiuni arbitrar de mari au totusi rangul marginit de n. Acest lucru rezulta din ultima egalitate din (71). Realizari minimale Definitia 55. O realizare (A, B, C, D) a rationalei proprii T (s) se numeste minimala daca orice alta realizare are dimensiunea spatiului starilor mai mare sau egala cu aceasta. CAPITOLUL 3: PROPRIETATI STRUCTURALE
160
Realizabilitate
Teorema 56. O realizare este minimala daca si numai daca este controlabila si observabila. Demonstrat¸ie. Conditia este necesara. P.p. prin reducere la absurd ca realizarea minimala (A, B, C, D) de dimensiune n nu este controlabila si/sau observabila. Atunci printr–o transformare de echivalenta aducem sistemul la forma din teorema de descompunere structurala si rezulta ca realizarea (A22, B2, C2, D) are dimensiune strict mai mica ceea ce contrazice ipoteza de minimalitate a realizarii originale. Conditia este suficienta. Presupunem ca realizarea (A, B, C, D) de dimensiune n este controlabila si observabila. Atunci rank Rn = rank Qn = n rezultand in continuare ca rank QnRn = rank Rn − dim(Im Rn ∩ Ker Qn) = n. CAPITOLUL 3: PROPRIETATI STRUCTURALE
161
(73) Realizabilitate
P.p. prin absurd ca (A, B, C, D) nu este minimala. Atunci exista o realizare e B, e C, e D) de dimensiune n (A, e cu Din (72) rezulta ca
n e < n.
e nR en = rank QnRn rank Q en ≤ n en ≤ n ceea ce este absurd intrucat rank Q e si rank R e.
Teorema 57. Oricare doua realizari minimale ale unei matrici de transfer proprii T (s) sunt echivalente pe stare. e B, e C, e D) doua realizari minimale ale lui Demonstrat¸ie. Fie (A, B, C, D) si (A, T (s). Conform teoremei precedente, ambele realizari au aceeasi dimensiune n si sunt controlabile si observabile. Din (71) avem
CAPITOLUL 3: PROPRIETATI STRUCTURALE
en+1 e nR QnRn+1 = Q
162
(74) Realizabilitate
sau inca Qn
B
ARn
en =Q
h
e B
e e nB, QnB = Q
eR en A
i
de unde rezulta
eR en . e nA QnARn = Q
(75)
e Tn Q e n este nesingulara si din prima relatie din e n este monica atunci Q Deoarece Q (75) rezulta e = TB B (76) unde
eT Q e n)−1Q e T Qn ∈ Rn×n. T := (Q n n
en este epica rezulta ca R en R enT este nesingulara si din a doua Similar, deoarece R egalitate din (75) rezulta ca e = T AS A (77) unde
enT (R enT )−1 ∈ Rn×n. en R S = Rn R
CAPITOLUL 3: PROPRIETATI STRUCTURALE
163
Realizabilitate
Din (74) rezulta ca
C CA Rn AnB = ..
eR en sau inca de unde CRn = C
e C h i en A enB e eA e R C ..
e = CS. C (78) Din (76), (77) si (78) rezulta ca cele doua realizari sunt echivalente pe stare daca aratam ca S = T −1. Intr–adevar, e Tn Q e n)−1Q e Tn QnRnR enT (R enR enT )−1 = (Q e Tn Q e n)−1 Q e Tn Q e nR enR enT (R enR enT )−1 = I. T S = (Q Teorema 58. Fie µ si ν cei mai mici intregi pentru care rank Hµ,ν = rank Hµ+i,ν+j . Atunci ν = µ = n, unde n este dimensiunea realizarii minimale. CAPITOLUL 3: PROPRIETATI STRUCTURALE
164
Realizabilitate
Demonstrat¸ie. Rezulta automat din (71). Observatie: Pentru orice sistem descris de matrice de transfer rationala proprie T (s) putem calcula coeficientii Markov (unici) Γi pe baza descompunerii (67). Mai mult, daca stim o realizare (A, B, C, D) a sistemului dinamic cu matricea de transfer T (s), atunci coeficientii Markov se pot calcula pe baza expresiilor explicite (69). Mai mult, coeficientii Markov determina unic sirul dublu indexat de matrici Hankel Hij care au rang finit egal cu n, pentru i, j ≥ n, unde n este dimensiunea unei realizari minimale. Problema inversa (fundamentala): Presupunand acum ca avem un sir de coeficienti Markov Γi ∈ Rp×m, i ≥ 0, se pune problema fireasca daca exista intotdeauna un sistem dinamic care are acesti coeficienti Markov ? Mai exact, seria din membrul drept din (67) converge intotdeauna la o rationala proprie ce este matricea de transfer a unui sistem (A, B, C, D) ? Sau, echivalent, exista intotdeauna matricile (A, B, C, D) de dimensiuni potrivite a.i. sa aibe loc relatiile (69) ? Raspuns: NU (in general)! Rezultatul urmator da un raspuns complet acestei CAPITOLUL 3: PROPRIETATI STRUCTURALE
165
Realizabilitate
probleme. Teorema 59. Fie un sir de matrici reale Γi ∈ Rp×m, i ≥ 0, pentru care exista j ≥ 1 a.i. Γj 6= 0. Atunci exista o p × m matrice rationala proprie T (s) ai carei coeficienti Markov sunt exact elementele sirului Γi daca si numai daca exista un intreg n ≥ 1 a.i. n = rank Hn+i,n+j ,
∀i, j ≥ 0.
(79)
In cazul in care (79) are loc, intregul n ≥ 1 se numeste gradul McMillan al rationalei T (s). Observatie (fundamentala): Gradul McMillan al unei rationale proprii T (s) coincide cu dimensiunea unei realizari minimale. Corolarul 60. Functia f : N → Rp×m cu f (i) = Γi, i ≥ 0, este z–transformabila (are transformata z) si transformata z este o matrice rationala proprie daca si numai daca este indeplinita conditia (79).
CAPITOLUL 3: PROPRIETATI STRUCTURALE
166
Realizabilitate
Procedura de obtinere a unei realizari minimale pentru o matrice rationala proprie
T (s) =
rij (s) pij (s)
1≤i≤p 1≤j≤m
,
grad(pij ) ≥ grad(rij ),
∀i, j.
Pasul 0: Se pune D := T (∞) si se aduce matricea rationala (strict proprie) Te(s) := T (s) − D la forma k−1 + K s + . . . + K s K 0 1 k−1 Te(s) = γ0 + γ1s + . . . + γk−1sk−1 + sk
(80)
unde γ(s) := γ0 + γ1s + . . . + γk−1sk−1 + sk este cel mai mic multiplu comun (monic) al numitorilor tuturor elementelor rationalei Te(s) iar Ki, i = 0, . . . , k − 1, sunt p × m matrici constante. CAPITOLUL 3: PROPRIETATI STRUCTURALE
167
Realizabilitate
Pasul 1: Se scrie realizarea standard controlabila
Om
Im
Om ... .. A= , B = Om , C = K0 K1 . . . Kk− Im −γ0Im −γ1Im . . . −γk−1Im Im (81) in care perechea (A, B) este automat controlabila. Pasul 2: Se aplica teorema de descompunere observabila perechii (C, A) si se obtine }n − µ b = T AT −1 = A1 A3 A O A2 }µ , |{z} |{z} B1 }n − µ n − µ b µ −1 b B = TB = , C = CT = O C2 , B2 }µ |{z} |{z} n−µ µ in care perechea (C2, A2) este observabila. CAPITOLUL 3: PROPRIETATI STRUCTURALE
168
Realizabilitate
Pasul 3: Deoarece perechea (A, B) este controlabila, rezulta automat ca b B) b si (A2, B2) sunt deasemenea controlabile. Prin urmare sistemul perechile (A, (A2, B2, C2, D) care este echivalent intrare–iesire cu sistemul original (A, B, C, D) este controlabil, observabil si deci minimal. Prin urmare (A2, B2, C2, D) este o realizare minimala pentru T (s) si T (s) = C2(sI − A2)−1B2 + D. Observatii: a) Din punct de vedere procedural, algoritmul de calcul al realizarii minimale urmeaza exact pasii de mai sus cu observatia ca transformarea T de la pasul 2 se alege intotdeauna ortogonala T −1 = T T . b) Pentru obtinerea unei realizari minimale se poate proceda dual, calculand la Pasul 1 o realizare standard observabila (66) si facand la Pasul 2 o descompunere controlabila (40)–(41).
CAPITOLUL 3: PROPRIETATI STRUCTURALE
169
Realizabilitate
5. Conexiunile Sistemelor Dinamice pe Stare si Operatii cu Sisteme
Consideram cateva posibile conexiuni standard ale sistemelor dinamice descrise prin intermediul realizarilor de stare si ne punem problema sa gasim o realizare de stare pentru sistemul echivalent rezultant. In particular, vom considera urmatoarele tipuri de conexiuni: serie, paralel, bucla cu reactie inversa, transformare liniar fractionara si produs Redheffer. Intocmai ca in cazul sistemelor cu o intrare si o iesire (SISO) anumite conexiuni pot sa nu fie definite (in sens general sau in sens strict) – cu semnificatia ca sistemul rezultant nu are matrice de transfer (vectorul marimilor de iesire nu este unic definit pentru un vector dat de marimi de intrare) sau matricea de transfer rezultanta nu este proprie (sistemul rezultant nu are o realizare standard de stare). Prin urmare vom spune ca o anumita conexiune a doua sisteme pe stare este bine definita daca sistemul rezultant este deasemenea un sistem pe spatiul starilor. CAPITOLUL 3: PROPRIETATI STRUCTURALE
170
Conexiuni si operatii
Buna definire a conexiunii implica deci ca sistemul rezultant are o matrice de transfer rationala care este proprie. Ca un exemplu relevant pentru discutia de mai sus sa consideram inversul unui sistem (A, B, C, D) – sistemul care are intrarile si iesirile inversate. Inversul exista daca si numai daca matricea D este inversabila iar o realizare a inversului este data x˙ I (t) = (A − BD −1C)xI (t) + BD −1uI (t), + D −1uI (t), yI (t) = −D −1CxI (t)
(82)
(uI (t) = y(t), yI (t) = u(t)) iar matricea de transfer este T −1(s) =
AI CI
BI DI
=
−1
A − BD C −D −1C
−1
BD D −1
.
(83)
Observatii: • Un sistem este inversabil daca si numai daca are acelasi numar de intrari si iesiri (p = m). • Ipoteza de inversabilitatea a lui D nu este necesara pentru existenta inversei CAPITOLUL 3: PROPRIETATI STRUCTURALE
171
Conexiuni si operatii
matricii de transfer T (vazuta ca matrice rationala) si este facuta doar pentru a asigura ca T −1(s) este proprie si deci este matricea de transfer a unui sistem pe spatiul starilor (AI , BI , CI , DI ). • Daca sistemul original este controlabil/observabil/minimal atunci realizarea inversului (83) este automat controlabila/observabila/minimala. – Exercitiu! Conexiunea paralel Fie doua sisteme
x˙ 1 (t) = A1x1 (t) + B1u1(t), y1 (t) = C1x1 (t) + D1u1(t),
(84)
si
x˙ 2 (t) = A2x2 (t) + B2u2(t), y2 (t) = C2x2 (t) + D2u2(t), avand matricile de transfer T1 =
A1 B1 C1 D1
CAPITOLUL 3: PROPRIETATI STRUCTURALE
,
T2 =
A2 B2 C2 D2 172
(85)
,
(86) Conexiuni si operatii
respectiv. Daca cele doua sisteme au acelasi numar de intrari si iesiri (m1 = m2, p1 = p2), atunci se defineste conexiunea paralel a lui T1 cu T2 ca fiind sistemul care are intrarea u obtinuta punand u1 ≡ u2 = u si iesirea y := y1 + y2. Conexiunea paralel este intotdeauna bine definita, matricea de transfer a sistemului rezultant este T (s) := T1(s) + T2(s), (87) avand o realizare data de
A1 O B1 . B2 T (s) = O A2 C1 C2 D1 + D2
(88)
Conexiunea serie Fie doua sisteme (84) si (85), avand matricile de transfer date in (86). Daca numarul de iesiri ale sistemului T1 este egal cu numarul de intrari ale sistemului CAPITOLUL 3: PROPRIETATI STRUCTURALE
173
Conexiuni si operatii
T2 atunci se defineste conexiunea serie a lui T1 cu T2 (in aceasta ordine) ca fiind sistemul cu intrarea u := u1 si iesirea y := y2, obtinut punand u2 ≡ y1. Conexiunea serie este intotdeauna bine definita, matricea de transfer a sistemului rezultant este T (s) := T2(s)T1(s), (89) (observati ordinea !) iar o realizare pentru sistemul rezultant este data de
A2 B2C1 B2D1 A1 B1 . T (s) = O C2 D2C1 D2D1
(90)
Conexiunea in reactie inversa Fie doua sisteme (84) si (85), avand matricile de transfer date in (86). Daca numarul de iesiri ale sistemului T1 este egal cu numarul de intrari ale sistemului T2 si numarul de iesiri ale sistemului T2 este egal cu numarul de intrari ale sistemului CAPITOLUL 3: PROPRIETATI STRUCTURALE
174
Conexiuni si operatii
T1 (p1 = m2, p2 = m1) atunci se defineste conexiunea in reactie inversa a lui T1 cu T2 (in aceasta ordine) ca fiind sistemul cu intrarea u si iesirea y := y1 , obtinut punand u1 ≡ u + y2 si u2 ≡ y1. Conexiunea in reactie inversa este intotdeauna bine definita daca si numai daca matricea I D1 (91) D2 I este nesingulara. In acest caz functia de transfer a sistemului echivalent este T (s) := T1(s)(I − T2(s)T1(s))−1, iar o realizare pentru sistemul rezultant este A1 + B1D2Sb−1C1 B1S −1C2 B1S −1 −1 −1 b−1C1 S B A + B D S C B D S 2 2 2 1 2 2 1 T (s) = Sb−1C1 Sb−1D1C2 D1S −1 CAPITOLUL 3: PROPRIETATI STRUCTURALE
175
(92)
,
(93)
Conexiuni si operatii
unde Sb := I − D1D2 si S := I − D2D1 care sunt ambele inversabile din ipoteza de nesingularitate a matricii (91). Exercitiu: Ce se poate spune despre controlabilitatea/observabilitatea/minimalitatea sistemului echivalent paralel/serie/reactie inversa daca stim ca sistemele componente sunt controlabile/observabile/minimale ? Observatie: Pentru conexiunile paralel/serie/reactie inversa nu este necesar ca spatiul starilor sistemelor componente sa fie de dimensiune egala. Transformare liniar fractionara (TLF) Aceste conexiuni pot fi privite ca o extensie la clasa sistemelor (sau mai precis la clasa functiilor matriceale rationale) a transformari liniar fractionare (sau Moebius) din cazul scalar a + bλ f (λ) = , c + dλ unde a, b, c, d sunt scalari. CAPITOLUL 3: PROPRIETATI STRUCTURALE
176
Conexiuni si operatii
Fie doua sisteme date de x˙ = Ax + B1u1 + B2u2, y1 = C1x + D11u1 + D12u2, y2 = C2x + D21u1 + D22u2,
(94)
x˙ c = Acxc + Bcuc, yc = Ccxc + Dcuc,
(95)
si avand matricile de transfer T (s) =
T11(s) T12(s) T21(s) T22(s)
si Tc(s) = CAPITOLUL 3: PROPRIETATI STRUCTURALE
A B1 B2 = C1 D11 D12 C2 D21 D22
Ac Bc Cc Dc
.
177
(96)
(97) Conexiuni si operatii
Un sistem de tipul (96) se numeste sistem generalizat si are intrarile si iesirile partitionate in doua clase avand anumite semnificatii in controlul automat. Daca T22 are numarul de intrari/iesiri egal cu numarul de iesiri/intrari ale lui Tc (mc = p2, pc = m2) atunci de defineste transformarea liniar fractionara inferioara (TLFI) a lui T cu Tc (in aceasta ordine) ca fiind sistemul cu intrarea u := u1 si iesirea y := y1 obtinut punand u2 ≡ yc si uc ≡ y2. Conexiunea este bine definita daca si numai daca matricea
I D22 Dc I
(98)
este inversabila si in acest caz matricea de transfer a sistemului rezultant echivalent este TR = T LF I(T, Tc) := T11 + T12Tc(I − T22Tc)−1T21, CAPITOLUL 3: PROPRIETATI STRUCTURALE
178
(99) Conexiuni si operatii
si are o realizare data de
e−1
e−1
e−1
A + B2S DcC2 B2S Cc B1 + B2S DcD21 −1 −1 −1 B S C A + B S D C B S D , c 2 c c 22 c c 21 TR(s) = C1 + D12DcS −1C2 D12Se−1Cc D11 + D12DcS −1D21 (100) unde S := I − D22Dc si Se := I − DK D22 care sunt ambele inversabile din ipoteza de inversabilitate asupra matricii (98). In particular avem DcS −1 = Se−1Dc si S −1D22 = D22Se−1 asa cum rezulta din identitatea matriciala U (I − V U )−1 = (I − U V )−1 U care are loc pentru oricare matrici U si V de dimensiuni compatibile. Consideram din nou doua sisteme (94) si (95) avand matricile de transfer (96) si (97). Daca T11 are numarul de intrari/iesiri egal cu numarul de iesiri/intrari ale lui Tc (mc = p1, pc = m1) atunci se defineste transformarea liniar fractionara superioara (TLFS) a lui T cu Tc (in aceasta ordine) ca fiind sistemul cu intrarea u := u2 si iesirea y := y2 obtinut punand u1 ≡ yc si uc ≡ y1. Conexiunea este CAPITOLUL 3: PROPRIETATI STRUCTURALE
179
Conexiuni si operatii
bine definita daca si numai daca matricea I D11 Dc I
(101)
este inversabila si in acest caz matricea de transfer a sistemului rezultant echivalent este TR = T LF S(T, Tc) := T22 + T21Tc(I − T11Tc)−1T12, (102) si are o realizare data de e −1DcC1 e −1Cc e −1DcD12 B1 U B2 + B1 U A + B1 U −1 −1 −1 B U C A + B U D C B U D , c 1 c c 11 c c 12 TR = e −1Cc C2 + D21DcU −1C1 D21U D22 + D21DcU −1D12 (103) e := I − DcD11 care sunt ambele inversabile unde am notat U := I − D11Dc si U e −1Dc intrucat matricea (101) este inversabila. Avem deasemenea ca DcU −1 = U e −1. si U −1D11 = D11U CAPITOLUL 3: PROPRIETATI STRUCTURALE
180
Conexiuni si operatii
Produs Redheffer Aceasta conexiune este o extensie a transformarii liniar fractionare. Consideram doua sisteme generalizate (94) si Acxc + Bc1uc1 + Bc2uc2, x˙ c = yc1 = Cc1 xc + Dc11uc1 + Dc12uc2, yc2 = Cc2 xc + Dc21uc1 + Dc22uc2,
(104)
avand matricile de transfer date de (96) si respectiv
Tc =
Tc11 Tc12 Tc21 Tc22
Ac Bc1 Bc2 = Cc1 Dc11 Dc12 . Cc2 Dc21 Dc22
(105)
Daca T22 are numarul de intrari/iesiri egal cu numarul de iesiri/intrari ale lui Tc11 (mc1 = p2, pc1 = m2) atunci se defineste produsul Redheffer al lui T cu Tc (in CAPITOLUL 3: PROPRIETATI STRUCTURALE
181
Conexiuni si operatii
u1 y1 si iesirea y := uc2 yc2 si uc1 ≡ y2. Conexiunea este bine definita daca si numai
aceasta ordine) ca fiind sistemul cu intrarea u :=
obtinut punand u2 ≡ yc1 I D22 daca este inversabila. In acest caz obtinem sistemul generalizat Dc11 I
TR
=
T ⊗ Tc :=
−1
−1
T11 + T12Tc11(I − Tc22Tc11) T21 T12(I − Tc11T22) Tc12 Tc21(I − T22Tc11)−1T21 Tc22 + Tc21T22(I − Tc11T22)−1Tc12 (106)
CAPITOLUL 3: PROPRIETATI STRUCTURALE
182
Conexiuni si operatii
avand o realizare data de
A + B2Se−1Dc11C2 B2Se−1Cc1 B1 + B2Se−1Dc11D21 Bc1S −1C2 Ac + Bc1S −1D22Cc1 Bc1S −1D21 TR = C1 + D12Dc11S −1C2 D12Se−1Cc1 D11 + D12Dc11S −1D21 Dc21S −1C2 Cc2 + Dc21S −1D22Cc1 Dc21S −1D21 B2Se−1Dc12 Bc2 + Bc1S −1D22Dc12 −1 e D12S Dc12 Dc22 + Dc21S −1D22Dc12 (107) unde s–a notat S := I −D22Dc11 si Se := I −Dc11D22 care sunt ambele inversabile.
Observatie: Daca in (96) avem T22(∞) = D22 = 0 atunci TLF si produsul Redheffer ale lui T cu Tc sunt automat bine definite.
CAPITOLUL 3: PROPRIETATI STRUCTURALE
183
Conexiuni si operatii
6. Elemente Structurale ale Matricilor Rationale Anumite elemente structurale ale matricilor rationale joaca un rol aparte in teoria controlului sistemelor dinamice pe spatiul starilor: poli, zerouri, forma Smith McMillan, directiile de poli/zerouri, indicii singulari stanga si dreapta. Conceptele de pol si zerou sunt considerabil mai dificile decat in cazul scalar in principal datorita posibilitatii ca o matrice rationala sa aibe pol si zerou in acelasi punct so ∈ C, cat si datorita posibilitatii existentei polilor si zerourilor la infinit (un concept relativ greu de explicitat in cazul multivariabil). In cazul sistemic avem doua notiuni de poli: poli ai matricii de transfer (vazuta ca matrice rationala) si poli ai sistemului pe spatiul starilor definiti ca fiind valorile proprii ale matricii A. Mai precis, so ∈ C este pol al matricii de transfer rationale T (s) daca este pol cel putin al unui element al sau considerat ca rationala ireductibila. Polii matricii de transfer coincid cu polii sistemului daca si numai daca realizarea corespunzatoare este minimala. CAPITOLUL 3: PROPRIETATI STRUCTURALE
184
Elemente Structurale ale Rationalelor
In cazul sistemic exista si doua notiuni de zerouri: zerouri de transmisie si zerouri invariante. Notiunea de zerou de transmisie se introduce pe baza matricii de transfer rationale iar cea de zerou invariant pe baza unei matrici polinomiale construite pe baza unei realizari de stare (A, B, C, D). Pentru a intelege intuitiv notiunea de zerou sa presupunem ca so ∈ C nu este pol al rationalei. Atunci s0 se numeste zerou al rationalei T (s) daca si numai rank T (so) < rank nT (s) unde prin rank nT (s) intelegem rangul normal al rationalei, i.e., rangul pentru aproape toti s ∈ C. In termeni sistemici, cand T (s) are semnficatia de matrice de transfer a unui sistem, zerourile ei se mai numesc zerouri de transmisie ale sistemului. Pentru a introduce notiunea de zerou invariant al unui sistem de tipul (A, B, C, D) CAPITOLUL 3: PROPRIETATI STRUCTURALE
185
Elemente Structurale ale Rationalelor
sa presupunem conditii initiale nule. Atunci avem in transformate Laplace (sI − A)x − Bu = 0, Cx + Du = y sau echivalent
sI − A −B C D Matricea polinomiala (de grad 1) S(s) :=
sI − A −B C D
x u
=
0 y
.
∈ R[s](n+p)×(n+m)
(108)
se numeste matricea sistem (sau de transmisie) si joaca un rol central in studiul sistemelor dinamice liniare atat din punct de vedere teoretic cat si procedural. s0 ∈ C se numeste zerou invariant al sistemului daca rank S(s0) < rank nS(s) =: r. CAPITOLUL 3: PROPRIETATI STRUCTURALE
186
Elemente Structurale ale Rationalelor
Rangul normal este egal cu dimensiunea maxima a unui minor al lui S(s) care nu are determinantul identic nul. Fie χ(s) cel mai mare divizor comun al tuturor determinantilor minorilor de rang (avand dimensiunea egala cu rangul normal). Atunci zerourile invariante ale sistemului (A, B, C, D) sunt exact zerourile polinomului χ(s). Din identitatea
sI − A −B C D
=
−1
I O sI − A O I −(sI − A) B C(sI − A)−1 I O I O T (s) se observa ca daca s0 6∈ Λ(A) atunci so este zerou invariant daca si numai daca este zerou de transmisie. Problemele majore apar insa atunci cand exista zerouri comune cu poli. Pentru a intelege riguros aceste concepte avem nevoie de o teorie mai sofisticata a formelor canonice pentru matrici rationale si matrici polinomiale de gradul 1 (numite fascicole matriciale). CAPITOLUL 3: PROPRIETATI STRUCTURALE
187
Elemente Structurale ale Rationalelor
Forma Smith–McMillan a rationalei T (s) – o forma canonica sub transformari unimodulare – Teorema 61 (Forma Smith–McMillan). Fie T (s) o p × m matrice rationala cu coeficienti in R avand rangul normal r. Atunci exista o p × p matrice polinomiala U (s) si o m × m matrice polinomiala V (s), ambele cu coeficienti in R si determinant constant nenul (independent de s), care aduce T (s) la forma Smith–McMillan S(s) = U (s)T (s)V (s), (109) unde
ǫ1(s) ǫ2(s) ǫr (s) , ,..., , 0, . . . , 0 , (110) S(s) := diag η1 (s) η2(s) ηr (s) polinoamele ǫi(s), ηi (s) sunt monice (au coeficientul termenului de grad maxim egal cu 1), sunt doua cate doua coprime pentru i = 1, . . . , r, si satisfac proprietatile de divizibilitate ǫi(s) | ǫi+1(s), ηi+1(s) | ηi(s), CAPITOLUL 3: PROPRIETATI STRUCTURALE
i = 1, . . . , r − 1. 188
(111)
Elemente Structurale ale Rationalelor
Mai mult, polinoamele ǫi(s) si ηi(s) sunt unic definite de T (s) si se numesc divizori elementari ai lui T (s). Definim
z(s) := ǫ1(s) · · · ǫr (s), (112) p(s) := η1(s) · · · ηr (s). Atunci cele nz (np) radacini ale lui z(s) (p(s)) sunt prin definitie zerourile (polii) finiti ai lui T (s). Ordinul zeroului (polului) s0 al lui T (s) este prin definitie multiplicitatea sa ca radacina a polinomului z(s) (p(s)). Ordinele partiale ale zeroului (polului) s0 al lui T (s) sunt prin definitie multiplicitatile nenule ale lui s0 ca radacina a polinoamelor ǫi(s) (ηi(s)), pentru i = 1, . . . , r. Spunem ca ∞ este zerou (pol) al lui T (s) daca s = 0 este zerou (pol) al matricii rationale Tb(s) = T ( 1s ), si definim ordinele zeroului (polului) s = ∞ al lui T (s) ca fiind ordinele zeroului (polului) s = 0 al lui Tb(s). CAPITOLUL 3: PROPRIETATI STRUCTURALE
189
Elemente Structurale ale Rationalelor
Notam cu Z(T ) si respectiv P(T ) reuniunea tuturor zerourilor si respectiv tuturor polilor (incluzand infinitul si repetitii in acord cu ordinele elementelor). Gradul McMillan al lui T este prin definitie suma tuturor ordinelor polilor (finiti si infiniti). Deci gradul McMillan al unei matrici rationale este egal cu numarul de poli (socotind ordinele inclusiv ale polilor de la infinit). Observatie: Daca rationala este proprie atunci nu are poli la infinit si definitiile de mai sus se simplifica corespunzator. Cand suntem interesati de un singur punct s0 se poate folosi o forma Smith– McMillan locala care pune in evidenta numai ordinele zeroului si polului din s0. Teorema 62 (Forma Smith–McMillan locala). Fie T (s) o p×m matrice rationala cu coeficienti in R, avand rangul normal r, si fie s0 ∈ C. Atunci exista o p × p matrice rationala U (s) si o m × m matrice rationala V (s), ambele nesingulare si fara poli sau zerouri in so, care aduc T (s) la forma Smith–McMillan locala (in jurul lui s0), Sℓ(s) = U (s)T (s)V (s), (113) CAPITOLUL 3: PROPRIETATI STRUCTURALE
190
Elemente Structurale ale Rationalelor
unde si
k1 k2 kr Sℓ(s) := diag (s − s0) , (s − s0) , . . . , (s − s0) ,
(114)
k1 ≤ k2 ≤ . . . ≤ kr sunt numere intregi. Mai mult, intregii strict pozitivi (sau strict negativi) ki sunt ordinele partiale ale lui s0 ca zerou (pol) al lui T . Forma Smith–McMillan in jurul lui s = ∞ se obtine din forma Smith–McMillan a lui T ( 1s ) in jurul lui s = 0. Baze minimale pentru spatiile nucleu la stanga si dreapta Fie T (s) o p × m matrice rationala avand rangul normal r. Nucleul la dreapta (peste rationale) are dimensiune m − r iar nucleul la stanga are dimensiune p − r. Introducem in continuare notiunile de indici minimali la dreapta si stanga. Pentru acesta avem nevoie de cateva notiuni de subspatii rationale. CAPITOLUL 3: PROPRIETATI STRUCTURALE
191
Elemente Structurale ale Rationalelor
Definim gradul unui vector de polinoame ca fiind cel mai mare grad al elementelor respectivului vector. Dandu–se un subspatiu in Rm(s) (vectori rationali de dimensiune m), putem intotdeauna construi o baza polinomiala pentru el. Coloanele unei matrici polinomiale P(s) formeaza o baza minimala pentru spatiul pe care-l genereaza daca au loc simultan: 1. P (s) este monica pentru toti s ∈ C finiti; 2. P (s) este redusa pe coloane (sau proprie pe coloane). Mai precis, fie ni gradul coloanei i a lui P (s) si construim matricea constanta Pn a carei coloana i este coeficientul vectorial al lui sni in coloana i a lui P(s). Atunci P(s) este de tip coloana redusa daca Pn este monica. Echivalent, o baza polinomiala este minimala daca suma tuturor gradelor vectorilor polinomiali care o formeaza este cat mai mica posibila. Multimea gradelor vectorilor din orice baza minimala a unui subspatiu este invarianta in raport cu operatiile unimodulare pe coloane, si aceste grade se numesc CAPITOLUL 3: PROPRIETATI STRUCTURALE
192
Elemente Structurale ale Rationalelor
indici minimali (sau indici Kronecker ) ai subspatiului. Se numesc indici minimali la stanga si dreapta ai unei matrici rationale multimea indicilor minimali ai subspatiilor nule (nucleu) la stanga si respectiv la dreapta. Pentru o matrice rationala arbitrara are loc o relatie interesanta intre indicii structurali. Fie nr si nℓ suma indicilor minimali la dreapta si respectiv la stanga si fie nz si np numarul total de zerouri si respectiv de poli. Atunci are loc relatia np = nz + nr + nℓ.
CAPITOLUL 3: PROPRIETATI STRUCTURALE
193
Elemente Structurale ale Rationalelor
7. Fascicole Matriciale si Forme Canonice Fie M si N doua m × n matrici cu elemente in R. Matricea polinomiala (de grad 1) sM − N se numeste fascicol matricial sau pe scurt fascicol. Ne concentram intai atentia asupra fascicolelor sM − N care sunt regulate, i.e., care sunt patrate (n × n) si au un determinant neidentic nul det(sM − N ) 6≡ 0. Un fascicol care nu este regulat se numeste singular. In particular, daca M sau N sunt inversabile atunci fascicolul sM − N este regulat. In general vom fi interesati de fascicole arbitrare (inclusiv singulare). Dandu-se un fascicol regulat sM − N , cu M, N ∈ Rn×n, problema de gasire a solutiilor ecuatiei polinomiale χ(s) := det (sM − N ) = 0
(115)
se numeste problema de valori proprii generalizate. CAPITOLUL 3: PROPRIETATI STRUCTURALE
194
Fascicole matriciale
Deoarece M poate fi singulara, polinomul caracteristic χ(s) are gradul nf ≤ n. Cele nf radacini ale lui χ(s) se numesc valori proprii generalizate finite ale fascicolului sM − N . s = ∞ este o valoare proprie (generalizata) a lui sM − N daca s = 0 este o valoare proprie (generalizata) a fascicolului reciproc sN − M . Multiplicitatea n∞ a valorii proprii de la infinit este prin definitie multiplicitatea valorii proprii s = 0 pentru fascicolul sN − M . Evident avem n∞ = n − nf . Prin urmare un fascicol matricial regulat de dimensiune n × n are intotdeauna n valori proprii (finite si infinite) care formeaza spectrul fascicolului notat Λ(M, N ). Pentru o valoare proprie s0 exista intotdeauna un vector nenul x ∈ Cn – numit vector propriu generalizat a.i.
N x = s0 M x Mx = 0
CAPITOLUL 3: PROPRIETATI STRUCTURALE
daca s0 este finita, daca s0 este infinit. 195
Fascicole matriciale
Forma canonica Weierstrass a unui fascicol regulat Introducem o relatie de echivalenta pentru fasciole matriciale si studiem intai proprietatile si consecintele asupra fascicolelor regulate. f−N e , cu M, N, M f, N e ∈ Cm×n se numesc (strict) Doua fascicole sM − N si sM echivalente daca exista doua matrici inversabile Q ∈ Cm×m, Z ∈ Cn×n, a.i. f−N e. Q(sM − N )Z = sM
(116)
Relatia de echivalenta stricta (116) induce o forma canonica pe multimea fascicolelor regulate de dimensiune n × n numita forma canonica Weierstrass. Prin urmare, pentru oricare fascicol regulat sM − N , cu M, N ∈ Cn×n, exista doua matrici inversabile Q, Z ∈ Cn×n a.i. Q(sM − N )Z = sMW − NW CAPITOLUL 3: PROPRIETATI STRUCTURALE
196
Fascicole matriciale
unde sMW − NW := diag (sM∞ − In∞ , sInf − Nf ),
(117)
Nf este in forma canonica Jordan, M∞ este nilpotenta si este in forma canonica Jordan (0), Js∞ (0), . . . , Js∞ (0)) (118) M∞ := diag (Js∞ 1 2 h ∞
si Jsi (0) este un bloc elementar (nilpotent) Jordan de dimensiune si × si cu valoare proprie s = 0. Observatii: • Valorile proprii generalizate finite ale fascicolului sM − N coincid cu valorile proprii ale matricii Nf . Prin urmare se poate folosi matricea Nf pentru a defini conceptele de multiplicitate partiala, algebrica si geometrica a unei valori proprii generalizate finite a lui sM − N . • Similar, se definesc multiplicitatea partiala, algebrica si geometrica a valorii proprii generalizate de la infinit ca fiind multiplicitatea corespunzatoare a valorii proprii s = 0 a matricii M∞. Prin urmare pentru s = ∞ multiplicitatile partiale sunt s∞ Ph ∞ ∞ i (i = 1, . . . , h∞), multiplicitatea algebrica este n∞ si satisface n∞ = i=1 si , iar multiplicitatea geometrica este h∞. CAPITOLUL 3: PROPRIETATI STRUCTURALE
197
Fascicole matriciale
•Multimea valorilor proprii generalizate impreuna cu multiplicitatile partiale determina complet forma canonica Weierstrass a unui fascicol matricial regulat (pana la o permutare a blocurilor diagonale). Daca M este inversabila atunci fascicolul nu are are valori proprii infinite si forma canonica Weierstarss se reduce la forma canonica Jordan a matricii M −1N .
CAPITOLUL 3: PROPRIETATI STRUCTURALE
198
Fascicole matriciale
Problema de valori proprii generalizate: cazul general Extindem in continuare studiul asupra fascicolelor arbitrare (posibil singulare) sM − N de dimensiune m × n cu elemente in R. Un fascicol este numit singular daca nu este patrat sau daca este patrat dar det(sM − N ) ≡ 0. In particular, sM − N are rang constant pentru toti s ∈ C cu exceptia unui numar finit pentru care are rang strict mai mic. Observatii: Rangul normal r al fascicolului sM − N este rangul lui sM − N pentru aproape toti s ∈ C. Pentru un fascicol regulat avem m = n = r. Daca νr := n − r > 0 atunci fasciolul are structura singulara la dreapta. Daca νℓ := m − r > 0 atunci fascicolul are structura singulara la stanga. Un fascicol regulat nu are structura singulara nici la stanga si nici la dreapta. Polinomul caracteristic χ(s) al fascicolului este cel mai mare divizor comun al polinoamelor Ri(s), unde {Ri(s)} este multimea tutoror minorilor de dimensiune r. CAPITOLUL 3: PROPRIETATI STRUCTURALE
199
Fascicole matriciale
Problema rezolvarii ecuatiei polinomiale χ(s) := χ0 + χ1s + . . . + χnf snf = 0, cu χnf 6= 0, se numeste problema de valori proprii generalizate pentru fascicolul sM − N . Cele nf radacini ale lui χ(s) se numesc valori proprii finite. Spunem ca s = ∞ este valoare proprie lui sM − N daca s = 0 este valoare proprie a fascicolului reciproc sN − M sau, echivalent, daca rank M < r. Multiplicitatea n∞ a v.p. de la infinit este prin definitie multiplicitatea v.p. s = 0 a lui sN − M . Reuniunea (nedisjuncta) a celor nf + n∞ v.p. formeaza spectrul lui sM − N notat Λ(M, N ).
generalizate (finite si infinite)
Forma canonica Kronecker a unui fascicol general Relatia de stricta echivalenta induce o forma canonica pe multimea fascicolelor de dimensiune m × n numita forma canonica Kronecker. Mai exact, pentru oricare CAPITOLUL 3: PROPRIETATI STRUCTURALE
200
Fascicole matriciale
fascicol sM − N , cu M, N ∈ Cm×n, exista doua matrici inversabile Q ∈ Cm×m si Z ∈ Cn×n a.i. Q(sM − N )Z = sMKR − NKR , unde
sMKR − NKR
:=
Lǫ1
... Lǫνr
sM∞ − In∞ sInf − Nf
LTη1
...
LTην
ℓ
,
(119)
Nf este o matrice in forma canonica Jordan, M∞ este o matrice nilpotenta in CAPITOLUL 3: PROPRIETATI STRUCTURALE
201
Fascicole matriciale
forma canonica Jordan, si Lk (k ≥ 0) este un k × (k + 1) fascicol bidiagonal
s −1 ... Lk :=
... s
−1
.
k poate fi zero corespunzand unei linii sau coloane de zerouri in fascicolul (119). Structura Kronecker este complet determinata de partea regulata si singulara. Valorile proprii (finite si infinite) ale fascicolului sM − N sunt valorile proprii ale fascicolului regulat M∞ O I n∞ O s − O I nf O Nf Partea singulara a fascicolului este determinata de structura singulara Kronecker la stanga si dreapta. Blocurile de dimensiune ǫi × (ǫi + 1) notate Lǫi , (i = 1, . . . , νr ), sunt blocurile elementare Kronecker la dreapta si ǫi ≥ 0 sunt indicii Kronecker la dreapta. Blocurile de dimensiune (ηj + 1) × ηj notate Lηj T , (j = 1, ..., νℓ), sunt blocurile elementare Kronecker la stanga si ηj ≥ 0 sunt indicii Kronecker la stanga. CAPITOLUL 3: PROPRIETATI STRUCTURALE
202
Fascicole matriciale
Din forma canonica Kronecker avem rank n(sM − N ) = nr + n∞ + nf + nℓ, Pνr
(120)
P νℓ
unde nr := i=1 ǫi si nℓ := j=1 ηj . Daca sM − N este regulat atunci nu exista indici Kronecker (i.e., blocurile Lǫi , LTηj dispar) si forma canonica Kronecker se reduce la forma canonica Weierstrass.
CAPITOLUL 3: PROPRIETATI STRUCTURALE
203
Fascicole matriciale
8. Elemente Structurale ale unei Matrici Rationale in Termenii Realizarilor de Stare
Intre elementele structurale ale matricii de transfer rationale T (s) a unui sistem dinamic si formele canonice ale fasciolelor sI − A,
sI − A −B C D
asociate unei realizari arbitrare – numite fascicolul de poli si fascicolul de zerouri (sau matricea de transmisie) – exista o legatura stransa. Teorema 63. Fie T (s) o p×m matrice rationala proprie avand gradul McMillan n si rangul normal r. Fie A B T = (121) C D CAPITOLUL 3: PROPRIETATI STRUCTURALE
204
o realizare de dimensiune k cu coeficienti in R si fie sI − A,
sET − AT :=
sI − A −B −C −D
fasciolele de poli si respectiv de zerouri asociate acestei realizari. 1. Pentru orice realizare (121) avem: (a) Rangul normal: Rangurile normale ale lui T (s) si sET − AT satisfac rank nT (s) = rank n(sET − AT ) − k.
(b) Poli: Reuniunea polilor P(T ) este inclusa Λ(A), P(T ) ⊂ Λ(A). CAPITOLUL 3: PROPRIETATI STRUCTURALE
205
(c) Zerouri: Reuniunea zerourilor de transmisie Z(T ) (finite si infinite) ale lui T este inclusa in Λ(ET , AT ), Z(T ) ⊂ Λ(ET , AT ).
2. Pentru o realizare minimala (121) avem in plus: (a) Poli: Polii lui T (s) coincid cu valorile proprii ale lui A. Ordinele partiale ale polilor lui T (s) sunt egale cu multiplicitatile partiale ale v.p. ale lui A. (b) Zerouri finite : Zerourile finite (de transmisie) ale lui T coincid cu v. p. finite ale lui sET − AT . Ordinele partiale ale zerourilor finite ale lui T (s) sunt egale cu multiplicitatile partiale ale v.p. finite ale lui sET − AT . (c) Zerouri infinite: Ordinele partiale ale zerourilor infinite (de transmisie) ale lui T sunt egale cu multiplicitatile partiale ale v.p. infinite a lui sET − AT minus 1. CAPITOLUL 3: PROPRIETATI STRUCTURALE
206
(d) Indici minimali la stanga. Indicii minimali la stanga ai lui T sunt egali cu indicii Kronecker la stanga ai lui sET − AT . (e) Indici minimali la dreapta. Indicii minimali la dreapta ai lui T sunt egali cu indicii Kronecker la dreapta ai lui sET − AT .
CAPITOLUL 3: PROPRIETATI STRUCTURALE
207
CAPITOLUL 4: SINTEZA ELEMENTARA 1. Compensatoare Dinamice : Problematica 2. Lege de Comanda, Stabilizabilitate, Alocabilitate 3. Estimatori de Stare 4. Estimatori de Tip 1 5. Compensatorul Kalman 6. Estimatori de Stare de Ordin Redus (Tip 2) 7. Reglarea Sistemelor Dinamice
CAPITOLUL 4: SINTEZA ELEMENTARA
208
SINTEZA ELEMENTARA
1. Compensatoare Dinamice : Problematica
Consideram un sistem liniar x(t) ˙ = Ax(t) + Bu(t), y(t) = Cx(t) + Du(t)
x(0) = xo
(122)
cu x(t) ∈ Rn, u(t) ∈ Rm, y(t) ∈ Rp. Problema sintezei (naturala): Cum putem sa modificam dinamica acestui sistem astfel incat sa satisfaca anumite cerinte ? Cerintele elementare discutate si in cazul sistemelor SISO sunt legate de stabilitate si comporatarea sistemului la diverse semnale de referinta/perturbatii. Raspuns: Cerintele de proiectare se pot realiza prin cuplarea unui nou sistem dinamic (de preferinta din aceeasi clasa de modele) astfel incat sistemul rezultant sa se comporte in modul dorit. CAPITOLUL 4: SINTEZA ELEMENTARA
209
Compensatoare Dinamice: Problematica
Asa cum am vazut in cazul sistemelor SISO, conexiunile serie si paralel nu pot asigura in general nici macar cerinta minimala de stabilitate (interna) si acest fapt este specific si sistemelor dinamice (Ex: Aratati acest lucru prin analogie cu cazul SISO sau direct pe realizarile de stare ale conexiunilor serie/paralel). Prin urmare ne indreptam atentia din nou asupra conexiunii in bucla de reactie negativa. In conjunctie cu sistemul (122) consideram sistemul dinamic pe spatiul starilor (numit compensator dinamic sau regulator)
x˙ c(t) = Acxc(t) + Bcuc(t), yc(t) = Ccxc(t) + Dcuc(t),
xc(0) = xco
(123)
unde xc(t) ∈ Rnc , uc(t) ∈ Rp, yc(t) ∈ Rm, cuplat in reactie inversa cu (122) a. i. u ≡ yc + uR,
yR ≡ y ≡ uc
unde uR este intrarea (semnal extern) si yR este iesirea sistemului rezultant. CAPITOLUL 4: SINTEZA ELEMENTARA
210
Compensatoare Dinamice: Problematica
Pentru simplificare presupunem S := Ip − DDc = I, Sb = Im − DcD = I (de exemplu D = 0 sau Dc = 0). Atunci ecuatiile dinamice ale sistemului echivalent sunt ˙ A + BDcC BCc x B x = + uR xc BcC Ac + xc Bc D BcDCc x C DCc yR = + DuR. xc
(124)
Notand xR :=
x xc
, AR :=
A + BDcC Bc C
CR := CAPITOLUL 4: SINTEZA ELEMENTARA
C
DCc
BCc Ac + BcDCc
, BR :=
B Bc D
,
DR := D
, 211
Compensatoare Dinamice: Problematica
obtinem echivalent x˙ R (t) = ARxR (t) + BRuR(t), yR (t) = CRxR (t) + DRuR(t).
xR (0) =
xo xco
(125)
Se formuleaza urmatoarele probleme fundamentale: 1. Problema stabilizarii: Pentru sistemul original (A, B, C, D) sa se gaseasca un regulator (sau clasa tuturor !!!) (Ac, Bc, Cc, Dc) a. i. sistemul rezultant in bucla inchisa sa fie intern asimptotic stabil (Λ(AR) ⊂ C−). 2. Problema alocarii: Pentru sistemul original (A, B, C, D) sa se gaseasca un regulator (sau clasa tuturor !!!) (Ac, Bc, Cc, Dc) a. i. sistemul rezultant in bucla inchisa sa aibe o dinamica impusa (mai precis valorile proprii ale sistemului in bucla inchisa sa coincida cu multimea Λ0 de n + nc valori complexe date, i.e., Λ(AR) = Λ0. CAPITOLUL 4: SINTEZA ELEMENTARA
212
Compensatoare Dinamice: Problematica
Observatii: a) Ambele probleme impun conditii numai asupra matricii AR . b) In ambele probleme trebuie implicit determinat si nc (dimensiunea compensatorului) fiind de dorit ca aceasta sa fie cat mai mica. Problemele de stabilizare/alocare in care se impune conditia suplimentara de minimalitate a lui nc sunt probleme structurale in general foarte dificile. c) Multimea Λ0 se ia in general simetrica, i.e. daca s ∈ Λ0 atunci si s ∈ Λ0, regulatorul rezultand automat cu coeficienti reali. Λ0 se da in general ca cerinta de proiectare asigurand automat o anumita viteza de raspuns, timp tranzitoriu, etc. d) Spre deosebire de problema alocarii, problema stabilizarii nu pretinde spectru fix ci doar locatia acestuia in C−. In mod traditional au existat cateva abordari ale acestei probleme: • Prin extensie dinamica: Problema se reduce simplu la o problema algebrica de alocare de poli ce insa s-a dovedit a fi foarte dificil de rezolvat in conditii generale. • Principiul separatiei: S–a pus in evidenta un principiu fundamental in teoria CAPITOLUL 4: SINTEZA ELEMENTARA
213
Compensatoare Dinamice: Problematica
sistemelor liniare numit principiul separatiei si care reduce problema originala la doua probleme algebrice de alocare ce se rezolva independent. • Parametrizarea lui Youla: cea mai completa solutie disponibila (foloseste implicit principiul separatiei) necesitand insa dezvoltarea teoriei factorizarilor de matrici rationale peste S (relativ sofisticata) – solutia este formal identica cu cazul SISO. Extensie dinamica Consideram pentru simplitate D = 0. Metoda se bazeaza pe observatia ca matricea de stare AR a sistemului rezultant se poate scrie succesiv AR :=
A + BDcC Bc C
BCc Ac
=
A O B + O O O
= Ae + BeKCe CAPITOLUL 4: SINTEZA ELEMENTARA
214
O I nc
Dc Cc Bc Ac
C O O I nc (126)
Compensatoare Dinamice: Problematica
unde
Dc Cc , Ce := , K := . Ae := , Be := Bc Ac (127) Deci problema originala de stabilizare/alocare dinamica prin gasirea compensatorului (Ac, Bc, Cc, Dc) s–a redus la problema echivalenta de gasire a matricii constante K astfel incat spectrul matricii (126) sa fie in C−. Aceasta din urma problema este in fapt o problema de gasire a unei reactii constante dupa iesire (reactie inversa cu compensator constant) pentru sistemul (Ae, Be, Ce). A O O O
B O
O I nc
C O O I nc
Sistemul extins (Ae, Be, Ce) se obtine prin adaugarea la sistemul initial (A, B, C, D) a sistemului x˙ a(t) = ua(t), ya(t) = xa(t), CAPITOLUL 4: SINTEZA ELEMENTARA
215
Compensatoare Dinamice: Problematica
unde xa(t), ua(t), ya(t) ∈ Rnc . Obtinem astfel ecuatiile dinamice
x˙ e(t) = Aexe(t) + Beue(t), ye(t) = Cexe(t),
x(t) u(t) , ue(t) := xa(t) ua(t) sunt starea, intrarea si respectiv iesirea extinsa. xe(t) :=
,
ye(t) :=
y(t) ya(t)
Daca conectam un compensator constant in reactie inversa cu sistemul extins obtinem ca matricea de stare a sistemului in bucla inchisa este (126). Deci problema originala de gasire a unui compensator (Ac, Bc, Cc, Dc) s-a redus la problema de gasire a unei reactii cst. K (127) pentru sistemul extins (Ae, Be, Ce). Cu toate ca aceasta problema pare mai simpla decat cea originala, solutionarea ei este foarte dificila intrucat nu este cunoscuta dimensiunea nc. Chiar cu nc impus, problema se reduce la rezolvarea unei probleme de optimizare neconvexe (dificile !). CAPITOLUL 4: SINTEZA ELEMENTARA
216
Compensatoare Dinamice: Problematica
Principiul separatiei Un compensator dinamic se poate obtine rezolvand independent problemele: • Constructia unei legi de reactie dupa stare F ∈ Rm×n care aloca sau stabilizeaza (face ca matricea A + BF sa aibe spectrul dorit sau sa fie asimptotic stabila). • Constructia unui estimator de stare (prelucreaza semnalele exogene – marimile de intrare u si de iesire y – si genereaza o estimare a marimii de stare x). In final, regulatorul (de tip Kalman) se obtine luand reactia F dupa starea estimata. Problema de alocare (cu reactie dinamica dupa iesire) are solutie daca si numai daca perechea (A, B) este controlabila si perechea (C, A) este observabila. Problema de stabilizare (cu reactie dinamica dupa iesire) are solutie daca si numai daca perechea (A, B) este stabilizabila si perechea (C, A) este detectabila. CAPITOLUL 4: SINTEZA ELEMENTARA
217
Compensatoare Dinamice: Problematica
2. Lege de Comanda, Alocabilitate, Stabilizabilitate Definitia 64. • Pentru un sistem (A, B, C, D) dependenta u = F x + Gv
(128)
se numeste lege de comanda prin reactie dupa stare, unde F ∈ Rm×n, G ∈ Rm×m, F se numeste matricea de reactie si v este noua marime de intrare. (FIG) • Perechea (A, B), A ∈ Rn×n, B ∈ Rn×m se numeste stabilizabila daca exista o matrice de reactie dupa stare F ∈ Rm×n a.i. Λ(A + BF ) ⊂ C−. • Perechea (C, A), C ∈ Rp×n, A ∈ Rn×n se numeste detectabila daca exista o matrice de reactie dupa stare K ∈ Rn×p a.i. Λ(A + KC) ⊂ C−. CAPITOLUL 4: SINTEZA ELEMENTARA
218
Lege de Comanda, Alocabilitate, Stabilizabilitate
• Perechea (A, B), A ∈ Rn×n, B ∈ Rn×m , se numeste alocabila daca oricare ar fi multimea simetrica Λ0 de n numere complexe (orice s ∈ Λ0 ⇒ s ∈ Λ0), exista o matrice de reactie dupa stare F ∈ Rm×n a.i. Λ(A + BF ) = Λ0.
Proprietatile de stabilizabilitate si detectabilitate sunt duale. Considerand sistemul dinamic
x(t) ˙ = Ax(t) + Bu(t), y(t) = Cx(t) + Du(t)
x(0) = xo
(129)
legea de comanda dupa stare implica accesul (din punct de vedere tehnic) la stare, i.e., cunoasterea marimii de stare ! Dupa implementarea comenzii (128) sistemul CAPITOLUL 4: SINTEZA ELEMENTARA
219
Lege de Comanda, Alocabilitate, Stabilizabilitate
in bucla inchisa devine
x(t) ˙ = (A + BF )x(t) + BGv(t), y(t) = (C + DF )x(t) + DGv(t)
x(0) = xo
(130)
avand noua intrare v si iesirea y. Exercitiu: Explicitati in domeniul timp si al transformatelor Laplace traiectoria, iesirea si legea de comanda pentru sistemul (130). Scrieti o realizare de stare pentru acest sistem si precizati cum sunt influentate controlabilitatea/ observabilitatea/ minimalitatea/ stabilizabilitatea/ detectabilitatea/ polii/ zerourile printr–o lege de comanda cu reactie dupa stare. Teorema 65. Fie A ∈ Rn×n, B ∈ Rn×m, F ∈ Rm×n, G ∈ Rm×m nesingulara si fie AF := A + BF . a) Perechea (A, B) este controlabila daca si numai daca perechea (AF , BG) este controlabila. b) Subspatiile controlabile in k pasi ale perechii (A, B) si perechii (AF , BG) CAPITOLUL 4: SINTEZA ELEMENTARA
220
Lege de Comanda, Alocabilitate, Stabilizabilitate
coincid, i.e., Rk (A, B) = Rk (AF , BG).
(131)
Demonstratie. a) Avem succesiv rank
sI − A − BF
BG
= rank
sI − A B
I −F
O G
= rank
sI − A
si concluzia rezulta folosind criteriul PBH de controlabilitate. b) Demonstram prin inductie. Pentru k = 0 avem prin definitie R0(A, B) = R0(AF , BG) = {0} iar pentru k = 1 avem R1(A, B) = Im B = Im BG = R1(AF , BG). CAPITOLUL 4: SINTEZA ELEMENTARA
221
Lege de Comanda, Alocabilitate, Stabilizabilitate
Presupunem acum (131) adevarata. Atunci pentru k + 1 avem Rk+1(AF , BG) = Im BG + AF Rk (AF , BG)
= Im B + AF Rk (A, B) = Im B + ARk (A, B) = Rk+1(A, B). Solutia problemei alocarii Teorema 66. Perechea (A, B), A ∈ Rn×n, B ∈ Rn×m este alocabila daca si numai daca este controlabila. Demonstratia acestui rezultat este relativ complicata si o vom face in cateva etape formulate ca rezultate separate: • Demonstram suficienta pentru m = 1 (o intrare); • Aratam ca problema cu m > 1 se poate reduce printr-o (pre)reactie dupa stare F la problema cu m = 1; • Demonstram teorema pentru m general. CAPITOLUL 4: SINTEZA ELEMENTARA
222
Lege de Comanda, Alocabilitate, Stabilizabilitate
Teorema 67 (Cazul m=1). Perechea (A, b), A ∈ Rn×n, b ∈ Rn×1 este alocabila daca este controlabila. Demonstrat¸ie. Fie Λ0 un set simetric de n numere si ∈ C, i = 1, 2, . . . , n. Aratam ca exista f ∈ Rn×1 a.i. Λ(A + bf T ) = Λ0. Demonstratia este constructiva (furnizeaza reactia care aloca). Deoarece (A, b) este controlabila, matricea de controlabilitate R=
2
n−1
b Ab A b . . . A
b
are dimensiune n × n si rang n si deci este inversabila. Atunci ecuatia q T R = eTn T
eTn R−1
1×n
(132)
are solutie unica q = ∈ R , unde = 0 . . . 0 1 (q T este ultima linie a lui R−1 ). Fie Λ0 un set simetric fixat de n numere complexe si, CAPITOLUL 4: SINTEZA ELEMENTARA
eTn
223
Lege de Comanda, Alocabilitate, Stabilizabilitate
i = 1, 2, . . . , n si fie χ(s) = Πni=1(s − si) = sn + αn−1 sn−1 + . . . + α0
(133)
polinomul avand radacinile date de Λ0. Aratam ca exista un f a.i. polinomul caracteristic a lui A + bf T sa coincida cu χ(s) ceea ce este echivalent cu a spune ca matricea A + bf T are spectrul Λ0. Pentru aceasta este suficient sa aratam ca χ(A + bf T ) = 0 pentru un f potrivit ales. Scriind (132) explicit obtinem qT b = 0 q T Ab = 0 .. q T An−2b = 0 q T An−1b = 1 CAPITOLUL 4: SINTEZA ELEMENTARA
224
Lege de Comanda, Alocabilitate, Stabilizabilitate
care se pot rescrie pentru orice f ∈ Rn sub forma qT = qT q T (A + bf T ) = q T A q T (A + bf T )2 = q T A2 .. q T (A + bf T )n−1 = q T An−1 q T Anb = q T An + q T An−1 bf T = q T An + f T .
(134)
Inmultind succesiv ecuatiile cu α0, α1, . . . αn−1 si 1, adunandu-le membru cu membru si folosind (133) rezulta q T χ(A + bf T ) = q T χ(A) + f T .
(135)
f T := −q T χ(A)
(136)
q T χ(A + bf T ) = 0.
(137)
Alegand rezulta automat ca
CAPITOLUL 4: SINTEZA ELEMENTARA
225
Lege de Comanda, Alocabilitate, Stabilizabilitate
Folosind (134), obtinem prin inmultire succesiva cu A, A2, . . ., An−1 ca
T χ(A + bf T ) = 0,
TR =
0 0 .. 0 1
0 0 .. 1 0
... ... .. ... ...
0 1 .. 0 0
1 0 .. 0 0
,
T
q qT A . T := . . q T An−1
Deci T este inversabila si prin urmare χ(A + bf T ) = 0 pentru f dat de (136), q.e.d. Dam in continuare un rezultat care permite reducerea problemei generale de alocare cu m > 1 la cazul m = 1. Teorema 68. Daca perechea (A, B) este controlabila atunci pentru orice b ∈ Rn, b 6= 0, exista o matrice de reactie F astfel incat perechea (A + BF, b) este controlabila. CAPITOLUL 4: SINTEZA ELEMENTARA
226
Lege de Comanda, Alocabilitate, Stabilizabilitate
Demonstrat¸ie. Fie b 6= 0 fixat. Definim recurent n vectori k = 1, 2, . . . , n − 1,
xk+1 = Axk + Buk ,
x1 = b
(138)
unde uk ∈ Rm. Aratam ca putem intotdeauna alege vectorii uk (in numar de n − 1) a. i. vectorii x1, . . . , xn sa fie liniar independenti. Presupunem prin reducere la absurd ca am construit vectorii liniar independenti x1, . . . , xk (k < n) si oricare ar fi uk ∈ Rm avem ca xk+1 este liniar dependent de precedentii, i.e., xk+1 = Axk + Buk ∈ Sk := Im Din (139) rezulta automat ca
Axk ∈ Sk , CAPITOLUL 4: SINTEZA ELEMENTARA
x1 x2 . . . , xk
,
∀uk ∈ Rm.
(139)
Im B ∈ Sk . 227
Lege de Comanda, Alocabilitate, Stabilizabilitate
Avem deasemenea ASk = Im
= Im
Ax1 Ax2 . . . Axk
x2 − Bu1 x3 − Bu2 . . . xk+1 − Buk
⊂ Sk
ceea ce inseamna ca Sk este A–invariant si contine Im B. Deoarece perechea (A, B) este controlabila avem ca R = Rn si deci Rn = R ⊂ Sk ceea ce implica automat k = n obtinand astfel o contradictie. Consideram acum ecuatia F
x1 x2 . . . xn
CAPITOLUL 4: SINTEZA ELEMENTARA
=
u1 u2 . . . , un−1 0 228
(140)
Lege de Comanda, Alocabilitate, Stabilizabilitate
care are o solutie unica F . Daca premultiplicam ecuatia de mai sus cu B obtinem Bui = BF xi,
i = 1, 2, . . . , n − 1
care inlocuite in (138) genereaza xk+1 = (A + BF )xk ,
k = 1, 2, . . . , n − 1,
x1 = b
sau inca xk = Ak−1 k = 1, 2, . . . , n. F b, Deoarece xk sunt liniar independenti rezulta ca matricea
b AF b . . .
An−1 F b
este inversabila si deci perechea (AF , b) cu F dat de (140) este controlabila. Teorema 69. Perechea (A, B), A ∈ Rn×n, B ∈ Rn×m este alocabila daca si numai daca este controlabila. CAPITOLUL 4: SINTEZA ELEMENTARA
229
Lege de Comanda, Alocabilitate, Stabilizabilitate
Demonstrat¸ie. Suficienta: Deoarece perechea (A, B) este controlabila inseamna ca B 6= 0 si deci exista g ∈ Rm a.i. b = Bg 6= 0. Din Teorema 67 rezulta atunci ca exista Fe a.i. perechea (AFe , b) sa fie controlabila, unde AFe := A + B Fe . Din teorema 67 rezulta ca pentru orice Λ0 set simetric de n numere exista f ∈ Rm a.i.
Prin urmare punand
Λ(AFe + bf T ) = Λ0. F := Fe + gf T
rezulta ca
(141)
Λ(A + BF ) = Λ(A + B(Fe + gf T )) = Λ(AFe + bf T ) = Λ0
de unde concluzia ca perechea (A, B) este alocabila si reactia care aloca este data de (141). Necesitatea: Pp prin absurd ca perechea (A, B) este alocabila dar nu este CAPITOLUL 4: SINTEZA ELEMENTARA
230
Lege de Comanda, Alocabilitate, Stabilizabilitate
controlabila. Atunci aplicand teorema de descompunere controlabila obtinem in noul sistem de coordonate A1 A3 B1 −1 b b b F1 F2 T (A + BF )T = A + B F = + O A2 O =
A1 + B1F1 A3 + B1F2 O A2
unde am notat Fb := F T −1. De aici rezulta ca
(142)
b+B b Fb) = Λ(A1 + B1F1) ∪ Λ(A2) Λ(A + BF ) = Λ(A
si deci Λ(A2) ⊂ Λ(A + BF ) oricare ar fi reactia F ceea ce contrazice ipoteza de alocabilitate a perechii (A, B). Observatii: a) Relatia (142) evidentiaza ca orice pereche (A, B) are o subpereche care poate fi alocata (parte din spectru poate fi alocat) – aceasta coincide cu CAPITOLUL 4: SINTEZA ELEMENTARA
231
Lege de Comanda, Alocabilitate, Stabilizabilitate
partea controlabila – si o parte nealocabila, i.e. anumiti poli ficsi dati de Λ(A2). Acesti poli sunt invarianti in raport cu orice reactie dupa stare. b) Teorema de mai sus arata ca proprietatea ”benefica” fundamentala a unei perechi controlabile (A, B) este ca dinamica sistemului (determinata de v.p. ale matricii de stare) poate fi modificata in mod arbitrar printr–o reactie dupa stare. c) Alocarea se poate extinde si asupra vectorilor proprii (simultan cu valorile proprii) cu anumite precautii privitoare la alegerea acestora. d) Demonstratia teoremelor de mai sus este constructiva rezultand proceduri de obtinere a reactiei care aloca. Aceaste metode au insa numeroase dezavantaje dpdv numeric si de aceea s-au dezvoltat alte proceduri numeric stabile de constructie a reactiei F (algoritm de tip Schur, alocare cu norma minima, etc). e) Alocabilitatea nu implica in general faptul ca matricea A + BF are orice elemente prescrise ci doar orice spectru prescris ! Procedura de Alocare: Cazul m = 1 Pasul 0: Dandu–se perechea controlabila (A, b), A ∈ Rn×n, b ∈ Rn, si un set CAPITOLUL 4: SINTEZA ELEMENTARA
232
Lege de Comanda, Alocabilitate, Stabilizabilitate
simetric de n valori proprii s1, s2, . . . , sn se construieste polinomul χ(s) = Πni=1(s − si) = α0 + α1s + α2s2 + . . . + αn−1sn−1 + sn cu α0, α1, . . . , αn−1 ∈ R.
Pasul 1: Se construieste matricea de controlabilitate R=
n−1
b Ab . . . A
b
care este automat patrata si nesingulara.
CAPITOLUL 4: SINTEZA ELEMENTARA
233
Lege de Comanda, Alocabilitate, Stabilizabilitate
Pasul 2: Se rezolva ecuatia
T R q = en =
0 0 .. 0 1
in necunoscuta q ∈ Rn. Pasul 3: Se calculeaza f T = −q T χ(A).
Pentru a explicita procedura pentru cazul multivariabil avem nevoie de un rezultat auxiliar. CAPITOLUL 4: SINTEZA ELEMENTARA
234
Lege de Comanda, Alocabilitate, Stabilizabilitate
Propozitia 70. Fie (A, B) controlabila, A ∈ Rn×n, B ∈ Rn×m. Controlabilitatea perechii (A + BF, b) este generica in raport cu F ∈ Rm×n si b := Bg, 0 6= g ∈ Rm. Mai exact, alegand aleator perechea (F, g) perechea (AF , b) este (generic) controlabila. Demonstrat¸ie. Demonstratia este lasata ca exercitiu fiind asemanatoare cu demonstrarea genericitatii controlabilitatii unei perechi de matrici alese arbitrar. Procedura de Alocare: Cazul General Pasul 0: Dandu–se perechea controlabila (A, B), A ∈ Rn×n , B ∈ Rn×m, si un set simetric de n valori proprii s1, s2, . . . , sn se construieste polinomul χ(s) = Πni=1(s − si) = α0 + α1s + α2s2 + . . . + αn−1sn−1 + sn cu α0, α1, . . . , αn−1 ∈ R. CAPITOLUL 4: SINTEZA ELEMENTARA
235
Lege de Comanda, Alocabilitate, Stabilizabilitate
Pasul 1: Se aleg Fe ∈ Rm×n si g ∈ Rm aleator si se construiesc matricile AFe := A + B Fe ,
b = Bg.
Pasul 2: Se aplica procedura de alocare (cu m = 1) perechii (AFe , b) si polinomului χ(s) obtinandu-se reactia f ∈ Rm. Pasul 3: Calculam reactia finala sub forma F = Fe + gf T . Propozitia 71 (Criteriul Hautus de Stabilizabilitate/Detectabilitate). • Perechea (A, B), A ∈ Rn×n, B ∈ Rn×m este stabilizabila daca si numai daca rank
CAPITOLUL 4: SINTEZA ELEMENTARA
sI − A B
= n,
∀s ∈ C+ ∪ C0. 236
(143)
Lege de Comanda, Alocabilitate, Stabilizabilitate
• Perechea (C, A), C ∈ Rp×n, A ∈ Rn×n este detectabila daca si numai daca rank
sI − A C
= n,
∀s ∈ C+ ∪ C0.
(144)
Demonstrat¸ie. Exercitiu ! Indicatie: Se foloseste teorema de descompunere controlabila punandu-se in evidenta polii ficsi.
CAPITOLUL 4: SINTEZA ELEMENTARA
237
Lege de Comanda, Alocabilitate, Stabilizabilitate
3. Estimatori de Stare
Asa cum am vazut, legea de comanda cu reactie dupa stare poate asigura in mod satisfacator cerintele fundamentale ale sintezei sistemelor de stabilizare si alocare cu conditia ca starea sa fie disponibila pentru masura (sa fie accesibila dpdv tehnic). Din pacate acest lucru nu este in general posibil si atunci ne punem problema estimarii cat mai exacte a starii unui sistem dinamic prin constructia unui nou sistem care sa citeasca marimile accesibile sau masurabile (intrarea u si iesirea y) si care sa genereaze la iesire o estimare a starii x b. Un astfel de sistem se numeste estimator de stare (FIG). Problema: Dandu–se un sistem
x(t) ˙ = Ax(t) + Bu(t), y(t) = Cx(t) + Du(t),
CAPITOLUL 4: SINTEZA ELEMENTARA
238
x(0) = xo
(145) Estimatori de Stare
dorim sa construim un nou sistem
w(t) ˙ = Jw(t) + Hy(t) + M u(t), x b(t) = Kw(t) + N y(t) + P u(t)
(146)
(care are deci ca intrari intrarea u si iesirea y, are ca iesiri starea estimata x b, si marimea de stare w) care sa indeplineasca simultan urmatoarele doua conditii: 1. Sa fie intern asimptotic stabil, i.e., matricea de stare J sa satisfaca Λ(J) ⊂ C−.
2. limt→∞(b x(t)−x(t)) = 0, i.e., iesirea x b(t) (numita estimatia starii) sa aproximeze asimptotic starea sistemului original x(t). CAPITOLUL 4: SINTEZA ELEMENTARA
239
Estimatori de Stare
Observatii: a) Ideal ar fi x(t) = x b(t), ∀t. Acest lucru nu este insa in general posibil (explicati de ce !) si atunci aceasta cerinta se relaxeaza la cea asimptotica. b) Cerinta de stabilitate interna este esentiala pentru constructia estimatorului (explicati de ce!). Pentru a solutiona problema punem in evidenta ”fidelitatea” cu care starea estimatorului (146) urmareste starea sistemului original, i.e. evaluam w−Vx unde V este o matrice ce ”adapteaza” dimensiunile eventual diferite ale lui x si w. Folosind (145) si (146) avem succesiv w˙ − V x˙ = Jw + Hy + M u − V Ax − V Bu, ′
(w − V x) = J(w − V x) + JV x + HCx + HDu − V Ax + (M − V B)u, CAPITOLUL 4: SINTEZA ELEMENTARA
240
Estimatori de Stare
′
(w − V x) = J(w − V x) + (JV + HC − V A)x + (M − V B + HD)u. (147) Calculam succesiv x b − x = Kw + N y + P u − x = K(w − V x) + KV x + N Cx + N Du − x + P u
x b − x = K(w − V x) + (KV + N C − I)x + (P + N D)u Combinand (147) cu (148) obtinem
(w − V x) x b−x
′
(148)
= J(w − V x) + (JV + HC − V A)x + (M − V B + HD)u, = K(w − V x) + (KV + N C − I)x + (P + N D)u.
Pentru ca starea estimatorului sa urmareasca asimptotic starea sistemului original (conditia 2) trebuie ca iesirea sistemului dinamic de mai sus sa tinda asimptotic la zero (indiferent de initializari si de semnalele de intrare x si u). Acest lucru este posibil daca satisfacem simultan urmatoarele conditii: CAPITOLUL 4: SINTEZA ELEMENTARA
241
Estimatori de Stare
a) J asimptotic stabila; b) JV + HC − V A = 0; c) M − V B + HD = 0; d) KV + N C − I = 0; e) P + N D = 0. Daca aceste conditii sunt simultan satisfacute obtinem comportarea dinamica Obtinem deci
(w − V x) x b−x
′
= J(w − V x), = K(w − V x).
lim (w(t) − V x(t)) = 0,
t→∞
lim (b x(t) − x(t)) = 0
t→∞
indiferent de initializarea sistemului sau estimatorului ! Problema de constructie a estimatorului asimptotic stabil s–a redus la problema CAPITOLUL 4: SINTEZA ELEMENTARA
242
Estimatori de Stare
algebrica de satisfacere simultana a conditiilor a) – e): avem 5 conditii (4 ecuatii algebrice si o locatie de spectru) si 7 necunoscute. Evident c) si e) se pot satisface automat alegand M := V B − HD si P := −N D. Raman in continuare mai multe grade de libertate in satisfacerea restului de conditii Λ(J) ⊂ C−, JV + HC − V A = 0, KV + N C − I = 0, functie de care se deosebesc mai multe tipuri de estimatori.
CAPITOLUL 4: SINTEZA ELEMENTARA
243
Estimatori de Stare
4. Estimatori de Tip 1: N = 0
Conditia este echivalenta cu a a spune ca estimatorul nu are transfer direct I/O, i.e., matricea sa “D” este zero. In acest caz obtinem JV + HC − V A = 0, KV = I si putem alege K = I, V = I, ramand de satisfacut doar conditia J = A − HC,
Λ(J) ⊂ C−.
Aceasta conditie se poate satisface automat daca perechea (C, A) este detectabila, caz in care alegem −H egal cu reactia care stabilizeaza (problema de stabilizare pentru perechea (AT , C T )). Mai mult, daca perechea (C, A) este observabila, atunci spectrul matricii de stare J a estimatorului poate fi alocat arbitrar. CAPITOLUL 4: SINTEZA ELEMENTARA
244
Estimatori de Tip 1
In concluzie am obtinut pentru un estimator de tipul 1 urmatoarea constructie:
CAPITOLUL 4: SINTEZA ELEMENTARA
245
Estimatori de Tip 1
Pasul 1: Se foloseste procedura de alocare pentru perechea (AT , C T ) si se determina o matrice Fe a.i. (AT ) + (C T )Fe sa aibe spectrul dorit (un anumit spectru impus sau doar localizat in C− in functie de cerinta de proiectare). Pasul 2: Se calculeaza estimatorul cu parametrii H = −Fe T ,
rezultand
J = A − HC,
K = V = I,
M = B − HD,
w(t) ˙ = (A − HC)w(t) + Bu(t) − HDu(t) + Hy(t), x b(t) = w(t),
P = 0,
(149)
sau, sub forma echivalenta,
x b˙ = Ab x + Bu + L(C x b + Du − y)
(150)
in care este cunoscut sub numele de estimator Luenberger (am notat L := −H). CAPITOLUL 4: SINTEZA ELEMENTARA
246
Estimatori de Tip 1
Observatii: a) Pentru a construi un estimator Luenberger avem nevoie doar sa specificam spectrul estimatorului Λ0 si sa construim reactia L care aloca respectivii poli pentru estimator Λ(A + LC) = Λ0. Pentru ca estimatorul sa rezulte cu coeficienti reali, spectrul se alege intotdeauna simetric. b) Daca perechea (C, A) este observabila atunci spectrul matricii de stare a estimatorului poate fi alocat arbitrar si deci este posibil ca estimatorul sa furnizeze o estimatie cat de precisa a starii intr-un timp oricat de scurt ! c) Din (150) observam ca estimatorul “copiaza” dinamica sistemului original + termen proportional cu “inovatia” C x b + Du − y care de fapt masoara “calitatea” estimarii ! Pentru o estimare perfecta avem x b(t) = x(t) si deci inovatia este zero deoarece Cx b + Du − y = C x b − Cx = 0. d) Daca facem o transformare de similaritate asupra sistemului original estimatorul Luenberger se modifica corespunzator (Ex: aratati cum ! ) e) Pentru a construi estimatorul Luenberger singura conditie pe care am impus-o sistemului intitial este cea de detectabilitate (sau respectiv de observabilitate) asupra perechii (C, A). Conditia este nu numai suficienta pentru constructia unui CAPITOLUL 4: SINTEZA ELEMENTARA
247
Estimatori de Tip 1
estimator Luenberger ci si necesara asa cum vom vedea in continuare. Mai mult, conditia este necesara pentru existenta unui estimator general de tipul (146). f) Estimatorul de tipul 1 (Luenberger) are dimensiunea n si de aceea se mai numeste de ordin integ. Asa cum vom vedea, in anumite situatii se pot construi estimatori de ordin mai mic. Teorema 72. Fie sistemul (A, B, C, D) descris de (145). Atunci exista un estimator (146) daca si numai daca perechea (C, A) este detectabila. Daca (C, A) este detectabila atunci un estimator (de tip 1 sau Luenberger) este dat de ecuatille w˙ = (A + LC)w + Bu + LDu − Ly, (151) x b(t) = w(t) unde L este orice matrice a.i. Λ(A + LC) ⊂ C−.
Demonstrat¸ie. Partea de suficienta am aratat-o deja. Demonstram necesitatea prin reducere la absurd. Presupunem ca perechea (C, A) nu este detectabila si fara a restrange generalitatea presupunem deasemenea ca perechea (C, A) este in CAPITOLUL 4: SINTEZA ELEMENTARA
248
Estimatori de Tip 1
forma de descompunere observabila A=
A1 A3 O A2
,
C=
O C2
unde Λ(A1) 6⊂ C− (aceasta rezulta automat din testul PBH aplicat perechii nedetectabile (C, A)). Fie s+ 6∈ C− o valoare proprie si x+ un vector propriu corespunzator ale lui A1. Luam starea initiala x0 a sistemului (A, B, C, D) de forma x+ . xo = O
Evident xo apartine subspatiului neobservabil al perechii (C, A), i.e., x0 ∈ N (C, A). Deasemenea luam w(0) = 0 si u(t) ≡ 0. Atunci ecuatiile pentru x si estimatorul (146) sunt x˙ = Ax, w˙ = Jw + HCx, x b = Kw + N Cx. CAPITOLUL 4: SINTEZA ELEMENTARA
249
Estimatori de Tip 1
Deoarece x0 ∈ N (C, A) rezulta ca iesirea sistemului (A, B, C, D) este identic nula y(t) = Cx(t) = CeAtx0 = 0, ∀t ≥ 0, si deasemenea w(t) = 0, Pe de–alta parte, avem
x b(t) = 0,
∀t.
x(t) = eAtx0 = es+tx0 6→ 0 si deci x b(t) − x(t) 6→ 0 pentru comanda u ≡ 0, starea initiala a estimatorului w(0) = 0 si x0 aleasa ca mai sus ceea ce contrazice ipoteza ca (146) este un estimator pentru sistemul (A, B, C, D). Observatii: a) Dimensiunea unui estimator de tip Luenberger (de tip 1) este egala cu n (dimensiunea spatiului starilor sistemului orginal (A, B, C, D)). Asa cum vom vedea mai tarziu, in anumite situatii se pot construi estimatoare de dimensiune mai CAPITOLUL 4: SINTEZA ELEMENTARA
250
Estimatori de Tip 1
mica si se poate formula problema de constructie a unui estimator de dimensiune minimala (legata de teoria estimatoarelor de tipul 2). b) Am vazut ca un sistem poate fi stabilizat/alocat cu o reactie constanta dupa stare. Deoarece starea nu este in general cunoscuta am construit mai sus un sistem (numit estimator) care estimeaza asimptotic starea sistemului pe baza informatiilor furnizate de semnalele de intrare u si de iesire y. Intrebarea naturala este daca putem stabiliza/aloca sistemul original prin implementarea reactiei constante dupa starea estimata x b (in locul starii reale x care nu este accesibila) ? Raspunsul este pozitiv obtinandu-se compensatorul Kalman.
CAPITOLUL 4: SINTEZA ELEMENTARA
251
Estimatori de Tip 1
5. Compensatorul Kalman Fie (A, B, C, D) un sistem dinamic si presupunem pentru problema de stabilizare cu reactie dinamica dupa iesire ca (A, B) este stabilizabila si (C, A) este detectabila iar pentru problema cu alocare dinamica dupa iesire ca (A, B) este controlabila si (C, A) este observabila. Consideram un compensator cu reactie constanta F dupa starea estimata de catre un estimator Luenberger descris de ecuatiile (151). Obtinem atunci ecuatiile dinamice ale compensatorului – numit compensator Kalman – sau inca
x b˙ = (A + LC)b x + Bu + LDu − Ly, u = Fx b,
x b˙ = (A + LC + BF + LDF )b x − Ly, u = Fx b,
CAPITOLUL 4: SINTEZA ELEMENTARA
252
(152)
(153) Compensatorul Kalman
avand matricea de transfer AK BK A + LC + BF + LDF K(s) := = CK DK F
−L O
,
u = Ky.
Matricile F si L se aleg a.i. A + BF si A + LC sa fie asimptotic stabile (si eventual cu spectru impus). Conectand compensatorul Kalman in reactie inversa cu sistemul original obtinem pentru matricea de stare a sistemului rezultant in bucla inchisa AR =
A −LC
BF A + BF + LC
.
Aplicand transformarea de similaritate T := CAPITOLUL 4: SINTEZA ELEMENTARA
I −I
O I
253
Compensatorul Kalman
asupra lui AR obtinem T ART −1 =
A + BF O
BF A + LC
ceea ce arata ca dinamica (polii) sistemului in bucla inchisa satisfac Λ(AR) = Λ(A + BF ) ∪ Λ(A + LC) si deci sistemul in bucla inchisa este intern asimptotic stabil (si eventual are dinamica prescrisa). Observatii: a) Polii sistemului in bucla inchisa sunt dati de reuniunea polilor alocati ai lui A + BF prin reactia dupa stare F cu polii alocati de estimator Λ(A + LC) prin reactia L. Cele doua alocari se pot face independent, punandu-se astfel in evidenta celebrul principiu al separatiei. b) Un sistem este stabilizabil/alocabil prin reactie (dinamica) dupa iesire daca CAPITOLUL 4: SINTEZA ELEMENTARA
254
Compensatorul Kalman
perechea (A, B) este stabilizabila/controlabila si perechea (C, A) este detectabila/observabila. Aceste conditii sunt nu numai suficiente ci si necesare asa cum reiese din urmatoarea teorema. Teorema 73. Un sistem (A, B, C, D) este stabilizabil/alocabil prin reactie dinamica dupa iesire daca si numai daca perechea (A, B) este stabilizabila/controlabila si perechea (C, A) este detectabila/observabila. Demonstrat¸ie. Suficienta a fost demonstrata constructiv mai sus. Ramane sa aratam necesitatea (Exercitiu !). Indicatie: Pp prin reducere la absurd ca nu este adevarat si puneti in evidenta printr-o descompunere controlabila/observabila anumiti poli ficsi ai sistemului rezultant (ce nu pot fi modificati indiferent de reactia dupa stare.
CAPITOLUL 4: SINTEZA ELEMENTARA
255
Compensatorul Kalman
6. Estimatori de Stare de Ordin Redus (Tip 2)
Fie un sistem (A, B, C, D) cu m intrari, p iesiri si ordinul n (dimensiunea spatiului starilor). Daca dorim estimarea starii acestui sistem nu este nevoie sa construim un estimator care sa estimeze direct toate cele n stari intrucat o parte dintre acestea rezulta automat pe baza iesirilor. Intr–adevar, sa presupunem ca C are rangul egal cu numarul de iesiri p. Atunci cunoscand iesirea y(t) si estimand numai n − p stari rezulta ca celelate p stari se pot calcula din ecuatiile corespunzatoare ale iesirii. Un astfel de estimator de ordin redus se numeste estimator de tipul 2. Pentru constructia estimatorului de tipul 2 facem ipotezele: i) Matricea C este epica, i.e., rank C = p; ii) Matricea C are forma C = O Ip .
(154)
Observatii: a) Ipoteza i) nu constituie o restrictie majora intrucat o putem asigura in etapa de modelare printr-o alegere judicioasa a iesirilor sistemului. In cazul in CAPITOLUL 4: SINTEZA ELEMENTARA
256
Estimatori de Ordin Redus
care prin modelare nu s-a asigurat indeplinirea ei se poate face o schimbare de variabile in spatiul marimilor de iesire punandu–se in evidenta anumite iesiri identic zero sau redundante ce pot fi eliminate ramanand o matrice C ce satisface ipoteza. b) Ipoteza ii) se poate asigura printr–o simpla transformare de coordonate in spatiul starilor (presupunand evident ipoteza i) adevarata) ! c) Rationand prin dualitate, in anumite circumstante matricea intrarilor B se poate Im presupune monica si de forma . O d) Ipotezele i) si ii) implica ca y = Cx + Du =
O Ip
x1 x2
+ Du = x2 + Du
deci starile x2 – in numar de p – sunt automat cunoscute (prin cunoasterea intrarilor si iesirilor) si raman de estimat starile x1 – in numar de n − p. Asa cum am vazut, pentru constructia unui estimator general (146) trebuie sa CAPITOLUL 4: SINTEZA ELEMENTARA
257
Estimatori de Ordin Redus
satisfacem relatiile
Λ(J) ⊂ C−, JV + HC − V A = 0, KV + N C − I = 0,
(celelalte relatii fiind automat satisfacute prin alegerea lui P si M ). Pentru a explicita aceste relatii, partitionam matricile A, B, V , K, N conform cu C in (154), A=
A1 A3 A2 A4
,B =
B1 B2
,V =
V1 V2
,K =
K1 K2
,N =
N1 N2
si obtinem V1A1 + V2A2 = JV1,
V1 A3 + V2A4 = JV2 + H,
K1V1 = I, K1V2 + N1 = 0, K2V1 = 0, K2V2 + N2 = I. Alegem K1 := V1 := I si rezulta automat K2 = 0, N2 = I, N1 = −V2 ceea ce CAPITOLUL 4: SINTEZA ELEMENTARA
258
Estimatori de Ordin Redus
determina complet matricile K si N , ramanand de satisfacut doar conditiile A1 + V2A2 = J,
Λ(J) ⊂ C−,
H = A3 + V2A4 − (A1 + V2 A2)V2 .
(155)
Daca perechea (A1, A2) este detectabila (observabila) atunci putem alege automat V2 := L unde L este reactia care aloca Λ(A1 + LA2) ⊂ C− iar H se defineste pe baza ultimei ecuatii din (155). Ramane sa aratam ca perechea (A1, A2) este detectabila daca sunt indeplinite conditiile de existenta ale unui estimator general, i.e. perechea (C, A) este detectabila. Formulam acest rezultat sub forma unei propozitii de sine statatoare. Teorema 74. Fie un sistem (A, B, C, D) avand matricea C epica. i) Exista o transformare de coordonate a.i. T AT −1 =
CAPITOLUL 4: SINTEZA ELEMENTARA
A1 A3 A2 A4 |{z} |{z} n−p p
}n − p }p
259
,
Estimatori de Ordin Redus
TB =
B1 B2
}n − p , }p
CT
−1
=
O Ip , |{z} |{z} n−p p
(156)
ii) Perechea (A2, A1) este detectabila (observabila) daca si numai daca perechea (C, A) este detectabila (observabila). Demonstrat¸ie. i) Intrucat C este epica de dimensiune p × n, exista o matrice C de dimensiune (n − p) × n a. i. matricea T :=
C C
sa fie inversabila. Avem evident CAPITOLUL 4: SINTEZA ELEMENTARA
C C
T −1 =
In−p O O Ip 260
Estimatori de Ordin Redus
de unde concluzionam ca CT −1 are forma din (156). ii) Avem succesiv
rank
sI − A C
= rank
T (sI − A)T −1 CT −1
= p + rank
sI − A1 A2
sI − A1 −A3 sI − A4 = rank −A2 O Ip
,
∀s ∈ C
de unde concluzia rezulta direct din criteriul Hautus de detectabilitate (observabilitate).
In concluzie am obtinut pentru un estimator de tipul 2 urmatoarea constructie: Pasul 0: Dandu-se sistemul (A, B, C, D) cu perechea (C, A) detectabila (observabila) si matricea C epica, se gaseste cf. Teoremei 74 o transformare de similaritate CAPITOLUL 4: SINTEZA ELEMENTARA
261
Estimatori de Ordin Redus
T a.i. in noul sistem de coordonate sa avem (refolosind notatiile)
A1 A2 |{z} n−p B1 }n − p B= B2 }p A=
A3 A4 |{z} p
,
}n − p }p
C=
(157)
,
O Ip , |{z} |{z} n−p p
in care perechea (A2, A1) este detectabila (observabila). Pasul 1: Se foloseste procedura de alocare pentru perechea (A2, A1) si se determina o matrice V2 a.i. A1 + V2A2 sa aibe spectrul dorit (un anumit spectru impus sau doar localizat in C− in functie de cerinta de proiectare). Pasul 2: Se calculeaza estimatorul cu parametrii J = A1 + V2A2,
H = A3 + V2A4 − A1V2 − V2A2V2,
CAPITOLUL 4: SINTEZA ELEMENTARA
262
M = B1 + V2B2 − HD, Estimatori de Ordin Redus
K=
In−p O
rezultand
,
N=
−V2 Ip
,
V =
In−p V2
,
P =
V2 D −D
w(t) ˙ = (A1 + V2A2)w(t) + Hy(t) + (B1 + V2B2 − HD)u(t), In−p −V2 V2D x b1 (t) = w(t) + y(t) + u(t). b(t) = x x b2 (t) O Ip −D (158) Pasul 3: Se “reverseaza” corespunzator transformarea de similaritate asupra estimatorului, obtinandu-se in final un estimator de tip 2 pentru sistemul original. Observatii: a) Estimatorul de tip 2 obtinut are ordinul egal cu n − p (dimensiunea spatiului starii w(t)). b) Ecuatia iesirii pentru estimatorul de tip 2 (158) contine o parte de dimensiune n − p ce este estimata prin intermediul dinamicii w(t) de forma
x b1(t) = w(t) − V2y(t) + V2Du(t)
CAPITOLUL 4: SINTEZA ELEMENTARA
263
Estimatori de Ordin Redus
si o parte ce este deja cunoscuta de dimensiune p (nu se estimeaza prin intermediul dinamicii) de forma x b2(t) = y(t) − Du(t).
De obicei in ecuatiile dinamice ale estimatorului de tip 2 se pastreaza numai prima parte (b x1(t)). c) Din cele de mai sus rezulta ca in ipoteza (C, A) detectabila si C epica putem intotdeauna construi un estimator de ordin n − p (dimensiunea matricii J). Problema naturala care se pune este daca pe baza acestui estimator putem construi in continuare un compensator care stabilizeaza intern – exact cum am facut in cazul estimatorului de tip 1 obtinand compensatorul Kalman. Interpretarea Estimatorului de Tip 2 (Ordin Redus) Estimatorul de tip 2 poate fi obtinut si prin scrierea directa a unui estimator de tip 1 pentru partea starii ce trebuie efectiv estimata. Intr–adevar, cu notatiile deja introduse avem ca sistemul original este descris de ecuatiile (pentru simplificarea CAPITOLUL 4: SINTEZA ELEMENTARA
264
Estimatori de Ordin Redus
calculelor facem ipoteza D = 0) x˙ 1 = A1x1 + A3x2 + B1u, x˙ 2 = A2x1 + A4x2 + B2u, y = x2
(159)
si inlocuind ultima ecuatie in precedentele doua avem x˙ 1 x˙ 2 = y˙
= A1x1 + A3y + B1u, = A2x1 + A4y + B2u,
sau inca x˙ 1 = A1x1 + A3y + B1u, y˙ − A4y − B2u = A2x1,
(160)
care este un sistem cu dinamica x1 ce se doreste estimata si intrarile u si y. CAPITOLUL 4: SINTEZA ELEMENTARA
265
Estimatori de Ordin Redus
Reamintim ca un estimator de tip 1 se poate pune sub forma x b˙ = Ab x +Bu+L(C x b +Du−y) = Ab x +Bu+LדEROAREA DE ESTIMARE”. (161) Scriind un astfel de estimator pentru sistemul (160) obtinem b1 − y˙ + A4y + B2u). x b˙1 = A1xb1 + A3y + B1u + L(A2x
(162)
Eliminam y˙ facand schimbarea de variabile x b1 = w − Ly si notam V2 := L. Obtinem echivalent w˙ − V2y˙ = A1(w − V y) + A3 y + B1u + V2(A2(w − V2 y) − y˙ + A4y + B2u) (163) sau inca w˙ = (A1 + V2 A2)w + (−A1V2 + A3 − V2A2V2 + V2A4)y + (B1 + V2B2)u. (164) CAPITOLUL 4: SINTEZA ELEMENTARA
266
Estimatori de Ordin Redus
Din ultima ecuatie din (159) obtinem
x b1 x b2
=
In−p O
w+
−V2 Ip
y.
(165)
Comparand ecuatille (164), (165) cu ecuatille (158) observam ca acestea coincid in ipoteza facuta D = 0. In consecinta am reobtinut expresia estimatorului de tip 2 scriind un estimator de tip 1 pentru susbsisemul cu dinamica ce trebuie efectiv estimata x1 ! Exercitiu: Aratati acelasi lucru fara a face ipoteza D = 0 ! Stabilizarea cu Estimatoare Generale Am vazut ca daca folosim o schema de compensare cu reactie constanta F dupa starea estimata printr-un estimator de tip 1 se obtine un compensator Kalman care stabilizeaza intern sistemul si eventual aloca o dinamica dorita. Aratam in continuare ca o schema similara in care insa estimarea se face cu un estimator general se poate deasemenea folosi pentru stabilizare/alocare. CAPITOLUL 4: SINTEZA ELEMENTARA
267
Estimatori de Ordin Redus
In particular, in cazul in care estimarea se face cu un estimator de ordin redus (de tipul 2) sistemul rezultant va avea dimensiunea spatiului starilor de dimensiune redusa (< 2n). Fie un sistem
x˙ = Ax + Bu, y = Cx + Du,
(166)
si un estimator general descris de ecuatiile
w˙ = Jw + Hy + M u, x b = Kw + N y + P u,
(167)
ce satisface automat conditiile: a) J asimptotic stabila; b) JV + HC − V A = 0; c) M − V B + HD = 0; d) KV + N C − I = 0; CAPITOLUL 4: SINTEZA ELEMENTARA
268
Estimatori de Ordin Redus
e) P + N D = 0.
Consideram o schema de compensare cu reactie constanta F dupa starea estimata x b, i.e., u = Fx b.
(168)
N y + P u = N Cx + N Du − N Du = N Cx,
(169)
Studiem comportarea dinamica in bucla inchisa a sistemului descris de (166), (167) si (168). Evaluam intai
unde am folosit proprietatea e). Avem succesiv x˙ = Ax + Bu = Ax + BF x b = Ax + BF (Kw + N y + P u) = Ax + BF Kw + BF N Cx = (A + BF N C)x + BF Kw CAPITOLUL 4: SINTEZA ELEMENTARA
269
(170)
Estimatori de Ordin Redus
in care am folosit (169). Pentru dinamica w obtinem w˙ = Jw + Hy + M u = Jw + HCx + HDu + M F (Kw + N Cx) = (HC + M F N C)x + (J + M F K)w + HDu
(171)
in care am folosit succesiv (168) si (169). Evaluam separat HDu = HDF x b = HDF (Kw + N Cx) = HDF N Cx + HDF Kw
pe care il inlocuim in (171) obtinand
w˙ = (HC + M F N C + HDF N C)x + (J + M F K + HDF K)w.
(172)
Din (170) si (172) avem ca dinamica sistemului rezultant este data de ˙ x A + BF N C = w HC + (M + HD)F N C CAPITOLUL 4: SINTEZA ELEMENTARA
BF K J + (M + HD)F K 270
x w
Estimatori de Ordin Redus
si deci matricea de stare a sistemului rezultant este A + BF N C BF K AR = HC + V BF N C J + V BF K in care am folosit proprietatea c). Pentru a pune in evidenta spectrul acestei matrici facem o transformare de coordonate I O T = −V I si obtinem T ART −1 =
A + BF N C + BF KV −V A + HC + JV
BF K J
=
A + BF O
BF K J
,
unde pentru ultima egalitate am folosit proprietatile d) si b). Din relatia de mai sus concluzionam ca Λ(AR) = Λ(A + BF ) ∪ Λ(J) CAPITOLUL 4: SINTEZA ELEMENTARA
271
Estimatori de Ordin Redus
si deci Λ(AR) ⊂ C− daca alegem F a.i. Λ(A + BF ) ⊂ C−. Observatii: a) Daca (A, B) controlabila atunci putem aloca orice spectru pentru A + BF si daca (C, A) observabila atunci putem aloca orice spectru pentru estimator Λ(J) rezultand ca putem aloca orice dinamica pentru sistemul rezultant in bucla inchisa. b) Ordinul sistemului rezultant este n + ne unde ne este ordinul estimatorului.
CAPITOLUL 4: SINTEZA ELEMENTARA
272
Estimatori de Ordin Redus
7. Reglarea Sistemelor Dinamice Problematica, Ipoteze In aceasta sectiune abordam problema reglarii sistemelor dinamice. Problema clasica de reglare intern stabila consta in gasirea unui regulator care sa realizeze simultan urmatoarele deziderate asupra sistemului rezultant in bucla inchisa: (S) Sa fie intern asimptotic stabil; (Re) Sa urmareasca (macar) asimptotic anumite semnale (sau clase de semnale) prescrise numite referinte r; (Rj) Sa rejecteze (macar) asimptotic anumite perturbatii d sau zgomote w; (FIG). Solutia generala a problemei de reglare intern stabila are o serie de inconveniente majore: CAPITOLUL 4: SINTEZA ELEMENTARA
273
Reglarea Sistemelor Dinamice
(i) Este foarte complicata; (ii) Este bazata pe geometria interna a sistemului original si pe o serie de descompuneri structurale sofisticate in spatiul starilor; (iii) Conditiile de solvabilitate sunt in general greu de verificat dpdv procedural; (iv) Solutia generala este complet nerobusta in raport cu perturbatiile parametrice sau structurale ale modelului (A, B, C, D) limitand major aplicabilitatea metodelor la cazul sistemelor cu dimensiuni medii sau relativ mari. In continuare vom prezenta solutia in anumite cazuri particulare insa de mare interes practic in care neajunsurile de mai sus sunt partial eliminate prin ipotezele facute. Ne restrangem la prezentarea unei solutii in caz particular deoarece: • Efortul de a prezenta/intelege solutia completa (in intreaga ei complexitate) nu se justifica in general in raport cu clasa aplicatiilor concrete ”real–life”; CAPITOLUL 4: SINTEZA ELEMENTARA
274
Reglarea Sistemelor Dinamice
• Solutia generala este nerobusta; • Exista abordari alternative bazate pe teoria sistemelor robuste ce furnizeaza solutii mult mai fezabile; Ipotezele pe care le facem sunt: (I1) d = 0 (nu apar perturbatii); (I2) w = 0 (nu apar zgomote); (I3) D = 0 (ipoteza facuta ptr. simplificarea calculelor); (I4) r(t) = 1(t) (referintele sunt semnale de tip treapta). Conditiile de reglare asimpotic stabila CAPITOLUL 4: SINTEZA ELEMENTARA
275
Reglarea Sistemelor Dinamice
Incepem prin a explicita conditiile pe care trebuie sa le indeplineasca sistemul in bucla inchisa pentru a realiza dezideratele (S) si (Re) sub ipotezele (I1)-(I3). In final, vom introduce principiul modelului intern pentru sistemele descrise pe spatiul starilor si vom particulariza constructia efectiva a unui regulator in ipoteza (I4) – care realizeaza urmarirea asimptotica a unor referinte de tip treapta –. PROBLEMA: Dandu–se sistemul dinamic x˙ = Ax + Bu y = Cx
(173)
avand m intrari, p iesiri si dimensiunea spatiului starilor n, si vectorul de semnale de referinta r(t) ∈ Rp, se cere un sistem dinamic (regulator) x˙ K u
= AK xK + BK ǫ = CK xK + DK ǫ,
(174)
in care ǫ = r − y, astfel incat sa aibe loc: CAPITOLUL 4: SINTEZA ELEMENTARA
276
Reglarea Sistemelor Dinamice
(S) Sistemul in bucla inchisa sa fie intern asimptotic stabil; (Re) Iesirile y sa urmareasca asimptotic referintele r(t), i.e., lim ǫ(t) = 0.
t→∞
Clasa semnalelor referinta se considera de tip persistent generate de un generator liniar de semnal (de tipul celor introduse la studiul regimului permanent/tranzitoriu) x˙ r r
= Ar xr = Cr xr .
Λ(Ar ) ⊂ C− ∪ C0
xr (0) = xro,
(175)
Referintele vor avea atunci expresia r(t) = Cr eAr txro. CAPITOLUL 4: SINTEZA ELEMENTARA
277
Reglarea Sistemelor Dinamice
Eliminand succesiv semnalele din bucla si tinand cont ca ǫ = r − y = r − Cx obtinem x˙ K = AK xK + BK r − BK Cx (176) u = CK xK + DK r − DK Cx. Inlocuind ultima ecuatie in x˙ = Ax + Bu obtinem succesiv x˙ = Ax + B(CK xK + DK r − DK Cx) = (A − BDK C)x + BCK xK + BDK r si deci pentru sistemul in bucla inchisa obtinem ecuatiile dinamice ˙ x A − BDK C BCK x BDK = + r xK −BK C AK xK BK x −C O + Ip r ǫ = x K x C O y = xK CAPITOLUL 4: SINTEZA ELEMENTARA
278
(177)
Reglarea Sistemelor Dinamice
sau x˙ R = AR xR + BRr ǫ = CR xR + DRr,
(178)
unde
AR =
A − BDK C −BK C
BCK AK
, BR =
BDK BK
, CR =
−C
O
, D R = Ip , (179)
Conditia (S) de stabilitate interna devine atunci Λ(AR) ⊂ C− si explicitam in continuare conditia de reglare (Re). Combinand ecuatiile sistemului in bucla inchisa (178) cu cele ale generatorului de semnale de referinta (175) CAPITOLUL 4: SINTEZA ELEMENTARA
279
Reglarea Sistemelor Dinamice
xR
obtinem ˙ xR AR BRCr xR = , xr O Ar x r xR CR Cr ǫ = xr
xR (0) = xRo,
xr (0) = xro, (180)
sau
x˙ Rr = ARr xRr , xRr (0) = xRro, ǫ = CRr xRr unde am folosit notatiile AR BRCr xR ARr = , CRr = CR Cr , xRr = , O Ar xr
(181)
xRo xRro = xro (182)
Conditia de reglare (Re) lim ǫ(t) = 0,
t→∞ CAPITOLUL 4: SINTEZA ELEMENTARA
∀ 280
xRro Reglarea Sistemelor Dinamice
devine atunci lim CRr eARr txRro = 0,
∀
t→∞
xRro.
(183)
Observatie fundamentala: Aceasta cerinta nu poate fi realizata prin impunerea conditiei ca matricea de stare ARr sa fie intern asimptotic stabila deoarece ARr contine valori proprii care sunt sigur in C+ ∪ C0 (semnalul r a fost presupus persistent)! Singura posibilitate pentru a satisface conditia de (Re) ramane sa impunem ca dinamica care nu este stabila sa fie neobservabila in raport cu perechea (CRr , ARr ) si acest lucru sa-l satisfacem prin alegerea judicioasa a parametrilor regulatorului ce se regasesc implicit in parametrii sistemului rezultant (AR , BR, CR, DR) ! In consecinta conditia de reglare implica satisfacerea anumitor proprietati structurale relativ sofisticate in spatiul starilor sistemului rezultant ! Pentru a satisface conditia (Re) trebuie sa impunem deci conditia ca subspatiul invariant asociat dinamicii Ar sa fie neobservabil in perechea (CRr , ARr ) explicitata in (182). O baza pentru subspatiul invariant corespunzator lui Ar – notat V+ are CAPITOLUL 4: SINTEZA ELEMENTARA
281
Reglarea Sistemelor Dinamice
evident expresia
V I nr unde V este o matrice ce se determina din conditia ca V+ sa fie neobservabil. Facand o completare pana la o transformare inversabila obtinem V+ =
S=
I nR O
V I nr
de unde S
−1
ARr S =
AR ARV + BRCr − V Ar O CR V + Cr
,
CRr S =
CR CRV + Cr
iar in noul sistem de coordonate avem O V+ = . I nr CAPITOLUL 4: SINTEZA ELEMENTARA
282
Reglarea Sistemelor Dinamice
Din conditia ca V+ este ARr invariant si inclus in Ker CRr se obtin conditiile AR V + BRCr − V Ar = 0,
CR V + Cr = 0.
(184)
Deci existenta unei matrici V care satisface relatiile (184) este echivalenta cu satisfacerea cerintei de reglare (Re) explicitata sub forma (183). Observatie: Prima conditie (184) este o ecuatie Sylvester ce are intotdeauna o solutie unica deoarece Λ(AR) ⊂ C− si Λ(Ar ) ⊂ C+ ∪ C0 (Explicati acest lucru pe baza conditiilor generale de existenta/unicitate a solutiilor ecuatiilor Sylvester – vezi Appendix). In concluzie am redus problema originala de reglare intern asimptotic stabila la gasirea unui sistem (AK , BK , CK , DK ) a.i. : (S) Λ(AR) ⊂ C−; (Re) Solutia unica V a ecuatiei Sylvester AR V + BRCr − V Ar = 0 sa satisfaca CRV + Cr = 0. CAPITOLUL 4: SINTEZA ELEMENTARA
283
Reglarea Sistemelor Dinamice
Observatie: Tinand cont de expresiile explicite ale matricilor sistemului in bucla inchisa (AR , BR, CR, DR) ca functii de parametrii regulatorului (AK , BK , CK , DK ) (vezi (179)) este clar ca aceste conditii algebrice nu sunt deloc triviale sau usor de explicitat intr-o forma procedurala. De aceea ne vom limita la prezentarea cazului reprezentativ al referintelor de tip treapta. Reglarea la Referinte Treapta Fie sistemul (A, B, C, D = 0) avand matricea de transfer T (s) si y = T u. Facem ipotezele ca (A, B) este stabilizabila si (C, A) este detectabila, conditii ce sunt necesare si suficiente pentru existenta unui compensator stabilizator. Considerand o schema clasica de reglare cu regulatorul K(s) montat pe calea directa intre eroare ǫ := r − y si comanda u, i.e., u = Kǫ. Conform principiului modelului intern, pentru a regla la referinte de tip treapta trebuie ca modelul referintei M (s) sa fie inclus in matricea de transfer in bucla deschisa, in cazul nostru L(s) := T (s)K(s). Mai exact, cum T (s) este dat, CAPITOLUL 4: SINTEZA ELEMENTARA
284
Reglarea Sistemelor Dinamice
impunem ca modelul referintei sa fie inclus in e K(s) = K(s)M (s)
(185)
unde M (s) este matricea de transfer a modelului referintei. Aceasta conditie asigura automat cerinta de reglare (Re). Daca consideram reglarea la referinta treapta atunci 1 M (s) = Ip. s Pentru a asigura cerinta (S) trebuie ca regulatorul K(s) sa stabilizeze intern T (s) e sau, echivalent, ca K(s) sa stabilizeze intern Te(s) = M (s)T (s) (FIG) – K(s) are o parte fixata R(s) pe care o includem in Te(s) –. In consecinta proiectam e un compensator stabilizator K(s) pentru Te(s) dupa care regulatorul dorit se calculeaza din (185). Explicitam in continuare aceste conditii in termenii ecuatiilor dinamice de stare. CAPITOLUL 4: SINTEZA ELEMENTARA
285
Reglarea Sistemelor Dinamice
Fie
x˙ M ye
sau inca
= AM xM + BM ǫ = CM xM + DM ǫ
(186)
x˙ M = AM xM + BM (r − Cx) ye = CM xM + DM (r − Cx) ecuatiile ce descriu dinamica modelului referintei si
(187)
x˙ = Ax + Bu, y = Cx, ecuatiile ce descriu sistemul. O realizare de stare pentru sistemul Te cu ye = Teu se obtine automat inseriind T (s) cu M (s) (semnalul exogen r = 0) Te =
"
CAPITOLUL 4: SINTEZA ELEMENTARA
e B e A e D e C
#
A = −BM C O 286
O AM CM
B O . O
(188)
Reglarea Sistemelor Dinamice
Deci problema s-a redus la constructia unui compensator pentru Te dat de (188).
In cazul particular in care dorim reglarea la referinte de tip treapta avem AM = 0, BM = Ip, CM = Ip, DM = 0 si (188) devine
Te =
"
e B e A e D e C
#
A = −C O
O B O O . Ip O
(189)
Pentru scrierea unui compensator stabilizator pentru Te putem aplica schema standard de scriere a unui compensator Kalman (sau orice schema de stabilizare e este cu estimator de stare si reactie dupa starea estimata). Intrucat matricea C epica preferam sa scriem un estimator de ordin redus si sa luam o reactie dupa starea estimata obtinand in final un sistem compensator de ordin mai mic decat Te(s) (si de acelasi ordin cu T (s)). Pentru scrierea unui estimator de ordin redus folosim direct formulele (158) CAPITOLUL 4: SINTEZA ELEMENTARA
287
Reglarea Sistemelor Dinamice
observand in prealabil ca realizarea (189) este in forma (157) si facand identificarile
e= A
A −C
O O
=
A1 A3 A2 A4
e= ,B
B O
=
B1 B2
e= ,C
O Ip
.
Conditia necesara si suficienta pentru existenta unui estimator este ca perechea (A2, A1) = (−C, A) sa fie detectabila ceea ce este automat asigurat in ipotezele de e = −L a.i. Λ(A + LC) = Λ(A − LC) e ⊂ C−. lucru ((C, A) este detectabila). Fie L Obtinem pentru ecuatiile estimatorului de ordin redus
b= x
w (A + LC)w y + Bu, ˙ = + (A + LC)Le In−p L x b1 = w+ ye. x b2 O Ip
(190)
Un compensator stabilizator se obtine atunci luand o reactie stabilizanta dupa CAPITOLUL 4: SINTEZA ELEMENTARA
288
Reglarea Sistemelor Dinamice
starea estimata de forma h u= F
i x b1 = F (w + Le y ) + Feye. Fe x b2
(191)
e B) e este O astfel de reactie stabilizanta exista daca si numai daca perechea (A, stabilizabila. Acest lucru nu este insa automat indeplinit decat daca facem ipoteza ca modelul referintei (polii s = 0) nu este simplificat de modelul sistemului T (s) ! (Ex: faceti conexiunea cu sistemele SISO – trebuie ca diag { 1s } sa apara in fctia de transfer in bucla deschisa si deci nu trebuie sa se simplifice in produsul L = T K –. O conditie suficienta ca sa nu apara aceasta simplificare este ca sistemul T sa nu aibe zerouri in s = 0 ceea ce este asigurat de impunerea conditiei −A −B = n + p. (192) rank C O e B) e este stabilizabila Intr-adevar, daca (A, B) stabilizabila si are loc (192) atunci (A, (Ex: Demonstrati acest lucru folosind criteriul PBH). CAPITOLUL 4: SINTEZA ELEMENTARA
289
Reglarea Sistemelor Dinamice
Deci in ipotezele (A, B) stabilizabila, (C, A) detectabila si (192) exista un compensator stabilizator care se obtine luand o reactie dupa starea estimata prin intermediul unui estimator de ordin redus pentru sistemul Te. Ecuatiile compensatorului sunt w˙ x b1 x b2 u
= = = =
(A + LC)w + (A + LC)Le y + Bu w + Le y ye F (w + Le y ) + Fe ye
(193)
sau eliminand w prin inlocuire din a doua ecuatie si inlocuind u in prima ecuatie obtinem x b˙1 = (A + LC + BF )b x1 + +B Fe x b2 + Lǫ x b˙2 = ǫ e2 u = Fx b1 + Fe x
(194)
unde am tinut cont ca ye = x b2 si x b˙2 = ǫ. Deci un compensator stabilizator pentru CAPITOLUL 4: SINTEZA ELEMENTARA
290
Reglarea Sistemelor Dinamice
T (s) este dat de
K(s) =
AK CK
BK DK
A + LC + BF O = F
B Fe L I O . Fe O
(195)
A ramas de verificat ca intr–adevar acest compensator (regulator) asigura de fapt reglarea. Acest lucru se arata verificand conditiile de reglare (184) ARV + BRCr − V Ar = 0,
CRV + Cr = 0
in care Ar = O, Cr = I. Aceasta este echivalent cu a arata ca solutia ecuatiei ARV = −BR verifica CRV = −Ip. Inlocuind expresiile lui AR , BR si CR cu datele obtinute CAPITOLUL 4: SINTEZA ELEMENTARA
291
Reglarea Sistemelor Dinamice
rezulta dupa partitionarea corespunzatoare a lui V
(AR V =)
A −LC −C
BF A + BF + LC O
e BF O V1 B Fe V2 = −L V3 −Ip O
si
(= −BR) (196)
V1 −C O O V2 = −Ip. (CR V =) (197) V3 Inspectand ultima relatie observam ca este identica cu ultima ecuatie din (196) si deci daca V verifica (196) atunci automat verifica si (197). In final, V exista si este unic intrucat AR este inversabila (Λ(AR) ⊂ C− asa cum rezulta din teoria stabilizarii cu compensatoare de ordin redus).
Procedura de reglare la referinta treapta cu compensare asimptotic intern stabila – Exercitiu – CAPITOLUL 4: SINTEZA ELEMENTARA
292
Reglarea Sistemelor Dinamice
ANEXA: COMPLEMENTE DE ALGEBRA LINIARA 1. Forma Canonica Jordan si Notiuni Conexe 2. Aspecte Geometrice in Algebra Liniara Finit Dimensionala 3. Ecuatii Matriciale Liniare
COMPLEMENTE DE ALGEBRA LINIARA
293
COMPLEMENTE DE ALGEBRA LINIARA
1. Forma Canonica Jordan si Notiuni Conexe In aceasta parte a Anexei prezentam cateva rezultate de teoria operatorilor liniari pe spatii finit dimensionale. Punctul de vedere este axat pe reprezentarea matriciala (intr-o baza fixata) a aplicatiei liniare. In principal vom da rezultate privind valorile proprii, vectorii proprii, spatii invariante si forme canonice Jordan. Fie C si R multimea numerelor complexe si respectiv reale. Notam cu Rn spatiul vectorial n–dimensional cu elemente in R (vectorii sunt considerati prin conventie intotdeauna de tip coloana) si fie Rp×m multimea matricilor de dimensiune p × m cu elemente in R (prin simpla inlocuire a lui R cu C vom folosi notatii similare pentru cazul elementelor complexe). Notam R sau C cu F. Fie N ∈ Fn×n. N reprezinta in mod natural o transformare liniara din Fn in Fn. Problema rezolvarii ecuatiei polinomiale de grad n χ(s) := det(sIn − N ) = 0 COMPLEMENTE DE ALGEBRA LINIARA
294
(198) Forma Canonica Jordan si Notiuni Conexe
in necunoscuta s ∈ C se numeste problema de valori proprii iar χ(s) se numeste polinom caracteristic al matricii N . Din teorema fundamentala a algebrei aceasta ecuatie are intotdeauna n radacini complexe (eventual care coincid) care se numesc valori proprii ale lui N . Setul celor n valori proprii se numeste spectrul lui N si se noteaza cu Λ(N ). Daca s0 este o valoare proprie a lui N , atunci exista intotdeauna un vector nenul x ∈ Cn – numit vector propriu al lui N – astfel incat N x = s0x. Daca s0 = 0 este o valoare proprie a lui N atunci N se numeste singulara. O matrice nesingulara are o inversa si se numeste inversabila. Mai exact, daca N ∈ Fn×n este nensingulara, atunci exista o matrice unica in Fn×n, numita inversa lui N si notata N −1 , a.i. N −1N = N N −1 = In (matricea identitate). Pe multimea matricilor n × n introducem relatia de echivalenta numita similaritate. e ∈ Fn×n s.n. similare daca exista o matrice inversabila Doua matrici N, N T ∈ Fn×n a. i. e. T N T −1 = N (199)
T se asociaza cu o schimbare de baza in Fn. Astfel orice x ∈ Fn se transforma e reprezinta aceeasi transformare liniara din Fn in Fn in x e = T x, iar N si N COMPLEMENTE DE ALGEBRA LINIARA
295
Forma Canonica Jordan si Notiuni Conexe
reprezentata in doua baze diferite. Forma Canonica Jordan Prezentam in continuare forma canonica Jordan indusa de transformarile de similaritate. Forma canonica Jordan complexa Transformarea de similaritate (199) induce o forma canonica pe multimea matricilor de dimensiune n × n cu elemente in C numita forma canonica Jordan complexa. Fie N ∈ Cn×n si fie {s1, s2, . . . , sk } multimea celor k valori proprii distincte ale lui N . Atunci exista intotdeauna o transformare inversabila T ∈ Cn×n a.i. T N T −1 = NJ
(200)
NJ := diag (N11(s1), N22(s2), . . . , Nkk (sk )),
(201)
unde
COMPLEMENTE DE ALGEBRA LINIARA
296
Forma Canonica Jordan si Notiuni Conexe
Nii(si) := diag (Js(i) (si), Js(i) (si), . . . , Js(i) (si)), 1
2
(202)
hi
si Js(si) este o s × s matrice elementara de forma
si 1 si . . . . . . 1 , Js(si) := si
(203)
numita bloc elementar Jordan. Multimea de valori proprii distincte {s1, s2, . . . , sk } impreuna cu multimea indicilor (i) {sj , i = 1, . . . , k, j = 1, . . . , hi} determina complet forma canonica Jordan (pana la o permutare a blocurilor pe diagonala principala). Pentru o valoare (i) proprie si, dimensiunile blocurilor sj , (j = 1, . . . , hi) se numesc indici Jordan elementari (sau multiplicitati partiale ) ale valorii proprii si. Intregii pozitivi hi (i) (i) se numesc multiplicitati geometrice a lui si. Suma ni = s1 + · · · + shi se COMPLEMENTE DE ALGEBRA LINIARA
297
Forma Canonica Jordan si Notiuni Conexe
numeste multiplicitate algebrica a lui si si este multiplicitatea lui si ca radacina a polinomului caracteristic.
COMPLEMENTE DE ALGEBRA LINIARA
298
Forma Canonica Jordan si Notiuni Conexe
Forma canonica Jordan reala Fie N o matrice cu elemente reale. O matrice N ∈ Rn×n nu are intotdeauna n valori proprii reale dar are intotdeauna n valori proprii complexe. Valorile proprii care nu sunt reale sunt prezente in perechi complex conjugate. Aceasta face ca studiul formelor canonice sub transformari de similaritate avand elemente reale sa fie oarecum diferit. Fie {s1, s2, . . . , sr , sr+1, . . . , sk , sr+1, . . . , sk } spectrul lui N , unde s1, . . . , sr , sunt valorile proprii reale si sr+1, . . . , sk , sr+1, . . . , sk , sunt valorile proprii care nu sunt reale si apar in perechi complex conjugate. Astfel daca restrangem clasa transformarilor de similaritate T exclusiv la cele cu elemente reale obtinem forma canonica Jordan reala NJ a lui N , unde NJ are forma din (201), Nii(si) are forma (202)–(203) pentru valorile proprii reale si (i = 1, . . . , r) in timp ce pentru valorile proprii care nu sunt reale si = αi + jβi COMPLEMENTE DE ALGEBRA LINIARA
299
Forma Canonica Jordan si Notiuni Conexe
(αi, βi ∈ R, βi 6= 0, i = r + 1, . . . , k), avem Nii(si) := diag (Js(i) (αi, βi), Js(i) (αi, βi), . . . , Js(i) (αi, βi)), 1
2
(204)
hi
unde Js(αi, βi) este o 2s × 2s matrice elementara de forma
K(αi, βi)
Js(αi, βi) :=
I2 K(αi, βi)
I2 K(αi, βi) . . . ...
I2 K(αi, βi)
(205)
numita bloc Jordan elementar real, unde K(αi , βi ) := COMPLEMENTE DE ALGEBRA LINIARA
αi βi −βi αi 300
. Forma Canonica Jordan si Notiuni Conexe
Observatie: Orice doua matrici similare au aceeasi forma Jordan (si deci acelasi spectru si indici Jordan elementari). Subspatiu Invariant al unei Matrici Patrate Definitia 75. Fie A ∈ Fn×n. Subspatiul vectorial V ⊂ Fn se numeste subspatiu invariant al lui A daca AV ⊂ V. (206)
Cel mai simplu exemplu de spatiu invariant sunt vectorii proprii. Este usor de verificat ca daca V este un subspatiu invariant de dimensiune ℓ, atunci exista o transformare de similaritate U , partitionata U
COMPLEMENTE DE ALGEBRA LINIARA
=
U1
U2
|{z} |{z} ℓ n−ℓ 301
,
(207)
Forma Canonica Jordan si Notiuni Conexe
cu V = Im U1, astfel incat U
−1
AU
=
A11 A12 O A22 | {z } |{z} ℓ n−ℓ
}ℓ }n − ℓ
(208)
si Λ(A) = Λ(A11)∪Λ(A22). In acest nou sistem de coordonate V este reprezentata prin Iℓ V = Im . (209) O
Matricea A restrictionata la subspatiul (invariant) V si spectrul ei restrictionat la subspatiul (invariant) V se definesc prin A|V := A11, Λ(A)|V := Λ(A11). COMPLEMENTE DE ALGEBRA LINIARA
302
Forma Canonica Jordan si Notiuni Conexe
Reciproc, daca (208) este adevarata pentru o matrice nesingulara U ca in (207), atunci V = Im U1 este un subspatiu invariant a lui A si Λ(A)|V = A11. Consideram o a partitie a planului complex in doua submultimi disjuncte C = Cg ∪ Cb. Un subspatiu invariant V se numeste Cg –invariant daca Λ(A)|V ⊂ Cg . Daca Λ1 ∪ Λ2 = Λ(A) este o partitie a spectrului lui A ∈ Fn×n atunci exista un susbaptiu invariant V a lui A astfel incat Λ(A)|V = Λ1. Acest lucru rezulta din forma canonica Jordan. Daca A are elemente reale si Λ1 este un set simetric (in raport cu axa imaginara), atunci putem alege V ⊂ Rn. Mai mult, daca Λ1 ∩Λ2 = ∅ atunci V este unic. Urmatorul rezultat este folosit intens in Teoria Sistemelor Liniare. Teorema 76. Fie A ∈ Fn×n. 1. Daca V = Im V ⊂ Fn este un subspatiu invariant al lui A de dimensiune ℓ, COMPLEMENTE DE ALGEBRA LINIARA
303
Forma Canonica Jordan si Notiuni Conexe
unde V ∈ Fn×ℓ este o matrice baza pentru V, atunci exista o matrice S ∈ Fℓ×ℓ a.i. AV = V S. (210) Mai mult, S = A|V . 2. Reciproc, daca AV = V S pentru o anumita amtrice baza V ∈ Fn×ℓ si o matrice S ∈ Fℓ×ℓ, atunci V = Im V este un subspatiu invariant a lui A si S = A|V . Demonstrat¸ie. Rezulta automat din definitia subspatiului invariant.
COMPLEMENTE DE ALGEBRA LINIARA
304
Forma Canonica Jordan si Notiuni Conexe
2. Aspecte Geometrice in Algebra Liniara Finit Dimensionala Fie A o aplicatie liniara dintr–un spatiu vectorial X de dimensiune n intr–un spatiu vectorial Y de dimensiune m. Daca X si Y sunt spatii vectoriale peste F (tipic R sau C), atunci liniaritatea lui A implica ca daca yi = Axi ,
i = 1, 2,
atunci (α1y1 + α2y2) = A(α1x1 + α2x2), ∀α1, α2 ∈ F. Alegand baze in ambele subspatii X si Y putem intotdeauna reprezenta aplicatia A printr-o matrice m × n pentru care se foloseste adesea (prin abuz de notatie!) tot simbolul A. In Teoria Sistemelor este adesea util sa consideram anumite aspecte geometrice ale aplicatiei A mai degraba decat proprietatile matricii A, cu toate ca – evident – cele doua puncte de vedere sunt strans relationate. COMPLEMENTE DE ALGEBRA LINIARA
305
Aspecte Geometrice in Algebra Liniara
Nucleu si Imagine Consideram doua subspatii S ⊂ X si R ⊂ Y. Definim imaginea lui S prin aplicatia A ca fiind multimea AS := {y | y = Ax, x ∈ S} si preimaginea (sau imaginea inversa) a lui R prin aplicatia A ca fiind multimea A−1R := {x | y = Ax,
y ∈ R} .
Se poate verifica imediat ca ambele multimi sunt de fapt subspatii ale lui Y si respectiv X . Observatie: Preimaginea (sau imaginea inversa) se poate defini pentru orice aplicatie A, chiar daca matricea corespunzatoare A nu este patrata sau inversabila. In particular, daca S = X si R = {0} obtinem doua spatii remarcabile asociate oricarei aplicatii liniare: COMPLEMENTE DE ALGEBRA LINIARA
306
Aspecte Geometrice in Algebra Liniara
• Subspatiul AX este imaginea intregului spatiu X prin aplicatia A si se numeste imaginea lui A (notata Im A), Im A := AX = {y | y = Ax,
x ∈ X } ⊂ Y;
• Subspatiul A−1{0} este preimaginea vectorului nul si se numeste nucleul lui A (notata Ker A), Ker A := A−1 {0} = {x | Ax = 0} ⊂ X .
Baze pentru aceste subspatii se obtin facand anumite descompuneri ale matricii A. COMPLEMENTE DE ALGEBRA LINIARA
307
Aspecte Geometrice in Algebra Liniara
Propozitia 77. O m × n matrice Y de forma Y =
Y1 O
}r }m − r
(211)
cu Y1 avand rang intreg pe linii r are imaginea Im
i.e., orice vector
y1 O
}r
Ir O
,
apartine imaginii lui Y .
O m × n matrice X de forma X=
COMPLEMENTE DE ALGEBRA LINIARA
X1 O |{z} |{z} r n−r
308
(212)
Aspecte Geometrice in Algebra Liniara
cu X1 avand rang intreg pe coloane r are un nucleu egal cu Im
i.e., orice vector
O x2
}n − r
O In−r
,
apartine nucleului lui X.
Demonstrat¸ie. Consideram y = Y x pentru oricare x ∈ Cn si partitionam y conform cu (211) de unde obtinem y1 = Y1x, y2 = 0. Din ipoteza ca Y1 are rang intreg pe linii r rezulta ca exista r coloane liniar independente care genereaza orice vector y1 ∈ Cr . Consideram Xx = 0, x ∈ Cn, de unde obtinem partitionand x in conformitate cu (212) X1x1 = 0, 0 · x2 = 0. Din ipoteza ca X1 are coloane independente rezulta ca x1 = 0 este unica solutie a ecuatiei X1x1 = 0. Pe de–alta parte, orice vector x2 satisface 0 · x2 = 0. COMPLEMENTE DE ALGEBRA LINIARA
309
Aspecte Geometrice in Algebra Liniara
Propozitia 78. Fie B o aplicatie din X in Z si A o aplicatie din Z in Y. Atunci
Im (A · B) = AIm B Ker (A · B) = B −1Ker A
Demonstrat¸ie. Avem Im (AB) = {y | ABx = y, x ∈ X }. Deoarece Im B = {z | Bx = z, x ∈ X } COMPLEMENTE DE ALGEBRA LINIARA
310
Aspecte Geometrice in Algebra Liniara
avem deasemenea Im (AB) = {y | Az = y, z ∈ Im B} = AIm B. Din definitia nucleului obtinem Ker (AB) = {x | ABx = 0}, sau inca {x | Bx = z,
z ∈ Ker A} = B −1Ker A.
Propozitia 79. • Daca B este inversabila la dreapta atunci Im AB = Im A. • Daca A este inversabila la stanga atunci Ker AB = Ker B. COMPLEMENTE DE ALGEBRA LINIARA
311
Aspecte Geometrice in Algebra Liniara
Demonstrat¸ie. Daca B este inversabila la dreapta atunci are liniile liniar independente si Im B = Z. Din Propozitia 78 Im (A · B) = AIm B = AZ = Im A. Daca A este inversabila la stanga atunci are coloanele liniar independente si Ker A = {0}. Din Propozitia 78 avem Ker (A · B) = B −1Ker A = B −1{0} = Ker B.
Descompuneri si Transformari de Coordonate Consideram descompunerea in valori singulare a unei matrici generale ∗
A = U ΣV = COMPLEMENTE DE ALGEBRA LINIARA
U1 U2
Σr O
O O 312
V1 V2
∗
(213)
Aspecte Geometrice in Algebra Liniara
unde Σr este diagonala si inversabila. Aceasta descompunere genereaza baze ortonormale pentru cateva subspatii importante ale aplicatiei A. Propozitia 80. Fie descompunerea in valori singulare a lui A din (213). Atunci avem Im A = Im U1, Ker A = Im V2 , Im A∗ = Im V1,
Ker A∗ = Im U2.
Demonstrat¸ie. Din Propozitiile 78 si 79 avem Im A = Im U ΣV ∗ = Im U Σ = U Im Σ
Ker A = Ker U ΣV ∗ = Ker ΣV ∗ = V Ker Σ COMPLEMENTE DE ALGEBRA LINIARA
313
Aspecte Geometrice in Algebra Liniara
Din Propozitia 77 avem Im Σ = Im si Ker Σ = Im De aici rezulta imediat Im A = U Im si Ker A = V Im
Ir O
O In−r
Ir O O
.
= Im U1
= Im V2. In−r Pentru imaginea si nucleul lui A∗ se pot folosi descompuneri similare pentru A∗ = V Σ∗U ∗. Corolarul 81. Im A⊥ = Ker A∗, COMPLEMENTE DE ALGEBRA LINIARA
Ker A⊥ = Im A∗ 314
Aspecte Geometrice in Algebra Liniara
unde ·⊥ semnifica complementul ortogonal. Demonstrat¸ie. Rezulta din ortogonalitatea lui U1 si U2 si respectiv a lui V1 si V2. Constructia lui AS si A−1 R Fie S si R doua matrici astfel incat S = Im S si R = Ker R. Aplicam transformari ortogonale (unitare) Vs∗ si Ur liniilor lui S, respectiv coloanelor lui R (i.e. facem o descompunere QR a acestor matrici) astfel incat
∗ .. S1 ∗ Vs S = = ∗ O O
n1
,
RUr =
O R2
=
O ∗ ··· ∗ | {z } n2
Aplicam Vs coloanelor lui A, respectiv Ur∗ liniilor lui A si partitionam matricea COMPLEMENTE DE ALGEBRA LINIARA
315
Aspecte Geometrice in Algebra Liniara
rezultanta precum urmeaza
As1 As2 |{z} n1
:= AVs ,
n2{
Ar1 Ar2
:= Ur∗A.
Atunci Im As1 = AS si Ker Ar2 = A−1R. Intr–adevar, AS = AIm S = Im AS = Im [(AVs)(Vs∗S)] = Im As1S1 = Im As1,
A−1R = A−1Ker R = Ker RA = Ker [(RUr )(Ur∗A)] = Ker R2Ar2 = Ker Ar2 Daca in plus dorim sa obtinem baze ortonormale atunci efectuam aplicam transformari ortogonale asupra lui As1 respectiv asupra lui Ar2 pentru a obtine un numar COMPLEMENTE DE ALGEBRA LINIARA
316
Aspecte Geometrice in Algebra Liniara
maxim de linii respectiv coloane de zero ∗ s2 { ∗ := U s A Vs , ∗ 0 |{z} s1
n2{
∗ 0
∗ |{z} n1
:= Ur∗AVr .
Atunci AS este generat de primele s2 coloane ale lui Us si A−1 R este generat de primele n − n2 coloane ale lui Vr , i.e.: AS = Im Us,1
A−1R = Im Vr,1.
Din relatiile de mai sus observam ca AS si A−1R sunt concepte duale, similar precum Im cu Ker . Intr–adevar avem (A−1S)⊥ = (A∗)S ⊥ COMPLEMENTE DE ALGEBRA LINIARA
317
Aspecte Geometrice in Algebra Liniara
(AS)⊥ = (A∗)−1S ⊥ Subspatii Nestate Lema 82. Presupunem ca avem o multime crescatoare de subspatii ( nestate) : 0 = V 0 ⊂ V 1 ⊂ V 2 ⊂ · · · ⊂ Vk = X de dimensiune 0 = d0 < d1 < d2 < · · · dk = n. Atunci exista o matrice unitara V a.i. V = [ V1 | V2 | · · · | Vk ] |{z} |{z} |{z} r1 r2 ··· rk unde ri = di − di−1 si astfel incat Vi = Im [V1| · · · |Vi]. Spatiile transformate V ∗Vi sunt acoperite de “vectorii baza ordonati ”: Id i V ∗Vi = Im 0 COMPLEMENTE DE ALGEBRA LINIARA
318
Aspecte Geometrice in Algebra Liniara
Un subspatiu invariant V al unei matrici patrate A (sau un subspatiu A-invariant este orice spatiu astfel incat AV ⊂ V Id Daca V este acoperit de atunci matricea A are forma bloc 0 A=
A11 A12 0 A22 |{z} d
}d
si este clar ca Λ(A) = Λ(A11) ∪ Λ(A22). Matricea A11 se numeste restrictia lui A la V : A11 = A|V . Observati ca suma R1 + R2 si intersectia R1 ∩ R2 a doua subspatii A-invariante este deasemenea un subspatiu A-invariant. De aici rezulta ca un subspatiu Ainvariant formeaza o latice sub operatiile de adunare si intersectie care prin urmare va avea intotdeauna un infimum si un supremum. COMPLEMENTE DE ALGEBRA LINIARA
319
Aspecte Geometrice in Algebra Liniara
3. Ecuatii Matriciale Liniare
Anumite ecuatii matriciale liniare precum ecuatia Sylvester, Stein si versiunile lor simetrice de tip Lyapunov joaca un rol central in teoria sistemelor dinamice liniare. Prezentam in continuare conditii de solvabilitate si anumite proprietati remarcabile ale acestor ecuatii. Reamintim intai cateva concepte de teoria matricilor. O matrice A se numeste simetrica daca A = AT si se numeste hermitica daca A = A∗. Daca A este hermitica atunci toate valorile ei proprii sunt reale si in acest caz introducem semnul matricii A (sau matricea semn) prin formula sgn (A) := diag (In− , In+ , On0 )
(214)
unde n−, n+ si n0 sunt numarul de valori proprii strict negative, strict pozitive si COMPLEMENTE DE ALGEBRA LINIARA
320
Ecuatii Matriciale Liniare
nule iar On0 semnifica matricea nula de dimensiune n0 × n0. Matricea semn este unic definita de matricea hermitica A. Teorema 83 (Ecuatii Sylvester si Stein). Fie A ∈ Fn×n, B ∈ Fm×m, si C ∈ Fn×m. 1. Ecuatia Sylvester AX + XB + C = 0 are o solutie unica X ∈ Fn×m daca si numai daca s + µ 6= 0,
oricare
s ∈ Λ(A), µ ∈ Λ(B).
(215)
(216)
2. Ecuatia Stein AXB − X + C = 0 are o solutie unica X ∈ Fn×m daca si numai daca sµ 6= 1, COMPLEMENTE DE ALGEBRA LINIARA
oricare
s ∈ Λ(A), µ ∈ Λ(B). 321
(217)
(218) Ecuatii Matriciale Liniare
Daca conditia (216) (sau (218)) nu este indeplinita atunci ecuatia Sylvester (respectiv ecuatia Stein) poate sa nu aibe nici o solutie sau poate avea o infinitate de solutii in functie de termenul liber C. Ecuatii Lyapunov Daca B = A∗ si Q := C = C ∗ atunci ecuatia Sylvester este cunoscuta sub numele de ecuatie Lyapunov (in timp continuu) si are forma AX + XA∗ + Q = 0,
(219)
iar ecuatia Stein este cunoscuta sub numele de ecuatie Lyapunov (in timp discret) si are forma AXA∗ − X + Q = 0. (220) Urmatorul rezultat este o consecinta directa a Teoremei 83. Teorema 84 (Ecuatii Lyapunov). Fie A ∈ Fn×n si Q = Q∗ ∈ Fn×n. COMPLEMENTE DE ALGEBRA LINIARA
322
Ecuatii Matriciale Liniare
1. Ecuatia Lyapunov (in timp continuu) AX + XA∗ + Q = 0
(221)
are solutie unica X ∈ Fn×n daca si numai daca s + µ 6= 0,
oricare s, µ ∈ Λ(A).
(222)
Mai mult, daca X este unica, atunci este hermitica. 2. Ecuatia Lyapunov (discreta) AXA∗ − X + Q = 0
(223)
are o solutie unica X ∈ Fn×n daca si numai daca sµ 6= 1, COMPLEMENTE DE ALGEBRA LINIARA
oricare s, µ ∈ Λ(A). 323
(224) Ecuatii Matriciale Liniare
Mai mult, daca X este unica, atunci este hermitica. Dam in continuare cateva rezultate ce leaga interia solutiei X de cea a matricii A. Fie A ∈ Fn×n. Notam νc(A), πc(A), si δc(A), numarul de valori proprii ale lui A cu parte reala strict negativa, strict pozitiva si respectiv nula si cu νd(A), πd(A), si δd(A), numarul de valori proprii ale lui A cu modul strict mai mic, strict mai mare si respectiv egal cu 1. Tripletul de numere intregi (νc(A),πc(A),δc(A)) este numit c–inertia matricii A iar tripletul de numere intregi (νd(A),πd(A),δd(A)) este numit d–inertia matricii A. Evident avem νc(A) + πc(A) + δc(A) = νd(A) + πd(A) + δd(A) = n. Teorema 85. Fie A, Q, X ∈ Fn×n, cu X = X ∗ si Q = Q∗ ≥ 0. 1. Presupunem ca A, Q, X satisfac ecuatia Lyapunov AX + XA∗ + Q = 0. COMPLEMENTE DE ALGEBRA LINIARA
324
Ecuatii Matriciale Liniare
Atunci avem: (a) Daca δc(A) = 0 atunci νc(A) ≥ πc(X) si πc(A) ≥ νc(X). (b) Daca δc(X) = 0 atunci νc(X) ≥ πc(A) si πc(X) ≥ νc(A). 2. Presupunem ca A, Q, X satisfac ecuatia Lyapunov discreta AXA∗ − X + Q = 0. Atunci avem: (a) Daca δd(A) = 0 atunci νd(A) ≥ πc(X) si πd(A) ≥ νc(X). (b) Daca δc(X) = 0 atunci νc(X) ≥ πd(A) si πc(X) ≥ νd(A). Presupunem ca Q = Q∗ ≥ 0 este de forma Q = BB ∗. Daca perechea (A, B) este controlabila atunci inegalitatile din Teorema 85 pot fi intarite la egalitati. Teorema 86. Fie A, X ∈ Fn×n, B ∈ Fn×m, X = X ∗, si presupunem ca (A, B) este controlabila. COMPLEMENTE DE ALGEBRA LINIARA
325
Ecuatii Matriciale Liniare
1. Daca A, X, B satisfac ecuatia Lyapunov AX + XA∗ + BB ∗ = 0 atunci avem δc(A) = 0, δc(X) = 0, νc(A) = πc(X), πc(A) = νc(X). 2. Daca A, X, B satisfac ecuatia Lyapunov discreta AXA∗ − X + BB ∗ = 0 atunci avem δd(A) = 0, δc(X) = 0, νd(A) = πc(X), πd(A) = νc(X). Daca relaxam ipoteza de controlabilitate a perechii (A, B) obtinem urmatorul rezultat. Teorema 87. Fie A, X ∈ Fn×n, B ∈ Fn×m, si X = X ∗. 1. Daca perechea (A, B) este stabilizabila (in timp continuu) si A, X, B satisfac ecuatia Lyapunov AX + XA∗ + BB ∗ = 0 COMPLEMENTE DE ALGEBRA LINIARA
326
Ecuatii Matriciale Liniare
atunci avem δc(A) = 0, νc(A) = πc(X) + δc(X), πc(A) = νc(X). 2. Daca perechea (A, B) este stabilizabila (in timp discret) si A, X, B satisfac ecuatia Lyapunov discreta AXA∗ − X + BB ∗ = 0 atunci δd(A) = 0, νd(A) = πc(X) + δc(X), πd(A) = νc(X). Daca in Teoremele 86 si 87 inlocuim A cu A∗ si B cu C ∗ obtinem versiunile duale corespunzatoare. Nucleul solutiei X are anumite proprietati dupa cum reiese din urmatoarea teorema. Teorema 88. Fie A, X ∈ Fn×n, C ∈ Fp×n, X = X ∗ si fie N (C, A) subspatiul neobservabil al perechii (C, A). 1. Presupunem ca A, X, C satisfac ecuatia Lyapunov A∗X + XA + C ∗C = 0. COMPLEMENTE DE ALGEBRA LINIARA
327
(225) Ecuatii Matriciale Liniare
Atunci avem: (a) Ker X ⊂ N (C, A). (b) Daca ecuatia Lyapunov (225) are o unica solutie X atunci avem N (C, A) ⊂ Ker X. 2. Presupunem ca A, X, C satisfac ecuatia Lyapunov discreta A∗XA − X + C ∗C = 0.
(226)
Atunci avem: (a) Ker X ⊂ N (C, A). (b) Daca ecuatia Lyapunov discreta (226) are o unica solutie X atunci avem N (C, A) ⊂ Ker X.
COMPLEMENTE DE ALGEBRA LINIARA
328
Ecuatii Matriciale Liniare