TSA-global

Teoria Sistemelor Automate Cristian Oar˘a Facultatea de Automatica si Calculatoare Universitatea “Politehnica” Bucuresti e-mail: [email protected] URL: http://www.riccati.pub.ro/

TEORIA SISTEMELOR AUTOMATE

Capitolul 1: CONCEPTE FUNDAMENTALE ALE BUCLEI DE REACTIE (FEEDBACK)

Ce Dorim ? Bucla de Reactie Stabilitatea Interna a Buclei de Reactie Stabilizare Performante Asimptotice Solutia Problemei Reglarii CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie

1

1. Ce Dorim ? Acest capitol este cel mai important pentru intelegerea scopului si mijloacelor automaticii ! Introducem notiuni de baza cum ar fi conexiunea in bucla de reactie (feedback) si caracterizam principalele ei proprietati ce o transforma in instrumentul fundamental al automaticii (asigura stabilizarea + reglarea)! Punctul de plecare: Avem un sistem care nu face ceea ce dorim ! Cum procedam? Doua variante posibile: • Il schimbam cu altul care face ceea ce dorim (dar oricum trebuie sa stim CUM sa cerem/construim sistemul nou...) • Il modificam (CUM ?) pe cel pe care il avem deja. Analiza sistemelor de la Semnale si Sisteme a incercat sa va familiarizeze cu diverse clase de modele sistemice si cerinte naturale asupra lor. CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie

2

Ce Dorim ?

Clasa sistemelor considerate: • LINIARE • INVARIANTE IN TIMP • FINIT DIMENSIONALE • CAUZALE • O INTRARE – O IESIRE (SISO) Punctul de vedere: Intrare–Iesire (I/O) (modelele sunt fctii rationale proprii) – Teoria matematica de baza: Functii de o variabila complexa Ce Dorim de la un astfel de Sistem ? Multe ... De exemplu: Sa fie stabil (semnalele externe de energie finita sa rezulte in semnale interne tot de energie finita), sa urmareasca clase de semnale prescrise in conditiile in care apar semnale perturbatoare cunoscute ori necunoscute si zgomote, sa faca CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie

3

Ce Dorim ?

totul cu comenzi mici (pentru a nu satura elementul de actionare) si totul in prezenta incertitudinilor de model... Multe intr–adevar!!!! Este posibil sa facem toate aceste lucruri? Daca DA, cum? Incercam sa raspundem treptat acestor intrebari dezvoltand Teoria Sintezei. ATENTIE INSA: Modelele cu care lucram sunt black–box si nu putem umbla in interiorul lor (si oricum este nevoie de specialisti din domenii din cele mai diverse pentru a stii cum)! Cum procedam? Tratam modelul sistemului nominal ca atare (black–box) si anexam un alt sistem (numit uzual regulator si apartinand aceleiasi clase de modele) pe care il proiectam noi astfel incat sistemul rezultant format din sistemul nominal si regulator sa faca ceea ce dorim. Cum il “anexam”? In serie, in paralel, in bucla de reactie pozitiva/negativa? Depinde ce dorim dar minimal dorim ca indiferent de sistemul original (stabil sau nu) sistemul rezultant sa fie stabil. CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie

4

Ce Dorim ?

Conexiunea Serie 1 Fie P (s) = s−1 pe care il inseriem cu un sistem proiectat de noi C astfel incat sistemul rezultant sa fie stabil. Cum procedam? Trebuie ca C sa fie de forma e e (s − 1)C(s) unde C(s) sa fie strict stabila. Este sistemul rezultant strict stabil? Da, dpdv intrare–iesire dar daca injectam un semnal intre cele doua sisteme NU! Mai mult, nu putem asigura un zerou EXACT in s = 1 si nici nu stim EXACT ca sistemul original are un pol in s = 1! La o mica abatere rezulta un sistem INSTABIL! Deci nici un regulator nu-mi asigura cerinta de stabilitate (interna)!

Conexiunea Paralel Similar pentru conexiunea paralel! Exemplificati voi cum ar trebui sa arate un regulator si de ce nici un regulator nu ne satisface! Cum mai putem lega doua sisteme in mod elementar? Bucla de reactie (Feedback)

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie

5

Ce Dorim ?

2. Bucla de Reactie (Feedback)

Asa cum vom vedea printr-o analiza detaliata, conexiunea in bucla de reactie este CEA CARE REZOLVA CHESTIUNEA STABILITATII (interne) si inca multe alte cerinte! Cel mai simplu sistem REAL cu bucla de reactie are trei componente (vezi Fig. 1):

• Un sistem nominal ce este controlat (automatizat); • Un senzor ce masoara iesirea sistemului nominal; • Un sistem numit regulator (controller) ce genereaza intrarea sistemului nominal; (elementele de actionare sunt uzual incluse in sistemul nominal); CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie

6

Bucla de Reactie (Feedback)

Fiecare dintre cele trei componente ale buclei de reactie are doua semnale de intrare (unul din interiorul sistemului si unul exogen) si un semnal de iesire. Semnalele au urmatoarele semnificatii: r : referinta (semnal de intrare) v : iesirea senzorului u : comanda (semnal de actionare) d : perturbatia externa y : iesirea sistemului (semnal masurat) n : zgomot de masura Cele trei semnale externe r, d si n se numesc intrari exogene. d r Regulator

u

Sistem nominal

y

v Senzor n

Fig. 1: Sistem de control automat (elementar) CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie

7


Ce dorim? y trebuie sa aproximeze o functie de r prespecificata si trebuie sa faca acest lucru in prezenta perturbatiei externe d, a zgomotului n si a incertitudinilor diverse de modelare (a sistemului nominal)! Mai mult, uzual nu acceptam nici comenzi u prea mari iar y este disponibil doar prin intermediul masuratorii v ! Ipoteze matematice fundamentale (tipice cursului SS): Semnalele din Fig. 1 sunt scalare, descrise de functii regulate sau singulare (generalizate) ce au transformate Laplace, cele trei componente ale buclei de reactie (sistemul nominal, regulatorul si senzorul) sunt sisteme liniare invariante in timp avand functie de transfer rationala proprie (Totul este “civilizat”)! Deci “avem” frecventa si analiza urmatoare se face la nivelul transformatelor Laplace. Fiecare componenta din Figura 1 are doua intrari si o iesire putand fi exprimata sub forma (de exemplu in cazul sistemului nominal)

y=P

d u

=

P1 P2


8

d u

= P1d + P2u. Bucla de Reactie (Feedback)

Ipoteza aditionala: Iesirile celor trei componente sunt functii liniare de suma (sau diferenta) intrarilor, i.e., ecuatiile sistemului nominal, senzorului si regulatorului sunt de forma y = P (d + u), v = F (y + n), u = C(r − v). Semnul “ − ” din ultima ecuatie este o chestiune de traditie (reactie negativa in electronica) putand fi inlocuit alternativ cu “ + ”. Diagrama bloc a acestor ecuatii este data in Figura 2 in care s-au omis semnele “ + ” in jonctiuni. d r

x1

-

u

x2

C

y P

v x3

F

n

Fig. 2: Bucla de reactie (standard) CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie

9


Cand este (bine) definit asa ceva ? Toate functiile de transfer in bucla inchisa trebuie sa existe, i.e., functiile de transfer de la cele trei semnale exogene r, d si n la toate semnalele interne u, y, v si x1, x2 si x3 ! Prima concluzie: Este suficient sa analizam functiile de transfer de la r, d si n la x1, x2 si x3 (celelalte rezulta din acestea). Scriind ecuatiile jonctiunilor obtinem x1 = r − F x3, x2 = d + Cx1 , x3 = n + P x2, sau in forma matriciala 

1  −C 0

0 1 −P









F x1 r 0   x2  =  d  . 1 x3 n

Sistemul in bucla inchisa este deci bine definit daca matricea de dimensiune 3 × 3 de mai sus este nesingulara, i.e., determinantul ei 1 + P CF nu este identic nul, CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie

10


i.e., 1 + PCF 6≡ 0 ! In acest caz, functiile de transfer in bucla inchisa se obtin din 





x1 1  x2  =  −C x3 0

−1 

0 1 −P

care este echivalenta cu    x1 1 1  x2  =  C 1 + P CF x3 PC

F 0  1

−P F 1 P



r  d  n 



−F r −CF   d  . 1 n

(1)

Problema: Am presupus intitial ca P , C, F sunt proprii (avand motivatie matematica serioasa). Rezulta si ca functiile de transfer in bucla inchisa (1) sunt proprii atunci cand sistemul in bucla inchisa este bine definit ? Din pacate NU fara ipoteze suplimentare ... !!! Introducem: Sistemul in bucla inchisa este bine definit in sens strict daca toate functiile CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie

11


de transfer in bucla inchisa sunt proprii (⇔ 1 + P CF nu este strict propriu ⇔ 1 + PCF(∞) 6= 0 ). Nota: Buna definire in sens strict implica automat si buna definire ! Este realist sa cerem unui sistem de reglare buna definire in sens strict ? DA !!! Argumente pro (si contra !): Functiile de transfer ale oricarui sistem sunt de fapt strict proprii (o sinusoida de amplitudine constanta si frecventa din ce in ce mai mare aplicata unui sistem conduce la o iesire ce tinde la zero). Da, dar la frecvente mari sistemele sunt in general foarte complexe si inceteaza in fapt sa fie liniare pe masura ce frecventa creste ! De fapt avem nevoie ca unul singur dintre P , C sau F sa fie strict propriu si daca acest lucru nu se intampla automat la modelele cu care lucram oricum cerem |P CF (∞)| < 1 (motive profunde legate de stabilitate interna si “small–gain”) ceea ce asigura automat buna definire in sens strict.


12


3. Stabilitatea Interna a Buclei de Reactie

Problema (fundamentala): Ce notiune de stabilitate este adecvata sistemului din Figura 2 (stabilitate externa stricta, BIBO, asimptotica, Lyapunov etc.)? Raspuns: Niciuna nu este adecvata sistemului in bucla inchisa... Ce functii de transfer ne intereseaza de fapt ? In primul rand transferul I/O al sistemului in bucla r → y ! Dar chiar daca acest transfer este strict stabil este posibil ca alt transfer de la un exogen la un semnal intern al buclei sa nu fie stabil rezultand in distrugerea unei parti sau a intregului sistem !!! Deci avem nevoie ca toate functiile de transfer r, d, n → x1, x2, x3, v, y, u, sa fie SIMULTAN stabile pentru a fi siguri ca totul este OK ! CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie

13

Stabilitatea Interna a Buclei de Reactie

s Exemplul 1. In Figura 2 fie C(s) = s+1 , P (s) = s21−1 , F (s) = 1. Functia de transfer r → y este strict stabila (in sens BIBO) dar functia de transfer de la d la y nu este. s Exemplul 2. In Figura 2 fie C(s) = s+1 , P (s) = s21+1 , F (s) = 1. Toate functiile de transfer exogen → semnal intern al buclei sunt strict stabile (in sens BIBO). Definitia 3. Sistemul in bucla de reactie din Figura 2 se numeste intern stabil daca toate transferurile in bucla inchisa sunt strict stabile (i.e., au polii in C−).

Aparent trebuie sa verificam 18 functii de transfer dar de fapt sunt suficiente doar 9. Aratati de exemplu ca urmatoarele functii de transfer sunt suficiente pentru verificarea stabilitatii interne r, d, n → x1, x2, x3. Este relativ complicat sa examinam chiar si 9 numitori si sa le calculam zerourile. CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie

14


Scriem fctiile de transfer rationale sub forma unor c˘aturi de polinoame coprime NP P = , MP

NC C= , MC

NF F = MF

(2)

si definim polinomul caracteristic al sistemului in bucla inchisa (din Figura 2) ca produsul numaratorilor + produsul numitorilor celor trei functii de transfer, χ = NP NC NF + MP MC MF . Polii sistemului in bucla inchisa sunt zerourile polinomului caracteristic χ. Teorema 4. Sistemul in bucla de reactie este intern stabil daca si numai daca polii sistemului in bucla inchisa sunt in C−.

Demonstrat¸ie. Pentru simplitate presupunem F = 1 (argumentatia in cazul genCAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie

15


eral este similara dar este mai greu de urmarit). Din (1) avem 





x1 1 1  x2  =  C 1 + PC x3 PC

−P 1 P





−1 r −C   d  1 n

si inlocuind (2) obtinem 





MP MC x1 1  MP NC  x2  = NP NC + MP MC x3 NP NC

−NP MC MP MC NP MC





−MP MC r −MP NC   d  n MP MC

(3)

in care polinomul de la numitor este exact polinomul caracteristic χ. Suficienta: Sistemul in bucla inchisa este intern stabil daca polinomul caracteristic are toate zerourile in C−. Necesitatea: Implica un argument mai subtil. Presupunem ca sistemul in bucla inchisa este intern stabil. Atunci toate cele noua functii de transfer in (3) sunt CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie

16


strict stabile (in sens BIBO), i.e., au poli numai in C−. Aceasta nu implica automat ca NP NC + MP MC are zerourile in C− intrucat este posibil sa aibe un zerou in afara care sa fie zerou si al tuturor numaratorilor din (3) si deci sa se simplifice. In orice caz, polinomul χ nu are un zerou comun cu toti numaratorii din (3) asa cum demonstram prin reducere la absurd. Fie s0 a.i. (NP NC + MP MC )(s0) = 0. P.p. ca este zerou si al tutoror numaratorilor, in particular MP MC (s0) = 0. Apar doua situatii posibile: i)MP (s0) = 0; ii)MC (s0) = 0. Cazul i) MP (s0) = 0; Automat NP (s0) 6= 0 (MP este coprim cu NP ) si rezulta din elementul (1,2) al matricii ca MC (s0) = 0 si din elementul (3,1) ca NC (s0) = 0 ceea ce nu este posibil din nou din coprimitatea lui NC si MC . Cazul ii) MC (s0) = 0. Automat atunci NC (s0) 6= 0 si rationamentul se repeta ca mai sus folosind elementele (2,3) si (3,1) ale matricii rezultand ca MP (s0) = 0 si NP (s0) = 0, ceea ce contrazice coprimitatea lui MP si NP . Teorema de mai sus ne da o modalitate sintetica de verificat stabilitatea interna a unei bucle de reactie: se verifica locatia in C− a zerourilor unui polinom χ (de exemplu calculand efectiv zerourile prin calculul valorilor proprii ale matricii CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie

17


companion asociate sau, mai simplu, folosind criteriul lui Hurwitz). Teorema 5 (Test de Stabilitate Interna). Sistemul in bucla inchisa este intern stabil daca si numai daca urmatoarele doua conditii sunt simultan indeplinite: a) Functia de transfer 1 + P CF are zerourile in C−; b) Nu au loc simplificari in C+ ∪ C0 cand formam produsul PCF. Demonstrat¸ie. Sistemul in bucla inchisa este intern stabil daca si numai daca toate cele 9 functii de transfer 

1 1  C 1 + P CF PC

−P F 1 P



−F −CF  1

sunt stabile. Necesitatea: Presupunem ca sistemul in bucla inchisa este intern stabil. Rezulta CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie

18


in particular ca 1+P1CF este stabila, deci 1 + P CF are zerourile in C− ceea ce NP NC NF demonstreaza necesitatea lui a). Fie P = M ,C=M ,F =M . Din Teorema P C F 4 rezulta ca polinomul caracteristic χ = NP NC NF + MP MC MF are zerourile in C−. Prin urmare perechea (NP , MC ) nu are zerouri comune in Re s ≥ 0 si similar NP NC NF . Deci si b) este pentru toate celelalte perechi corespunzand lui P CF = M P MC MF adevarata ceea ce incheie necesitatea. Suficienta: Presupunem adevarate a) si b). Factorizam P, C, F ca mai sus si fie s0 un zerou al polinomului caracteristic, i.e., (NP NC NF + MP MC MF )(s0) = 0.

(4)

Aratam prin reducere la absurd ca Re s < 0. Presupunem contrariul, Re s ≥ 0. Daca MP MC MF (s0) = 0 rezulta MP MC MF (s0) = 0 ceea ce violeaza b). Deci NP NC NF MP MC MF (s0) 6= 0 si impartind cu el in (4) obtinem 1 + M (s0) = 0 de P MC MF unde (1 + P CF )(s0) = 0 ceea ce violeaza a).


19


Concluziile “la zi”

• Un sistem se comporta “civilizat” doar daca avem stabilitate interna, adica indiferent unde se injecteaza un semnal exogen de energie finita toate semnalele din sistem vor fi de energie finita; • Stabilitatea interna nu se poate asigura cu conexiunile serie sau paralel ci doar cu bucla de reactie; • Stabilitatea interna se verifica pe baza faptului ca cele 18 functii de transfer din bucla de reactie sunt simultan strict stabile dar exista teste mult mai simple (vezi Teoremele 4 si 5); • Ramane sa investigam problema de sinteza: Dandu-se un sistem nominal oarecare P exista intotdeauna un regulator C care asigura stabilitatea interna ? Daca DA se cere constructia clasei regulatoarelor C ce asigura stabilitatea interna.


20


4. Stabilizarea Consideram sistemul (mai simplu) cu bucla de reactie unitara din Figura 3. Aceasta diagrama arata situatia teoretica tipica in controlul automat (F = 1) in care se da P si se cere C ce satisface anumite cerinte: stabilizeaza intern, asigura performante, tolereaza incertitudini de modelare, limiteza comenzi, etc. Cu toate ca in general F 6= 1, dezvoltarile teoretice sunt destul de complexe chiar in acest caz mai simplu pentru a-l analiza separat. Ipoteza: P este strict propriu (bucla este automat bine definita in sens strict). d r

e

-

y

u P

C

Fig. 3: Sistem cu bucla de reactie unitara CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie

21

Stabilizarea

Problema fundamentala: Dandu-se P exista intotdeauna un C care stabilizeaza intern sistemul in bucla de reactie? Daca DA, cati exista ? Cum ii putem caracteriza? Raspuns: DA, exista o infinitate de C care stabilizeaza intern si ei se pot da explicit prin intermediul parametrizarii lui Youla ! Parametrizarea lui Youla: Cazul P Stabil Deoarece cazul general este relativ complicat, incepem sa dezvoltam mecanismul necesar intr-un caz mai simplu: P stabil (P ∈ S, unde S este inelul comutativ al functiior de transfer rationale proprii si stabile in sens strict). Teorema 6. Presupunem ca P ∈ S. Clasa tuturor C pentru care sistemul in bucla de reactie din Fig. 3 este intern stabil este data de

Q 1 − PQ


:

Q∈S .

22

(5)

Stabilizarea

Teorema afirma doua lucruri: oricare ar fi C dat de (5) (cu un Q ∈ S arbitrar) el stabilizeaza intern si, pe de-alta parte, pentru oricare C care stabilizeaza intern se Q gaseste un Q a.i. C = 1−P Q , cu Q ∈ S. Demonstrat¸ie. Presupunem ca C stabilizeaza intern. Fie Q functia de transfer de la r la u C . Q := 1 + PC Evident Q ∈ S si C =

Q 1−P Q .

Reciproc, fie Q ∈ S. Definim Q C := . 1 − PQ

(6)

Sistemul in bucla inchisa este intern stabil daca si numai daca cele 9 functii de CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie

23

Stabilizarea

transfer



1 1  C 1 + PC PC

−P 1 P



−1 −C  1

sunt proprii si stabile. Substituind expresia (6) pentru C aceasta matrice devine 



1 − P Q −P (1 − P Q) −(1 − P Q)  . Q 1 − PQ −Q PQ P (1 − P Q) 1 − PQ

(7)

Cum Q ∈ S si P ∈ S este clar ca toate elementele acestei matrici sunt proprii si strict stabile. Observatia 7. Toate functiile de transfer in bucla inchisa sunt afine in parametrul liber Q, i.e., sunt de forma T1 +T2Q pentru anumiti T1 ∈ S, T2 ∈ S. Acest fapt simplifica major orice calcule necesare pentru alegerea parametrului Q a.i. sistemul in bucla inchisa sa satisfaca cerinte suplimentare (se poate interpreta ca o liniarizare). CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie

24

Stabilizarea

Trecem in continuare la analiza cazului general (P nu este neaparat stabil). In acest scop introducem factorizarile coprime peste S. Factorizari Coprime Presupunem ca P nu este stabil si vrem sa gasim in continuare un C care stabilizeaza intern. Cum procedam ? Ideea de baza: Factorizam P peste S ! N , unde (N, M ) sunt De ce nu peste polinoame ? Sa presupunem ca scriem P = M polinoame coprime. Atunci exista doua alte polinoame X si Y (ce se pot construi de exemplu pe baza algoritmului lui Euclid) ce satisfac identitatea lui Bezout

NX + MY = 1 (ideea calauzitoare este sa folosim Teorema 1 care afirma ca sistemul in bucla inchisa este intern stabil daca si numai daca polinomul caracteristic nu are zerouri CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie

25

Stabilizarea

in Re s ≥ 0). Daca am seta pe baza identitiatii Bezout C = X Y atunci polinomul caracteristic verifica N X + M Y = 1 si deci nu are zerouri in Re s ≥ 0. De aici “concluzia” ca C stabilizeaza intern. Ce este gresit ? Y ar putea fi nul (deci C nu se poate construi astfel) sau ∂Y < ∂X (rezulta un regulator impropriu )! Exemplul 8. Fie P (s) = 1s pentru care avem N (s) = 1, M (s) = s. O solutie a ecuatiei Bezout N X + M Y = 1 este X(s) = 1 si Y (s) = 0 pentru care C := X Y nu este definit. Alta solutie este X(s) = −s + 1, Y (s) = 1, pentru care C := X Y = −s + 1 nu este propriu. Pentru a remedia aceasta situatie cerem ca M, N, X, Y sa fie elemente ale lui S si deci procedam la factorizari coprime peste S ! Doua functii in S se numesc coprime daca exista alte doua functii X, Y ambele in S a.i. sa aibe loc identitatea lui Bezout N X + M Y = 1. CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie

26

Stabilizarea

In particular, identitatea de mai sus implica ca N si M nu au zerouri comune in Re s ≥ 0 sau la ∞. Daca ar exista un astfel de s0 atunci am avea 0 = N (s0)X(s0) + M (s0)Y (s0) 6= 1. Conditia este si suficienta pentru coprimitate: daca N si M nu au zerouri comune in Re s ≥ 0 sau la ∞ atunci sunt coprime (Demonstratia: Exercitiu ! ) Factorizare coprima: Fie G matrice real rationala. O reprezentare de forma G=

N , M

N, M ∈ S,

se numeste factorizare coprima a lui G peste S. Prezentam in continuare un mecanism (algoritm) de constructie a celor 4 functii din S ce satisfac cele 2 ecuatii: G=

N , M


N X + M Y = 1. 27

Stabilizarea

n Constructia lui M si N : Fie G rationala proprie cu coeficienti reali si fie G = m o factorizare coprima peste polinoame (se obtine direct prin simplificarea oricaror N factori polinomiali comuni). Evident ∂n ≤ ∂m =: k. Atunci G = M cu

n N= , k (s + 1)

m M= (s + 1)k

este o factorizare coprima peste S a lui G. 1 2 Exemplul 9. Fie G = (s−1) 2 . Atunci k := 2, n(s) = 1, m(s) = (s − 1) si obtinem factorizarea coprima n(s) 1 N (s) = = , 2 2 (s + 1) (s + 1)

m(s) (s − 1)2 M (s) = = . 2 2 (s + 1) (s + 1)

Observatia 10. Asa cum se observa si in exemplul de mai sus, k este fixat de cerintele de coprimitate ale celor doi factori. Intr-adevar, un k mai mic creaza un M impropriu pe cand un k mai mare creaza doi factori M si N avand zerouri comune la infinit. CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie

28

Stabilizarea

Deci N si M se obtin facil. Obtinerea in continuare a lui X si Y este considerabil mai dificila necesitand algoritmul lui Euclid. Algoritmul Euclid calculeaza cel mai mare divizior comun a doua polinoame date n(λ) si m(λ). Cand n(λ) si m(λ) sunt coprime, algoritmul lui Euclid se poate folosi pentru calculul polinoamelor x(λ) si y(λ) ce satisfac identitatea lui Bezout n(λ)x(λ) + m(λ)y(λ) = 1.


29

Stabilizarea

Algoritmul lui Euclid Intrari: Polinoamele n(λ) si m(λ). Daca ∂m > ∂n se interschimba m si n. Pasul 1: Imparte n la m pentru a obtine n = mq1 + r1,

∂r1 < ∂m

(gradul restului mai mic strict decat gradul catului). Pasul 2: Imparte m la r1 pentru a obtine m = r 1 q2 + r 2 ,

∂r2 < ∂r1.

········· Pasul k: Imparte rk−2 la rk−1 pentru a obtine rk−2 = rk−1qk + rk , CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie

∂rk < ∂rk−1. 30

Stabilizarea

Opreste–te la Pasul k pentru care rk este o constanta nenula. Ce am obtinut ? Scriind ecuatiile obtinute in forma compacta obtinem      

1 q2 −1

0 1 q3 ...

0 0 1 ... −1

 ... qk

1

    

r1 r2 r3 .. rk





    =    



1 −q1 0 1   n 0 0  .  m .. ..  0 0

Prima matrice din membrul stang este inversabila si are inversa tot o matrice polinomiala (determinantul ei este o constanta) obtinandu-se resturile sub forma      

r1 r2 r3 .. rk





    =    

1 q2 −1

0 1 q3 ...

0 0 1 ... −1


−1  ... qk

1 31

    

    



1 −q1 0 1   n 0 0  .  m .. ..  0 0 Stabilizarea

Deci rk (λ) := qe(λ)n(λ) + qb(λ)m(λ) in care qe si qb sunt polinoame functie de qi(λ). Cum rk = cst. 6= 0, fie x(λ) := qer(λ) , y(λ) := qbr(λ) care sunt polinoamele cerute. k

k

Obtinerea Factorizarii Coprime peste S Am vazut algoritmul Euclid si ca rezultat identitatea Bezout pentru polinoame. Avem insa nevoie de identitatea Bezout peste functii din S (nu peste polinoame). Cum procedam ? Facem o transformare de variabila a.i. polinoamele in λ sa genereze functii in S. Intrari: G Pasul 1: Daca G este stabila, setam N = G, M = 1, X = 0, Y = 1 si STOP. Altfel continua; e e ca un cat de doua Pasul 2: Transforma G(s) in G(λ) luand s := 1−λ . Scrie G λ polinoame coprime n(λ) e G(λ) = . m(λ)


32

Stabilizarea

Pasul 3: Foloseste algoritmul Euclid (peste polinoame) si gaseste x(λ) si y(λ) a.i. nx + my = 1. Treci de la n(λ), m(λ), x(λ), y(λ) la N (s), M (s), X(s), Y (s) facand tranformarea 1 inversa de variabila λ = s+1 . Parametrizarea lui Youla: Cazul General (P oarecare) Cu aceste preliminarii asigurate putem trece la constructia parametrizarii Youla pentru cazul in care P este arbitrar (dar propriu). N Fie P = M o factorizare coprima peste S si fie X si Y doua functii in S satisfacand identitatea lui Bezout NX + MY = 1 (8)

(toate acestea sunt furnizate de procedura elaborata anterior). Teorema 11 (Parametrizarea lui Youla). Multimea tuturor C pentru care sisCAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie

33

Stabilizarea

temul in bucla de reactie din Figura 3 este intern stabil este data de X + MQ : Q∈S . Y − NQ

(9)

Exercitiu: Aratati ca Teorema 6 se obtine prin particularizarea Teoremei 11 atunci cand P ∈ S ! Demonstratia Teoremei 2 se face pe baza unei leme preliminare. NC N Lema 12. Fie P = M si C = M factorizari coprime peste S. Sistemul cu bucla C de reactie este intern stabil daca si numai daca (N Nc + M MC )−1 ∈ S.

Demonstrat¸ie. Demonstratia lemei fiind aproape identica cu cea a Teoremei 5 este lasata drept exercitiu ! CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie

34

Stabilizarea

Demonstratia Teoremei 11. Fie Q ∈ S si definim X + MQ C := . Y − NQ Pentru a arata ca sistemul in bucla inchisa este intern stabil definim NC := X + M Q,

MC := Y − N Q

si incercam sa aplicam Lema precedenta. Pentru aceasta trebuie sa aratam succesiv Nc −1 ca C = M este o factorizare coprima si ca (N N + M M ) ∈ S. Intr-adevar, c c c avem ca N X + M Y = 1 de unde rezulta automat ca N NC + M Mc = 1 ceea ce demonstreaza prima parte a Teoremei. Reciproc, fie C un regulator ce stabilizeaza intern bucla de reactie. Trebuie sa aratam ca exista Q ∈ S a.i. X + MQ C= . (10) Y − NQ CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie

35

Stabilizarea

NC −1 Fie C = M o factorizare coprima peste S si definim V := (N N + M M ) . C C C Din Lema 1 rezulta ca V ∈ S. Avem ca

C=

NC V MC V

(11)

si incercam sa alegem Q a.i. (10) sa coincida cu (11) in sensul ca NC V = X +M Q V −X si MC V = Y − N Q. Il definim pe Q din prima ecuatie rezultand ca Q = NC M si calculand Y − NQ = Y −

N (NC V − X) M Y + N X − N NC V = M M

1 − N NC V M MC V = = = MC V M M arata ca o verifica de fapt si pe a doua. A ramas sa aratam ca Q astfel definit CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie

36

Stabilizarea

apartine lui S. Am vazut ca Q verifica MC V = Y − N Q,

NC V = X + M Q.

Scazand a doua ecuatie multiplicata cu Y din prima multiplicata cu X obtinem MC V X − NC V Y = XY − XY − (N X + M Y )Q ⇔ Q = NC V Y − MC V X si ultimul membru drept apartine lui S intrucat toate elementele apartin lui S. Deci Q ∈ S. Observatia 13. Analog ca in cazul in care P era stabila, toate functiile de transfer in bucla inchisa sunt functii afine de Q daca parametrizam C ca in enuntul teoremei in functie de Q. De exemplu functia de transfer de la r si d la ǫ devine 1 P ǫ= r− d = M (Y − N Q)r − N (Y − N Q)d. 1 + PC 1 + PC CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie

37

Stabilizarea

Acest fapt va fi esential in sectiunile urmatoare in care parametrul Q se va determina a.i. sa satisfaca cerinte suplimentare de reglare (urmarirea asimptotica a unui semnal referinta si rejectia unui semnal de tip perturbator).


38

Stabilizarea

5. Performante Asimptotice

Ce am obtinut pana in prezent ? Pentru o bucla de reactie standard (F = 1) am reusit caracterizarea clasei tuturor compensatoarelor care asigura stabilitatea interna (cea mai larga clasa ce ne intreseaza in aplicatii practice !) Ce mai dorim de la un sistem de reglare automat ? Minimal dorim sa-i asiguram o comportare dorita la anumite clase de semnale date si in conditiile in care pot aparea semnale perturbatoare si/sau zgomote. Ideal: Dorim ca la semnale precizate de intrare u ∈ U iesirii sistemului sa-i corespunda un semnal dorit de iesire y ∈ Y. Mai precis, dorim ca fiecarui u ∈ U sa-i asociem un y ∈ Y deci dorim ca sistemul sa reprezinte o aplicatie din U in Y precizata. Este realist sa cerem asa ceva ? In general NU !!! De ce ? Sunt mai multe motive: CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie

39

Performante Asimptotice

• u si y sunt functii de timp (sau rationale in domeniul transformatelor Laplace) iar sistemul este liniar, invariant in timp, descris de o transformata Laplace rationala proprie si stabila (cel putin in bucla inchisa). Deci pentru o pereche (u0, y0) fixata exista cel mult un sistem T (rezulta din y0 = T u0). Daca dorim ca la alta intrare u1 sa corespunda o alta iesire y1 rezulta in general alt sistem T ! Concluzie: se poate cere asa ceva cel mult pentru o pereche de semnale ! • Este posibil asa ceva macar si pentru O SINGURA pereche de semnale? Nici macar ! Raportul uy00 poate rezulta intr-un sistem instabil si deci neinteresant pentru aplicatii (semnalele de intrare interesante u sunt in general de tip persistent ca de exemplu treapta, sinusoide, rampe, etc.) • Mai mult, din raportul uy00 pot rezulta sisteme improprii ! Ce este de facut? Relaxam cerintele pastrand esenta exigentelor! In general nu ne intereseaza ca un semnal de iesire sa aibe exact forma dorita de noi ci mai curand ne intereseaza ca dupa trecerea regimului tranzitoriu semnalul sa aibe o comportare dorita rezultand deci anumite cerinte de performanta asimptotica ! Clasa de semnale de intrare: semnale persistente (pentru noi ≡ semnale cu CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie

40


transformata Laplace rationala strict proprie radacinile antistabile, i.e., in afara lui C−).

us (s) uj (s)

in care polinomul uj (s) are toate

De ce facem astfel de ipoteze asupra semnalului? • Transformata Laplace rationala: Lucram cu sisteme dinamice descrise de fctii de transfer rationale si deci este normal ca semnalele sa fie tot rationale (solutii ale unor ecuatii diferentiale ordinare in conditii initiale arbitrare). • Strict proprii: Semnalul in domeniul timp dorim sa fie functie in sens regulat (nu semnal generalizat). • Radacini antistabile: Putem considera semnale generale dar cele interesante din punct de vedere al proprietatilor asimptotice sunt doar cele antistabile. De ce ? Raspunsul unui sistem liniar y = T u la o intrare u = u+ + u− (u+ partea antistabila si u− partea stabila) este y = y+ + y−, CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie

y+ = T u+, 41

y− = T u−. Performante Asimptotice

Deoarece sistemul este neaparat stabil (in bucla inchisa), rezulta ca y− are toate radacinile in C− si deci limt→∞ y−(t) = 0 si dpdv asimptotic conteaza numai componenta antistabila. Ipoteze: Presupunem configuratia clasica de reglare din Figura 4

d r

e

-

y

u P

C

Fig. 4: Sistem cu bucla de reactie unitara (F = 1) in care semnalele externe r si d sunt presupuse de tip persistent. Semnalul r numit referinta reprezinta semnalul pe care dorim sa-l urmareasca iesirea sistemului CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie

42


y iar semnalul d este semnalul perturbator pe care il dorim rejectat la iesirea sistemului (omitem momentan o discutie separata asupra lui n deorece F = 1 si deci presupunem ca este disponibila iesirea y (prim masurare exacta); mai mult, n fiind in general zgomot alb rejectia sa se poate trata doar cu instrumente specifice statisticii matematice) ! Problema fundamentala a reglarii: Pentru configuratia de reactie din Figura 4 sa se gaseasca un sistem (numit compensator regulator) a.i. sistemul in bucla inchisa sa indeplineasca simultan cerintele: Stabilizare (S): Sa fie intern stabil, adica C sa fie un compensator stabilizator; Reglare (R): Sa indeplineasca cerintele de reglare asimptotica adica lim ǫ(t) = 0 ∀r ∈ R,

t→∞

lim ǫ(t) = 0

t→∞


∀d ∈ D, 43


adica C sa fie un compensator regulator pentru clasa referintelor R si clasa pertubatiilor D. Observatia 14. • Cerinta de reglare (performanta asimptotica) nu are sens fara asigurarea simultana a conditiei de stabilizare ! Nu are deci sens sa abordam separat problema reglarii de cea a stabilizarii de exemplu prin parametrizarea clasei tuturor regulatoarelor si ulterior intersectarea cu clasa celor care stabilizeaza. Problema se abordeaza prin deducerea subclasei compensatoarelor stabilizatoare ce asigura in plus si reglarea ! • Cerinta de reglare expliciteaza de fapt doua cerinte individuale de comportare la doua clase de semnale de intrare: Urmarirea referintei (Rr): lim ǫ(t) = 0,

t→∞

∀r ∈ R

,d = 0

∀d ∈ D

, r = 0.

Rejectia perturbatiei (Rd): lim ǫ(t) = 0,

t→∞


44


• Ambele clase de semnale R, D sunt presupuse cunoscute (date prin cerinta de proiectare). Cele doua cerinte se considera separat rezultand in final si compunerea efetcelor limt→∞ ǫ(t) = 0, ∀r ∈ R, ∀d ∈ D (acest fapt este o consecinta a principiului superpozitiei aplicabil sistemelor liniare). • Cerinta de urmarire a referintei se poate scrie echivalent lim y(t) = lim r(t)

t→∞

t→∞

∀r ∈ R

, d = 0.

Reformularea problemei reglarii Nc N Fie P = M si C = M factorizari coprime ale lui P si respectiv ale lui C peste S c n si fie r = rrm , d = ddmn factorizari coprime peste polinoame. Deorece r si d sunt presupuse semnale persistente avem automat ca

∂rn < ∂rm,

∂dn < ∂dm

si radacinile lui rm si dm sunt in C+ ∪ C0. CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie

45


Expresia lui ǫ ca functie de semnalele de intrare d si r este 1 rn N Mc dn P M Mc ǫ= − . r− d= 1 + PC 1 + PC N Nc + M Mc rm N Nc + M Mc dm

(12)

Teorema valorii finale: Daca ǫ(s) este o transformata Laplace rationala fara poli in Re s ≥ 0 cu posibila exceptie a unui pol simplu in s = 0 atunci limt→∞ ǫ(t) exista si se poate calcula cu alternativ prin lim ǫ(t) = lim sǫ(s).

t→∞

s→0

Problema reglarii capata atunci urmatoarea formulare echivalenta: Problema reglarii: Sa se gaseasca doua elemente in S notate Nc si Mc, cu proprie, care satisfac simultan cerintele: Stabilizare (S’):

1 N Nc +M Mc

Nc Mc

∈S


46


Reglare (R’): Polii lui sǫ(s) ⊂ C− si lim sǫ(s) = 0|∀r∈R,d=0,

s→0

lim sǫ(s) = 0|∀d∈D,r=0.

s→0

Observatia 15. Chiar in aceasta formulare problema este relativ complicata intrucat cele doua conditii (S’) si (R’) trebuie asigurate simultan ! Asa cum vom vedea putin mai tarziu, problema se simplifica considerabil daca folosim pentru Nc si Mc expresiile deduse la stabilizare, adica daca scriem formula parametrizata a compensatoarelor stabilizatoare si impunem sa satisfaca exclusiv conditia (R’), (S’) fiind automat satisfacuta in acest caz. In aceasta idee este formulata si teorema reglarii din sectiunea urmatoare.


47


6. Solutia Problemei Reglarii Teorema 16. Presupunand conditia (S) (sau echivalent (S’)) din problema reglarii indeplinita, conditia (R) (sau echivalent (R’)) este indeplinita daca si numai daca urmatoarele doua conditii sunt simultan indeplinite: (i)

1 1 1 × ∈ S ⇔ Z(rm) ⊂ Z( ) ⇔ Z(rm) ⊂ P(P ) ∪ P(C) 1 + P C rm 1 + PC

(ii)

P P 1 × ∈ S ⇔ Z(dm) ⊂ Z( ) ⇔ Z(dm) ⊂ Z(P ) ∪ P(C) 1 + P C dm 1 + PC

Demonstrat¸ie. Sa observam intai ca sirurile de echivalente din enunt rezulta automat din conditia ca rm si dm au toate zerourile in C+ ∪ C0 si sistemul in bucla inchisa este intern stabil. Conditiile sunt suficiente: Intr–adevar, conditiile fiind indeplinite rezulta din (12) CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie

48

Solutia Problemei Reglarii

ca ǫ(s) are toti polii in C−. Mai mult, deoarece r si d sunt descrise de rationale strict proprii rezulta si ca toti polii lui sǫ(s) sunt in C−. Deoarece S × r1m ∈ S si P S × d1m ∈ S avem ca s nu este pol al acestor rationale si din (12) rezulta lim sǫ(s) = 0. s→0

Deci conditia (R’) este in totalitate indeplinita. Conditiile sunt necesare: Deorece (R’) este indeplinita, rezulta din (12) ca simultan P 1 rn dn |d=0, ǫ= |r=0. (13) ǫ= 1 + P C rm 1 + P C dm 1 Cum sistemul este intern stabil si deci 1+P C ∈ S iar Z(rm) ⊂ C+ ∪ C0 rezulta automat din conditia (R’) folosita in prima relatie (13) ca rm trebuie sa dispara complet prin simplificare. Rationamentul pentru a doua conditie din (13) este similar rezultand in final necesitatea conditiilor (i) si (ii) din enunt. 1 Observatia 17. • Sa observam ca 1+P C are un zerou instabil in s0 (care sa simplifice corespunzator “modelul” semnalului referinta continut in rm ) daca CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie

49


si numai daca functia de transfer in bucla deschisa L = P C are un pol acolo. • Teorema de mai sus se mai numeste si principiul modelului intern: pentru a avea urmarire asimptotica a semnalului referinta trebuie ca polii semnalului referinta sa apara ca poli in modelul intern al buclei deschise L. • O analiza asemanatoare se poate face si in privinta semnalului perturbator d. Exemple de aplicare: Sa presupunem ca avem un sistem P si dorim sa construim un regulator care sa urmaresca un semnal de tip treapta sau de tip rampa r(t) =

c, 0,

daca t ≥ 0, , daca t < 0,

r(t) =

ct, daca t ≥ 0, 0, daca t < 0,

unde c ∈ R∗. Alternativ, dorim sa rejectam de exemplu o perturbatie de tip sinusoidal, i.e. d(t) = sin(ωt)1(t). CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie

50


Exemple tipice pentru referinta treapta il constituie reglarea automata a vitezei unui automobil (cruise control) sau reglarea temperaturii dintr-o camera cu ajutorul unui termostat ce comanda centrala termica. Un exemplu tipic pentru reglarea la rampa il constituie o farfurie de radar sau de TV prin satelit ce trebuie sa urmareasca orbita circulara a unui satelit (negeostationar). Un satelit ce se misca pe o orbita circulara cu o viteza unghiulara constanta acopera un unghi ce este functie liniara de timp (adica o rampa). Perturbatii sinusoidale apar in medii magnetice sau bune conducatoare de electricitate acolo unde este folosita de exemplu tensiunea alternativa. Aplicand teorema reglarii in aceste cazuri obtinem urmatoarea lema. Lema 18. Prespunem ca sistemul in bucla inchisa este intern stabil si d = 0. (a) Daca r este o treapta atunci are loc reglarea (i.e. limt→∞ ǫ(t) → 0) daca si 1 numai daca S := 1+P C are cel putin un zerou in origine (s = 0). (b) Daca r este o rampa atunci are loc reglarea (i.e. limt→∞ ǫ(t) → 0) daca si 1 numai daca S := 1+P C are cel putin doua zerouri in origine (s = 0). Prespunem ca sistemul in bucla inchisa este intern stabil si r = 0. (c) Daca d este o sinusoida d(t) = sin(ωt)1(t) atunci are loc rejectia perturbatiei (i.e. limt→∞ ǫ(t) → 0) daca si numai daca P are un zerou in s = jω CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie

51


sau C are un pol s = jω (automat va avea si s = −jω deoarece sistemele au coeficienti reali).

Demonstrat¸ie. Rezulta direct din aplicarea transformatei Laplace asupra lui r(t) si d(t) si Teorema reglarii. Exemplul 19. Sa luam un exemplu banal. Fie P (s) = 1s , C(s) = 1. Functia de transfer de la r la ǫ este Tǫr

1 s = = 1 + s−1 s + 1

Prin urmare polul din bucla deschisa din s = 0 devine zerou al functiei de transfer de la referinta la eroare si acest zerou anuleaza polul lui r(s) = 1s rezultand un ǫ(s) fara poli instabili. Deci acest sistem asigura in bucla inchisa urmarirea unei referinte de tip treapta unitara. Cu toate ca teorema reglarii ne da un instrument teoretic extrem de util in CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie

52


abordarea analitica a solutiei problemei reglarii, mai sunt inca de facut cativa mici pasi in explicitarea clasei compensatoarelor stabilizante si gasirea parametrului Q care satisface conditiile enuntate. Clasa compensatoarelor care asigura cerinta primordiala de stabilitate interna este Q N data de C = X+M Y −N Q in care Q este arbitrar in S si P = M si N X + M Y = 1, cu toate N, M, X, Y ∈ S. Functiile de transfer ce intervin in Teorema reglarii sunt date de Tǫr = S =

1 M Mc , = 1 + PC N Nc + M Mc

si

Tǫd = −P S = −

N Mc N Nc + M Mc

care devin dupa inlocuirea formulelor pentru Mc := Y − N Q si Nc := X + M Q, Tǫr = M (Y − N Q), CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie

Tǫd = N (Y − N Q). 53


Scriind acum rm si dm in forma rm = kr (s − sr1)(s − sr2) . . . (s − srk ) dm(s) = kd(s − sd1)(s − sd2) . . . (s − sdℓ) unde kr , kd ∈ R si radacinile sri, sdj ∈ C+ ∪ C0, i = 1, . . . k, j = 1, . . . , ℓ apar in perechi complex conjugate. Cu aceste notatii, conditiile de interpolare enuntate in Teorema reglarii devin pentru urmarirea referintei M (sr1)(Y (sr1) − N (sr1)Q(sr1)) = 0, M (sr2)(Y (sr2) − N (sr2)Q(sr2)) = 0, .. M (srk )(Y (srk ) − N (srk )Q(srk )) = 0, CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie

54

(14)


iar cele pentru rejectia perturbatiei devin N (sd1)(Y (sd1) − N (sd1)Q(sd1)) = 0, N (sd2)(Y (sd2) − N (sd2)Q(sd2)) = 0, .. N (sdℓ)(Y (sdℓ) − N (sdℓ)Q(sdℓ)) = 0.

(15)

• In ecuatiile de mai sus N, M, X, Y sunt elemente cunoscute (determinate anterior) in S si deci valorile lor in punctele sri si srj sunt numere reale (sau complexe) ce se pot calcula direct. Necunoscuta o constituie parametrul liber Q ∈ S care se determina a.i. conditiile de interpolare de mai sus sa fie indeplinite. • Daca sri sau sdj sunt reali, ecuatia corespunzatoare va avea toti coeficientii reali si evident si valoarea rezultata pentru Q(sri) sau Q(sdj ) va fi reala. Daca radacina corespunzatoare este complexa atunci automat valoarea pentru Q(sri) sau Q(sdj ) va fi complexa rezultand doua ecuatii corespunzatoare partii reale si celei imaginare avand ca solutii Re Q(·) si Im Q(·). Ecuatiile care rezulta pentru radacina complex conjugata sri sau srj vor fi identice cu cele obtinute pentru sri sau srj si nu mai este necesar sa le rezolvam/scriem. CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie

55


• Parametrul Q este complet arbitrar in S insa conditiile de interpolare impun esentialmente conditii asupra zerourilor sale. In consecinta pentru simplificarea cat mai mult posibil a calculelor necesare se ia un Q ∈ S de o forma cat mai simpla de tipul a0 + a1s + . . . + ak+ℓ−1sk+ℓ−1 Q(s) = (s + 1)k+ℓ−1 sau Q(s) = a0 + a1

1 1 + . . . + ak+ℓ−1 . k+ℓ−1 s+1 (s + 1)

Numarul minim de parametri cu care se incearca gasirea lui Q este dat de numarul de conditii de interpolare ce trebuie satisfacute, i.e., k + ℓ si fixeaza gradul (minim) al numaratorului si numitorului lui Q la k + ℓ − 1 (Q trebuie sa fie propriu). Se observa ca pentru orice valori ale parametrilor a0, a1, . . . , ak+ℓ−1 avem Q ∈ S. • Daca modelul intern este asigurat de sistemul original P atunci ecuatiile (14) si (15) sunt satisfacute indiferent de valoarea lui Q. Intr–adevar, daca in cazul urmaririi referintei avem ca sri este pol al lui P , atunci automat M (sri) = 0 CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie

56


si ecuatia respectiva M (sri)(Y (sri) − N (sri)Q(sri)) = 0, nu conduce la nici o restrictie asupra lui Q(sri). Similar pentru cazul rejectiei perturbatiei daca sdj este in modelul original P (s) sub forma unui zerou atunci ecuatia N (sdj )(Y (sdj ) − N (sdj )Q(sdj )) = 0, este automat satisfacuta pentru ca N (sdj ) = 0 si deci nu apare nici o restrictie asupra lui Q(sdj ). Aceste fapte ne permit reducerea complexitatii parametrului Q (si implicit a complexitatii regulatorului rezultant) in cazurile mentionate. • Daca apare necesitatea asigurarii unui model intern cu radacini multiple ecuatiile (14) si (15) trebuie completate cu variantele lor derivate de k − 1 ori, unde k este multiplicitatea radacinii lui r(s) sau d(s). • Ecuatiile (14) sunt satisfacute sau daca M (sri) = 0 caz in care ecuatia se elimina CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie

57


si se scade cu 1 sau cu 2 gradul lui Q (caz real sau complex) sau daca Q(sri) =

Y (sri ) . N (sri )

Dupa eliminarea tuturor ecuatiilor triviale (generate de prezenta chiar si partiala a radacinilor in modelul intern) rezulta deci ca Q se alege a.i. sa satisfaca ecuatiile Q(sri) =

Y (sri) , N (sri)

Q(sdj ) =

Y (sdj ) N (srj )

ceea ce revine la gasirea parametrilor a0, a1, . . . ak+ℓ−1 ce satisfac sistemul de ecuatii  1  Y (sri) = a0 + a1 1 + . . . + ak+ℓ−1 , ∀i = 1, . . . , k, N (sri ) sri +1 (s +1)k+ℓ−1 

Y (sdj ) N (sdj )

ri

= a0 + a1 s

1 dj +1

+ . . . + ak+ℓ−1 (s


58

1 k+ℓ−1 , dj +1)

∀i = 1, . . . , ℓ.


Acest sistem este un sistem liniar de k + ℓ ecuatii si k + ℓ necunoscute a0, a1, . . . , ak+ℓ−1, avand matricea sistem de tip Vandermonde. Notam in continuare unitar cu si punctele de interpolare atat corespunzatoare referintei cat si perturbatiei (mai exact si := sri ptr. i = 1, . . . , k si si := sdi−k ptr i = k + 1, . . . , k + ℓ. Sistemul Vandermonde se rescrie Aax = b unde   Y (s )   1 1 1 1 1 . . . s1 +1 N (s1 ) (s1 +1)2 (s1 +1)k+ℓ−1 " a # 1 1   1  Y (s2)  s2 . . . 0    N (s2)  (s2 +1)2 (s2 +1)k+ℓ−1 a1 .. . . . .   . .. .. .. .. , b :=  A :=  .. , ax := . .    .. .. .. ..  ...    . . . . ak+ℓ−1 1

1 sk+ℓ +1

1 (sk+ℓ +1)2

...

1 (sk+ℓ +1)k+ℓ−1

Y (sk+ℓ ) N (sk+ℓ )

Sistemul are solutie unica daca si numai daca matricea A este inversabila sau det A 6= 0. Se stie ca pentru o matrice Vandermonde are loc formula det A = Π1≤i
si deci problema are solutie unica daca si numai daca punctele de interpolare CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie

59


sunt distincte. • Daca punctele de interpolare nu sunt distincte (apar radacini si cu ordinul de multiplicitate m > 1 atunci se scrie ecuatia de baza si inca m − 1 derivate ale sale. Matricea A devine de tip Vandermonde extinsa avand cele m linii corespunzatoare lui si de tipul     

1 0 0 ..

1 si+1

1 0 ..

1 (si+1)2 2 si1+1

2 ..

... ... ... ..

1 (si+1)k+ℓ−1

(k + ℓ − 1) (s +1)1k+ℓ−2 i (k + ℓ − 1)(k + ℓ − 2) (s +1)1k+ℓ−3 i ..

si se actualizeaza corespunzator coeficientul termenului liber componentelor derivate.

Y (si ) N (si )

    

ce corespunde

• Din cele de mai sus aparent reiese ca problema reglarii are intotdeauna solutie. Acest lucru nu este adevarat si rezulta din faptul ca este posibil ca N (si) = 0 caz in care automat M (si) 6= 0 iar ecuatia de interpolare M (si)(Y (si)−N (si)Q(si)) = 0 CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie

60


poate fi satisfacuta daca si numai daca Y (si) = 0. Aceasta egalitate nu poate insa avea loc intrucat rezulta ca (N X + M Y )(sri) = 0 6= 1. Teorema urmatoare sintetizeaza conditiile necesare si suficiente de existenta a unei solutii a problemei reglarii. N Teorema 20. Fie P = M o factorizare coprima peste S si X, Y ∈ S a.i. n N X + M Y = 1. Fie r = rrmn si d = ddm semnale persistente de tip referinta si respectiv de tip perturbator factorizate coprim peste polinoame. Fie r1 si d1 c.m.m.d.c. (cel mai mare divizor comun – peste polinoame – ) al perechii (rm, M ) si respectiv al perechii (dm, N ) si fie rm rem = , r1

dm e dm = , d1

e := rem × dem. rd

Problema reglarii are o solutie daca si numai daca N nu are nici un zerou e comun cu rd.


61


Demonstrat¸ie. Conditia este necesara: P.p. prin absurd ca si este un zerou comun atat al lui N (s) cat si red(s). Dupa simplificarea c.m.m.d.c. re1 si de1 in ecuatiile de interpolare rezulta ca si trebuie sa satisfaca ecuatia Y (si) − N (si)Q(si) = 0 care asa cum am vazut deja este posibila daca si numai daca N (si) 6= 0. De unde contradictia. e nu are zerouri comune cu N Conditia este suficienta: Intr–adevar, daca rd e rezulta ca N (si) 6= 0 pentru fiecare zerou al lui rd(s) si deci putem scrie un sistem Vandermonde corespunzator care are intotdeauna o solutie unica.


62


Procedura pentru rezolvarea problemei reglarii

Pasul 1: Se rezolva problema stabilizarii folosind parametrizarea lui Youla pentru clasa tuturor compensatoarelor stabilizante; Pasul 2: Se analizeaza specificatiile de performanta asimptotice si se reduc la conditii de interpolare asupra parametrului Q; se trateaza distinct cazul cu radacini multiple si se analizeaza existenta solutiilor; Pasul 3: Daca problema are solutie se rezolva sistemul Vandermonde corespunzator si se determina parametrul Q care satisface deci conditiile de interpolare; Pasul 4: Se inlocuieste parametrul Q in expresia parametrizata a compensatorului si se obtine compensatorul regulator. Observatia 21. Toate dezvoltarile de mai sus se pot face folosind modele polinomiale insa natura intima a problemelor de reglare (cu asigurarea prealabila a stabilizarii) indica ca mult mai potrivita abordarea de mai sus ce foloseste factorizari coprime peste S ! Observatia 22. Se poate formula o problema conexa problemei de reglare deja CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie

63


formulate, numita problema de reglare structural stabila. Aceasta cere ca pentru o vecinatatate intreaga (cat de mica) a modelului nominal compensatorul sa stabilizeze si sa continue sa regleze. Se poate arata relativ usor ca acesta problema are solutie daca si numai daca cel mai mic multiplu comun al lui rm b divide Y − N Q adica daca si numai daca si dm notat rd N (si) 6= 0, b ⇔ rd(s)

nu

∀si

a.i.

are

b i) = 0 rd(s

zerouri

comune

cu

N (s).

Acest fapt implica ca modelul semnalelor externe (exogene) r si d trebuie sa fie integral inclus in modelul regulatorului si nu poate fi folosita (in caz ca exista) partea comuna cu modelul nominal P (s). Din punct de vedere al aplicatiilor concrete ale reglarii, avand in vedere ca modelul nominal este aproape intotdeauna imprecis se impune deci includerea INTEGRALA a modelului exogenului in regulator (chiar daca este deja total/partial continut in P ). CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie

64


In general aceasta masura de precautie nu este suficienta pentru multe aplicatii intrucat nu garanteaza rezolvarea problemei decat pentru o vecinatate arbitrar de mica a modelului nominal. Formularea corecta si rezolvarea completa a problemei se face in cadrul teoriei robustetii in care se gasesc acei Q care maximizeaza vecintatea in care are loc stabilizarea si/sau performanta asimptotica.


65


Alte cerinte de performanta realizabile cu Q Parametrul Q poate fi folosit pentru realizarea altor cerinte de performanta: • Obtinerea anumitei comportari dinamice dorite a sistemului in bucla inchisa prin asigurarea anumitor locatii a polilor in bucla inchisa) – (exercitiu: propuneti o metoda pentru aceasta !); • Asigurarea stabilizarii robuste ce permite cele mai mari incertitudini (intr-o anumita norma) asupra modelului nominal P cu pastrarea stabilitatii interne; • Performanta robusta ce permite asigurarea proprietatilor de tip asimptotic pentru o incertitudine cat mai mare in modelul nominal P ; • Asigurarea reglarii cu o clasa de regulatoare ce permit limitarea comenzii la o anumita valoare prescrisa; CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie

66


• Sa se stabilizeze un sistem stabil cu un compensator stabil; • Problema stabilizarii simultane a doua sau mai multe sisteme nominale date folosind acelasi regulator • Combinatii ale tuturor sau doar unora dintre cerintele de mai sus. Desigur, combinand toate sau chiar o parte dintre aceste cerinte problemele se complica major si exista desigur situatii in care nu se pot asigura simultan toate cerintele. Un studiu mai detaliat al conditiilor in care anumite cerinte din cele de mai sus pot fi satisfacute se va face la Master (implica introducerea unui formalism matematic adecvat). Desigur exista si numeroase probleme deschise (a caror solutie nu a fost inca data) pe care sunteti invitati sa le incercati !


67


Exemple de Probleme (tipice de examen) Exemplul 23. Fie un sistem nominal stabil P . Sa se gasesca toate regulatoarele care urmaresc o referinta treapta. Mai mult, sa se precizeze subclasa solutiilor structural stabile. Rezolvare: Orice reglare se face cu stabilizare prealabila. P fiind stabil, rezulta Q ca C = 1−P Q da clasa tuturor compensatoarelor stabilizatoare cand Q parcurge S. In cazul in care P este stabil, avem trivial N = P , M = 1, Y = 1, X = 0. Pentru un semnal de tip treapta r(t) = 1(t) avem r(s) = 1s si deci rm(s) = s cu singurul zerou in s = 0. Cum M (0) = 1 6= 0 rezulta ca singura varianta de a satisface ecuatia M (0)(Y (0) − N (0)Q(0)) = 0 este sa avem P (0) = N (0) 6= 0. In concluzie problema are solutie daca si numai daca s = 0 nu este zerou al lui 1 satisface cerinta de reglare, i.e., P caz in care orice Q ∈ S cu Q(0) = P (0) C=

Q : Q ∈ S, 1 − PQ


Q(0) = 68

1 . P (0) Solutia Problemei Reglarii

Aceasta expresie da si clasa solutiilor structural stabile (explicati de ce !!!). 1 Exemplul 24 (Exemplu detaliat la seminar). Fie P (s) = (s−1)(s−2) . Sa se gaseasca un regulator ce asigura urmarirea unei referinta treapta r(t) = 1(t) si rejectia unei perturbatii sinusoidale d(t) = sin10t. Rezolva orice regulator gasit problema structural stabila ? Schita de rezolvare: Trebuie gasita intai clasa compensatoarelor stabilizante. Q P fiind instabila aceasta are forma C = X+M Y −N Q cu Q arbitrar in S. Deci trebuie intai gasiti N, M, X, Y folosind procedura de la pagina 29. Mai intai calculam 2 1 − λ λ )= 2 , Pe (λ) := P ( λ 6λ − 5λ + 1

cu

n(λ) = λ2,

m(λ) = 6λ2 − 5λ + 1.

Aplicam algoritmul lui Euclid pentru n(λ) si m(λ) obtinand succesiv 1 q1(λ) = , 6 CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie

5 1 r1(λ) = λ − , 6 6 69


36 6 1 q2(λ) = λ − , r2(λ) = 5 6 25 si ne oprim intrucat am obtinut un rest constant nenul. Ecuatiile verificate sunt n = mq1 + r1 m = r 1 q2 + r 2 de unde r2 = (1 + q1q2)m − q2n. Deci luam 1 + q1 q2 q2 = 5λ + 1. x = − = −30λ + 19, y = r2 r2 1 Revenind in variabila s prin transformarea inversa λ = s+1 obtinem 1 N (s) = , (s + 1)2

(s − 1)(s − 2) M (s) = (s + 1)2

1 19s − 1 X(s) = x( )= , s+1 s+1 CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie

1 s+6 Y (s) = y( )= . s+1 s+1 70


Deci am deteminat toti C care asigura stabilitatea interna. 2 Avem r(s) = 1s si d(s) = s2100 de unde r (s) = s si d (s) = s + 100. m m +100 Observam ca nici o radacina a acestor doua polinoame nu apare ca pol respectiv ca zerou al sistemului initial P si deci problema de reglare structural stabila va avea aceeasi solutie cu cea obisnuita data de cele doua conditii de interpolare ce trebuie satisfacute:

M (0)(Y (0) − N (0)Q(0)) = 0, N (10j)(Y (10j) − N (10j)Q(10j)) = 0. Inlocuind valorile corespunzatoare ale lui N, M, Y obtinem echivalent Q(0) = Q(10j)

Y (0) N (0) = 6 Y (10j) =N (10j) =

−94 + 10j

⇔

Re Q(10j) = −94,

Im Q(10j) = 70.

Avem de satisfacut trei conditii de interpolare si deci vom lua un polinom Q CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie

71


(in variabila

1 s+1 )

cu trei coeficienti deci de gradul 2:

Q(s) = a0 + a1

1 1 + a2 . 2 s+1 (s + 1)

Ramane sa determinam coeficientii a0, a1, a2 pe baza conditiilor de interpolare. Rezolvand sistemul liniar de tip Aax = b ce se obtine rezulta coeficientii a0 = −79, a1 = −723, a2 = 808. De aici rezulta expresiile −79s2 − 881s + 6 Q(s) = , 2 (s + 1)

−60s4 − 598s3 + 2515s2 − 1794s + 1 C(s) = s(s2 + 100)(s + 9)

care reprezinta solutia cautata. Exemplul 25. Sa presupunem ca in exercitiul precedent se cere realizarea unei urmariri a unei referinte de tip rampa, in contextul in care perturbatiile nu apar CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie

72


(sunt nule). Semnalul rampa are transformata Laplace r(s) =

1 s2

si deci rm(s) = s2. Conditia de interpolare se pune astfel incat M (s)(Y (s) − N (s)Q(s)) sa aibe un zerou dublu in s = 0. Cum M (0) 6= 0 rezulta echivalent ca Y (s) − N (s)Q(s) trebuie sa aibe un zerou dublu in s = 0 si deci Q(s) trebuie sa fie de gradul 1 pentru a avea doi parametri liberi a0 si a1, i.e., 1 Q(s) = a0 + a1 . s+1 Conditiile de interpolare sunt deci Q(0) = CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie

Y (0) =6 N (0) 73


si respectiv conditia asupra derivatei ′

′

Y (0)N (0) − N (0)Y (0) Q (0) = N (0)2 ′

din care rezulta sistemul corespunzator cu solutia a0 = 13, a1 = −7. Similar se scrie acum Q si respectiv C.


74


CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 1. Sisteme Dinamice pe Spatiul Starilor 2. Evolutia Starii, Tranzitia Intrare–Iesire 3. Echivalenta Sistemelor Liniare 4. Stabilitatea Sistemelor 5. Regimurile Permanent/Tranzitoriu/Stationar

CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR

75 SISTEME DINAMICE PE SPATIUL STARILOR

1. Sisteme Dinamice pe Spatiul Starilor

Clasa sistemelor considerate: • LINIARE • INVARIANTE IN TIMP • FINIT DIMENSIONALE • MULTI-INTRARE/MULTI-IESIRE (MIMO) Definitia 26. Se numeste sistem dinamic liniar, invariant in timp, cu timp continuu un cuadruplu de matrici constante (A, B, C, D), unde A ∈ Rn×n, CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR

76 Sisteme Dinamice pe Spatiul Starilor

B ∈ Rn×m, C ∈ Rp×n, D ∈ Rp×m ce se expliciteaza prin

x(t) ˙ = Ax(t) + Bu(t), y(t) = Cx(t) + Du(t)

x(to) = xo

(16)

unde x(t) ∈ Rn, u(t) ∈ Rm, y(t) ∈ Rp; u(t) → intrarea sistemului, u(·) ∈ U, U → spatiul functiilor (semnalelor) de intrare; y(t) → iesirea sistemului, y(·) ∈ Y, Y → spatiul functiilor (semnalelor) de iesire; x(t) → starea sistemului, x(·) ∈ X , X → spatiul starilor. Observatii: • Sistemul dinamic astfel definit admite o scriere matriciala ce expliciteaza de fapt un sistem de n ecuatii diferentiale cu n necunoscute (starile) iar iesirile sunt o combinatie liniara a starilor si intrarilor (FIG); • Sistemul este automat invariant in timp, liniar, finit dimensional si cauzal ! • Datorita invariantei in timp se poate lua intotdeauna to = 0 si deci conditia initiala se rescrie x(0) = xo; CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR


• Sistemul dinamic astfel definit se poate figura ca un sistem intrare–iesire in care starea joaca rolul de variabila de cuplare (FIG) ! • Sistemul este complet precizat de cele patru matrici (A, B, C, D); • Conditii uzuale: u(t) continua cel putin pe portiuni caz in care x(t) si y(t) rezulta functii continue;



2. Evolutia Starii, Tranzitia Intrare–Iesire Prima ecuatie a sistemului x(t) ˙ = Ax(t) + Bu(t),

x(0) = xo

este in fapt un sistem de n ecuatii diferentiale ordinare cu n necunoscute avand o solutie unica in cazul in care starea initiala xo si comanda u(t), t ≥ 0, sunt precizate (u(·) este continua pe portiuni). Din teoria ecuatiilor diferentiale ordinare solutia rezulta R t A(t−τ ) At x(t) = φ(t, xo, u(·)) = e xo + 0 e Bu(τ )dτ = φ(t, xo, 0) + φ(t, 0, u(·)) = xℓ(t) + xf (t). Functia φ : R × Rn × U → Rn se numeste functia de tranzitie a starii. Descompunerea aditiva de mai sus pune in evidenta superpozitia efectelor (datorate starii CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR

79 Evolutia Starii, Tranzitia Intrare–Iesire

initiale xo – regim liber – si respectiv comenzii u(·) – regim fortat). Matricea Φ(t) := eAt se numeste matricea de tranzitie a starii. Cu aceasta notatie solutia sistemului de ecuatii diferentiale se rescrie

x(t) = Φ(t)xo +

Z

t

Φ(t − τ )Bu(τ )dτ.

(17)

0

Problema: Ce inseamna si cum se calculeaza eAt ? Avem prin definitie ex = 1 +

1 1 1 x + x2 + . . . + xn + . . . 1! 2! n!



care in cazul matricial devine At

e

1 1 1 2 = In + (At) + (At) + . . . + (At)n + . . . . 1! 2! n!

(18)

Calculul matricii de tranzitie a starii se bazeaza pe forma Jordan a matricii A si va fi explicitat mai tarziu. Reversibilitatea timpului: Deoarece Φ(t) 6= 0, ∀t finit, obtinem din (17) xo

Rt = Φ(−t)x(t) − 0 Φ(−t)Φ(t − τ )Bu(τ )dτ Rt = Φ(−t)x(t) − 0 Φ(−τ )Bu(τ )dτ

(19)

de unde rezulta ca in cazul sistemelor netede (cu timp continuu) starea initiala se poate intotdeauna recupera daca se cunoaste “unde s-a ajuns” si comanda care a generat starea respectiva. (FIG) Iesirea sistemului se obtine imediat ca o combinatie liniara de intrari si stari sub CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR


forma (vezi (16) si (17)) Rt

y(t) = f (t, xo, u(·)) = Ce xo + 0 CeA(t−τ ) Bu(τ )dτ = f (t, xo, 0) + f (t, 0, u(·)) = yℓ(t) + yf (t). At

Matricile T (t) := CΦ(t)B,

Tc(t) :=

0, t < 0, T (t), t ≥ 0

se numesc matricea pondere respectiv matricea de raspuns cauzal la impuls. Mai mult Tc(t) = T (t)1(t) unde 1(t) := diag {1(t)} iar 1(t) este functia treapta (Heaviside). Cu aceste notatii Z t y(t) = CΦ(t)xo + Tc(t − τ )u(τ )dτ. 0



In particular daca xo = 0 obtinem y(t) =

Z

t

Tc(t − τ )u(τ )dτ = yf (t)

0

ceea ce arata ca matricea de raspuns cauzal la impuls permite exprimarea iesirii atunci cand conditia initiala este nula. Mai precis, in conditii initiale nule sistemul dinamic se poate exprima ca un sistem de convolutie sub forma y(t) =

Z

∞

Tc(t − τ )u(τ )dτ = Tc(t) ∗ u(t), −∞

(u = 0 pentru t < 0 si Tc(t − τ ) = 0 pentru t − τ < 0). Daca m = p = 1 atunci Tc(t) = hc(t) si are semnificatia de raspuns cauzal al sistemului atunci cand la intrare se aplica un impuls Dirac u(t) = δ(t). Functie (Matrice) de Transfer CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR


Restrangem intrarile la clasa functiilor original, i.e., U ⊂ O. Atunci automat x(t) si y(t) vor fi functii original, i.e. X ⊂ O si Y ⊂ O. In aceste conditii aplicand transformatele Laplace sistemului original (16) obtinem sx(s) − xo = Ax(s) + Bu(s), (20) y(s) = Cx(s) + Du(s), de unde tinand cont ca (sI − A) este a.p.t. nesingulara x(s) = (sI − A)−1xo + (sI − A)−1Bu(s) = xℓ(s) + xf (s). Avem deasemenea Φ(s) := L(Φ(t)) = L(eAt) = (sI − A)−1 care se numeste matricea rezolventa si deci Φ(t) = L−1((sI − A)−1). CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR


Mai mult, Φ(s) = s−1I + s−2A + s−3A3 + . . . care are loc pentru |s| > R unde R := max{|λ|, λ ∈ Λ(A)}. Deasemenea Φ(s) = (sI − A)

−1

(sI − A)∗ G(s) = = χ(s) ν(s)

unde χ(s) := det(sI − A) si ν(s) sunt polinomul caracteristic respectiv minimal ale lui A. In operational iesirea devine y(s) = Cx(s)+Du(s) = C(sI−A)−1xo+C(sI−A)−1Bu(s)+Du(s) = yℓ (s)+yf (s). Matricea de transfer este prin definitie T (s) := L(Tc(t)) = C(sI − A)−1 B + D =: CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR

A B C D


unde ultima expresie explicita se obtine comparand expresiile iesirii in domeniul timp si operational. Mai departe, e R(s) R(s) C(sI − A)∗B T (s) = +D = = = {Tij (s)} χ(s) χ(s) ν(s)

1≤i≤p 1≤j≤m

.

Matricea de transfer a unui sistem dinamic (in acceptiunea definitiei date) este o p × m matrice de functii rationale proprii. Ea permite explicitarea in operational a iesirii in functie de intrare atunci cand conditiile intiale sunt nule y(s) = T (s)u(s)


(xo = 0).


3. Echivalenta Sistemelor Liniare e B, e C, e D) e avand acelasi Definitia 27. Doua sisteme liniare (A, B, C, D) si (A, numar de intrari si iesiri si aceeasi dimensiune a spatiului starilor (p = pe, m = m, e n=n e) se numesc echivalente (izomorfe) pe stare daca exista o transformare nesingulara T astfel incat e A e B e C e D

= T AT −1, = T B, = CT −1, = D.

Transformarea T este de fapt o schimbare de coordonate la nivelul marimii de CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR

87

Echivalenta Sistemelor Liniare

stare. Intr–adevar, daca

x(t) ˙ = Ax(t) + Bu(t), y(t) = Cx(t) + Du(t),

(21)

si definim pentru un T inversabil fixat

atunci obtinem

x e(t) := T x(t)

⇔

x(t) = T −1x e(t)

˙ T −1x e(t) = AT −1x e(t) + Bu(t), ⇒ −1 y(t) = CT x e(t) + Du(t), ˙ x e(t) = T AT −1x e(t) + T Bu(t), ⇒ −1 y(t) = CT x e(t) + Du(t), ( ˙ ex(t) + Bu(t), e x e(t) = Ae ex e y(t) = C e(t) + Du(t),


88

(22)


unde e = T AT −1, A

e = T B, B

e = CT −1, D e = D. C

Propozitia 28 (Exercitiu). Doua sisteme echivalente pe stare care au conditiile initiale asemenea prin T si sunt supuse aceleiasi comenzi u(·) au traiectoriile de stare asemenea prin T si evolutii la iesire identice. e B, e C, e D) e se numesc Definitia 29. Doua sisteme dinamice (A, B, C, D) si (A, echivalente intrare–iesire daca au aceeasi functie de transfer, i.e., e e −1B e+D e = C(sI − A)−1B + D = T (s). Te(s) = C(sI − A) Observatii: a) Doua sisteme echivalente intrare–iesire trebuie sa aibe acelasi numar de intrari (m = m) e si acelasi numar de iesiri (p = pe). Este posibil insa ca dimensiunea vectorului de stare sa difere, i.e. n 6= n e. CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR

89


b) Pentru doua sisteme echivalente intrare–iesire avem automat e D = T (∞) = Te(∞) = D.


90


Relatia intre Echivalenta de Stare si Echivalenta Intrare–Iesire Propozitia 30. Doua sisteme echivalente pe stare sunt echivalente intrare–iesire. Demonstrat¸ie. Intr-adevar, e e −1B e+D e = CT −1(sI − T AT −1)−1T B + D Te(s) = C(sI − A) = CT −1(T (sI − A)T −1)−1T B + D = C(sI − A)−1B + D = T (s).

Observatii: a) Reciproca nu este in general valabila (este posibil ca pentru doua sisteme echivalente intrare–iesire) sa avem n 6= n e). (EX) b) Diferenta in definitiile echivalentei consta in aceea ca una este centrata pe stare pe cand cealalta este centrata pe functia de transfer (intrare–iesire). c) Pentru orice matrice de transfer exista o infinitate de realizari de stare. CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR

91


d) Problema dimensiunii realizarii de stare este esentiala: exista o dimensiune ce este minima (realizare minimala), strict legata de anumite proprietati structurale.


92


4. Stabilitatea Sistemelor Dinamice

Stabilitatea este o proprietate calitativa a sistemelor asociata comportarii dinamice a acestora. Daca stabilitatea se refera la comportarea lui x(t) se numeste stabilitate de tip Lyapunov iar daca se refera la y(t) se numeste stabilitate externa. Stabilitate Interna (Libera sau Lyapunov) Acest tip de stabilitate se refera la comportarea marimii de stare x(t) atunci cand intrarea este identic nula. Ecuatia relevanta este x(t) ˙ = Ax(t),

x(0) = xo.

Definitia 31. Un sistem dinamic se numeste intern stabil daca ∀ǫ > 0, ∃δ(ǫ) > 0 CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR

93

Stabilitatea Sistemelor Dinamice

a.i. ∀xo cu kxok < δ(ǫ) avem kx(t)k ≤ ǫ,

∀t ∈ R+.

Definitia 32. Un sistem dinamic s. n. intern asimptotic stabil daca ∀xo avem lim kx(t)k = 0.

t→∞

Observatii: a) Definitia este generala folosindu-se si in cazul sistemelor neliniare. In cazul liniar exista anumite consecinte simple deoarece avem solutia x(t) = eAtxo. b) Sistemul este intern asimptotic stabil daca si numai daca limt→∞ Φ(t) = 0. Evaluarea lui Φ(t) = eAt CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR

94


Consideram succesiv urmatoarele cazuri: a) A este un bloc Jordan elementar cu valoare proprie 0; b) A este un bloc Jordan elementar oarecare; c) A oarecare.

a) In acest caz presupunem A ∈ Rn×n si 

0 1 ...  .. .. . . . A = J0 =   0 0 ... 0 0 ...



0 ..  . 1  0

Evident A este nilpotenta cu indice de nilpotenta egal cu n, i.e. An = 0 si CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR

95


An−1 6= 0. Folosind definitia exponentialei matriciale (18) obtinem in acest caz

At

e



0  .. = I n +  0 0

t 1!

.. 0 0

... ... ... ...





0  ..    +· · ·+  t   1! 0

0 0 ... .. .. . . . 0 0 ... 0 0 ...

n−1

t (n−1)!

.. 0 0





    =  

1 .. 0 0

t 1!

.. 0 0

... ...

tn−1 (n−1)!

... ...

b) In acest caz presupunem A ∈ Rn×n si

A = Jo + Λo,

unde



λo 0 . . .  .. .. . . . Λo =   0 0 ... 0 0 ...



0 ..   = λoIn. 0  λo

Avem eAt = e(Jo+Λo)t = eJoteΛ0t (relatie ce are loc pentru ca Λo comuta cu Jo). CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR

96


..

t 1!

1

Tinand cont ca eΛot = eλotIn obtinem in final

eAt



  = eλot  

1 .. 0 0

t 1!

.. 0 0

n−1

... ...

t (n−1)!

... ...

t 1!

..

1



  . 

c) Cazul general se reduce la cazurile precedente prin aducerea matricii A la forma canonica Jordan. Mai precis, ∀A ∈ Rn×n, ∃T ∈ Rn×n nesingulara a.i. 

J = T AT −1 = 

J1 0

...

0 Jk

 

unde J este o matrice Jordan (bloc diagonala avand pe diagonala blocuri elementare CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR

97


Jordan Ji la valorile proprii ale matricii A). Matricea de tranzitie a starii devine eAt = eT

−1

JT t



= T −1eJtT = T −1 

J1 t

e

0

... 0

eJk t



 T.

Recapitulare: Polinom caracteristic, minimal, forma canonica Jordan, valori proprii, multiplicitati algebrice si geometrice; Teorema 33. 1. Sistemul dinamic (A, B, C, D) este intern asimptotic stabil daca si numai daca Λ(A) ⊂ C− (spectrul matricii de stare A este localizat in semiplanul stang deschis). 2. Sistemul dinamic (A, B, C, D) este intern stabil daca si numai daca Λ(A) ⊂ C− ∪ C0 iar valorile proprii care au partea reala nula sunt radacini simple ale polinomului minimal. Demonstratie: 1. Suficienta conditiilor rezulta automat din forma Jordan. Pentru necesitate pp ca sistemul este intern asimptotic stabil. Atunci rezulta ca Φ(t)xo → 0 pentru t → ∞, ∀xo ∈ Rn. Pp prin absurd ca nu este indeplinita conditia de CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR

98


spectru. Atunci ∃ λ0 ∈ Λ(A) cu Re λo ≥ 0. Fie xo un vector propriu asociat lui λo. Atunci eAtxo = eλotxo 6→ 0 ceea ce contrazice ipoteza de stabilitate asimptotica. 2. Demonstratia este similara tinand cont ca eJit este marginita (Ji este bloc Jordan elementar) daca si numai daca v. p. corespunzatoare are partea reala sau strict negativa sau zero cu multiplicitatea cel mult unu. Observatii: a) Testarea stabilitatii interne pentru un sistem dinamic se reduce din punct de vedere procedural la calculul valorilor proprii ale matricii de stare A (aducerea matricii la forma Schur). b) Deoarece stabilitatea interna a unui sistem depinde exclusiv de locatia spectrului matricii de stare A uneori se foloseste abuziv terminologia de matrice (asimptotic) stabila. Ecuatia Lyapunov si Stabilitatea Sistemelor Liniare Ecuatia AT P + P A + Q = 0, CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR

A ∈ Rn×n ,

Q ∈ Rn×n 99

(23)


in necunoscuta P ∈ Rn×n se numeste ecuatie Lyapunov (matriciala, algebrica, in timp continuu). Teorema 34. Daca matricea A este asimptotic stabila (Λ(A) ⊂ C−) atunci ecuatia Lyapunov are o solutie unica data explicit de expresia P :=

Z

∞

AT t

e

QeAtdt.

(24)

0

Demonstrat¸ie. Sa observam intai ca deoarece A este asimptotic stabila expresia (24) este bine definita (integrala nedefinita este convergenta). Calculand T

A P + PA = =

R∞

T AT t At (A e Qe 0 ∞ T A t At

e

Qe

0

AT t

+e

= −Q

At

Qe A)dt =

R∞ 0

d AT t At (e Qe )dt dt

concluzionam ca intr-adevar P dat de (24) este o solutie a ecuatiei Lyapunov. CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR

100


Ramane sa aratam ca P este unica solutie. Consideram aplicatia liniara 2

2

P : Rn → Rn ,

P(P ) := AT P + P A. 2

Aceasta aplicatie este insa surjectiva deoarece tocmai am aratat ca ∀Q ∈ Rn ⇒ n2 ∃P ∈ R (dat de (24)) a.i. P(P ) = −Q. Deoarece o aplicatie liniara si surjectiva este automat injectiva (si deci bijectiva) rezulta ca pentru Q fixat P dat de (24) este unica solutie a ecuatiei Lyapunov (23). In particular, P = P −1(−Q). Observatii: a) Daca Q = QT atunci rezulta automat din (24) ca P = P T . b) Daca Q = QT ≥ 0 atunci P = P T ≥ 0. c) Daca Q = QT > 0 atunci P = P T > 0. Ecuatia Lyapunov se foloseste in special in teoria sistemelor neliniare pentru testarea stabilitatii. In cazul liniar avem urmatorul rezultat (un fel de reciproca). Teorema 35 (Lyapunov). Presupunem ca ∃P = P T > 0 si Q = QT ≥ 0 a. i. AT P + P A + Q = 0. CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR

101


Atunci Λ(A) ⊂ C− 0. Demonstrat¸ie. Fie λ ∈ Λ(A) o valoare proprie a lui A si x un vector propriu asociat, i.e., 6 0). Ax = λx (λ ∈ C, x ∈ Cn, x = Hermitizand aceasta ecuatie (transpus + conjugat) obtinem xH AT = λxH , iar din ecuatia Lyapunov avem succesiv xH AT P x + xH P Ax = −xH Qx; λxH P x + λxH P x = −xH Qx; 2 Re(λ)xH P x = −xH Qx. Deoarece xH P x > 0 si −xH Qx ≤ 0 rezulta automat Re(λ) ≤ 0. CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR

102


Observatii: a) Daca in teorema de mai sus intarim ipotezele a.i. P > 0, Q > 0 atunci rezulta ca A este asimptotic stabila (Λ(A) ⊂ C−). b) Indicatii procedurale de testare a (semi)pozitivitatii si rezolvare a ecuatiilor Lyapunov. c) Ecuatia Lyapunov se poate folosi pentru a testa stabilitatea unui sistem prin rezolvarea unui sistem de ecuatii liniare (o problema considerabil mai simpla dpdv teoretic decat calculul valorilor proprii ale matricii A).


103


5. Regimurile Permanent/Tranzitoriu/Stationar ale Sistemelor

Fie sistemul

x˙ = Ax + Bu, y = Cx + Du avand matricea de transfer

x(0) = xo,

(25)

T (s) = C(sI − A)−1B + D. Pentru a pune in evidenta regimurile permanent si tranzitoriu ale unui sistem facem ipotezele: a) Sistemul este intern asimptotic stabil, i.e., Λ(A) ⊂ C−; b) Comanda u este produsa de regimul liber al unui sistem antistabil

x˙ e = Aexe, u = Cexe


xe(0) = xeo,

(26) 104 Regim Permanent/Tranzitoriu/Stationar

cu Λ(Ae) ⊂ C+ ∪ C0. Comanda are deci expresia u(t) = CeeAe txeo si cum Λ(Ae) ⊂ C+ ∪ C0 rezulta ca u este un semnal persistent (in particular, daca Ae = 0 avem u = Cexeo = cst). Deoarece sistemul (A, B, C, D) este asimptotic stabil putem afirma intuitiv ca dupa un timp suficient de lung (asimptotic) starea sistemului va urma semnalul de intrare produs de sistemul instabil (generatorul de semnal u). Prin urmare incercam sa vedem daca se poate pune in evidenta la nivelul starii x o descompunere de tipul x(t) = ξ(t) + V xe(t) (27) unde limt→∞ ξ(t) = 0 (componenta tranzitorie) si V xe(t) este proportionala cu u(t) = Cexe(t) (componenta permanenta). Inlocuind (27) in (25) obtinem ξ˙ + V x˙ e = Aξ + AV xe + BCexe CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR

105 Regim Permanent/Tranzitoriu/Stationar

sau inca

ξ˙ = Aξ + (AV − V Ae + BCe)xe. Deoarece Λ(A) ∩ Λ(Ae) = ∅ rezulta ca ecuatia Sylvester

(28)

AV − V Ae + BCe = 0 are o solutie unica V . Punand acest V in (27) si (28) regimul dinamic devine ξ˙ = Aξ, ξ(0) = ξ0 si cum sistemul original este asimptotic stabil avem ca limt→∞ ξ(t) = 0. Prin urmare, in ipotezele facute exista si este unic V a.i. sa avem descompunerea x(t) = xp(t) + xt(t) in regim permanent si respectiv regim tranzitoriu xp(t) := V xe, CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR

xt(t) := ξ(t).

(29) 106 Regim Permanent/Tranzitoriu/Stationar

Observatii: a) Descompunerea in regim permanent si tranzitoriu se face in raport cu clasa de semnale exogene {u(·)|u(t) = CeeAetxeo, xeo ∈ Rne }. b) Descompunerea in regim permanent si tranzitoriu este specifica sistemelor liniare (apare numai in context liniar) pe cand descompunerea in regim liber si fortat are loc si in cazul sistemelor neliniare. c) Daca Ae = 0 atunci avem de-a face cu un regim stationar (intrari constante), xe(t) = xeo, ∀t ≥ 0, ecuatia Sylvester are solutia V = −A−1BCe si obtinem xp(t) = −A−1BCexeo = −A−1BCu0, yp(t) = −CA−1 BCexe0 + Du0 = −CA−1Bu0 + Du0 = T (0)u0, unde u0 := Cexe0 si T (s) = C(sI − A)−1 B + D este matricea de transfer a sistemului. d) Daca Ae = jωI, Ce = I, avem u = uoejωt iar ecuatia Sylvester devine AV − jωV + B = 0 CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR


avand solutia unica V = (jωI − A)−1B. Regimul permanent este atunci yp = C(jωI − A)−1Buoejωt = T (jω)uoejωt unde uo = Cexeo. Exercitiu: Puneti in evidenta regimurile liber/fortat, permanent/tranzitoriu pentru un circuit RLC cu intrarea generata de un sistem cu matricea de stare Ae avand doua radacini pur imaginare complex conjugate. Specificati regimul stationar pentru acest circuit.



CAPITOLUL 3: PROPRIETATI STRUCTURALE Exista anumite proprietati fundamentale ale sistemelor dinamice pe spatiul starilor care influenteaza decisiv posibilitate de analiza si sinteza: controlabilitate, observabilitate, minimalitate, stabilizabilitate, detectabilitate. Aceste proprietati se reflecta in anumite proprietati structurale ale matricilor sistemice (A, B, C, D). 1. Controlabilitatea 2. Observabilitatea 3. Descompunere Structurala 4. Realizabilitate 5. Conexiunea Sistemelor

CAPITOLUL 3: PROPRIETATI STRUCTURALE

109

PROPRIETATI STRUCTURALE

1. Controlabilitatea (“Posibilitatea de a Controla”)

Controlabilitatea este o proprietate calitativa ce caracterizeaza abilitatea unui sistem x(t) ˙ = Ax(t) + Bu(t), x(0) = xo (30) y(t) = Cx(t) + Du(t), de a putea tranzita dintr-o stare in alta prin intermediul unei anumite comenzi (control). Pentru controlabilitate este relevanta numai prima ecuatie din (43) si solutia corespunzatoare A(t)

x(t) = e

xo +

Z

t

eA(t−τ ) Bu(τ )dτ,

t ≥ 0.

(31)

0

Stare/Sistem Controlabil(a) Definitia 36. O stare x ∈ Rn se numeste controlabila la momentul t > 0 daca exista o comanda u(·) ∈ U care transfera xo = 0 (originea) in starea x(t) = x. CAPITOLUL 3: PROPRIETATI STRUCTURALE

110

Controlabilitatea

Observatii: a) Aparent pentru a stabili controlabilitatea unei stari la momentul t trebuie rezolvata ecuatia functionala (31) in necunoscuta u(·) : [0, t] → Rn (cu xo = 0). b) Conform definitiei, controlabilitatea unei stari x depinde de perechea de matrici (A, B) si de momentul t > 0. Vom vedea ca de fapt controlabilitatea este o proprietate ce depinde exclusiv de perechea (A, B) (este independenta de t). Gramian de Controlabilitate Pentrul studiul controlabilitatii se introduce Gramianul de Controlabilitate la momentul t > 0 definit de Lc(t) =

Z

t A(t−τ )

e

T AT (t−τ )

BB e

dτ.

(32)

0

Observatii:a) Lc(t) = Lc(t)T ; b) Lc(t) ≥ 0; c) Pentru orice matrice simetrica X = X T ∈ Rn×n avem Ker (X) ⊥ Im (X) si CAPITOLUL 3: PROPRIETATI STRUCTURALE

111

Controlabilitatea

Rn = Ker (X) ⊕ Im (X). Cum se obtine asa ceva ? Caracterizarea Controlabilitatii prin Gramianul de Controlabilitate Teorema 37. Starea x este controlabila la momentul t > 0 daca si numai daca x ∈ Im Lc(t). Demonstrat¸ie. Necesitatea: Presupunem ca x este controlabila la momentul t > 0 adica ∃u(·) a.i. Z t x= eA(t−τ ) Bu(τ )dτ. 0

Avem x = xK + xI unde xK ∈ Ker Lc(t), xI ∈ Im Lc(t). Aratam ca xK = 0. Intr-adevar, Z t xTK eA(t−τ ) Bu(τ )dτ (33) xTK x = kxK k2 = 0

si pentru a arata ca xK = 0 este suficient sa aratam ca xTK eA(t−τ ) B = 0,


112

Controlabilitatea

∀τ ∈ [0, t]. Aceasta identitate rezulta insa automat din sirul de egalitati

0=

xTK Lc(t)xK

=

Z

t 0

T

xTK eA(t−τ ) BB T eA (t−τ )xK dτ

=

Z

t

T AT (t−τ )

kB e

xK k2dτ

0

T

si din analiticitatea functiei B T eA (t−τ ) xK pe [0, t]. Suficienta: Presupunem ca x ∈ Im Lc(t) ceea ce este echivalent cu

x = Lc(t)z =

Z

t

T

eA(t−τ ) BB T eA

(t−τ )

zdτ

(34)

0

pentru un z ∈ Rn potrivit ales. Definim T AT (t−τ )

u(τ ) := B e CAPITOLUL 3: PROPRIETATI STRUCTURALE

z,

τ ∈ [0, ∞) 113

(35) Controlabilitatea

care introdus in (34) arata ca x=

Z

t

eA(t−τ ) u(τ )dτ

0

sau ca starea x este controlabila la momentul t. Observatii: a) Deoarece z = Lc(t)#x comanda (35) se mai poate scrie ca T

u(τ ) := B T eA

(t−τ )

Lc(t)#x,

(36)

unde Lc(t)# este pseudoinversa (Moore-Penrose) a lui Lc(t). b) Daca x ∈ Im Lc(t) atunci comanda (36) duce starea initiala (originea) in starea x la momentul t iar daca x 6∈ Im Lc(t) atunci comanda (36) duce originea cat se poate de aproape de x la momentul t (adica transfera starea pe directia data de imaginea gramianului)! Caracterizarea Controlabilitatii prin Matricea de Controlabilitate CAPITOLUL 3: PROPRIETATI STRUCTURALE

114

Controlabilitatea

Din cele discutate pana acum controlabilitatea unei stari depinde de momentul de timp t > 0. In continuare vom vedea ca de fapt proprietatea de controlabilitate este independenta de t. Introducem matricea de controlabilitate asociata unui sistem dinamic (sau mai precis unei perechi matriciale (A, B), A ∈ Rn×n, B ∈ Rn×m): R :=

B

AB

2

A B

n−1

... A

B

.

(37)

Matricea de controlabilitate are dimensiune n × (nm). Teorema 38. Fie t > 0 fixat. Atunci x ∈ Im Lc(t) ⇔ x ∈ Im R, i.e., Im Lc(t) = Im R.

(38)

Demonstrat¸ie. Sa observam mai intai ca Lc(t) fiind simetrica conditia (49) este CAPITOLUL 3: PROPRIETATI STRUCTURALE

115

Controlabilitatea

echivalenta cu Ker Lc(t) = Ker RT sau inca Lc(t)x = 0 ⇔ xT R = 0,

x ∈ Rn.

(39)

Aratam intai implicatia directa. Avem Lc(t)x = 0 ⇔

Z

t T A(t−τ )

x e

T AT (t−τ )

BB e

xdτ = 0 ⇔

0

Z

t

kxT eA(t−τ ) Bk2dτ = 0. 0

Rezulta succesiv ca xT eA(t−τ ) B = 0, xT eAτ B = 0,

∀0 ≤ τ ≤ t, ∀τ ∈ R,

ultima egalitate rezultand din analiticitatea functiei xT eAτ B (daca o functie analitica este nula pe un interval deschis atunci este nula pe toata axa reala, iar CAPITOLUL 3: PROPRIETATI STRUCTURALE

116

Controlabilitatea

[0, t] contine automat un interval deschis). Mai departe obtinem ca dk T AT τ [B e x]τ =0 = 0, k dt

k = 0, 1, 2, . . .

de unde xT B = 0,

xT AB = 0, , . . . , xT Ak B = 0, . . . 2 n−1 T B = 0 sau xT R = 0. B AB A B . . . A ceea ce este echivalent cu x T Aratam acum implicatia inversa. Fie x = 6 0 a.i. x R = 0. Atunci xT B AB A2B . . . An−1B = 0 sau inca xT B = 0,

xT AB = 0,

, . . . , xT An−1 B = 0.

Din teorema Hamilton–Cayley rezulta imediat ca xT Ak B = 0, CAPITOLUL 3: PROPRIETATI STRUCTURALE

∀k ≥ 0. 117

Controlabilitatea

Definim functia analitica φ(τ ) := xT eAτ B, φ : [0, t] ⇒ Rm. Din relatiile de mai sus rezulta ca toate derivatele evaluate in zero sunt nule, i.e., φ(0) = 0, φ(1)(0) = 0, . . . φk (0) = 0. Din analiticitate rezulta automat ca φ(τ ) = 0, si mai departe ca xT Lc(t)x =

Z

∀τ ∈ [0, t]

t

φ(τ )φ(τ )T dτ = 0. 0

Cum Lc(t) ≥ 0 rezulta in continuare Lc(t)x = 0 q.e.d. Observatii: a) O stare x ∈ Rn este controlabila independent de momentul t > 0. Proprietatea este intrinseca starii x si perechii (A, B). b) Se poate arata ca daca extindem clasa de semnale de intrare la functii generalizate (incluzand distributii) atunci daca x este controlabila exista o comanda care duce originea in acea stare intr-un timp infinit mic (nul) – fenomene de tip Bushow. CAPITOLUL 3: PROPRIETATI STRUCTURALE

118

Controlabilitatea

c) Putem introduce definitia echivalenta: o stare x s.n. controlabila daca exista t > 0 si o comanda u(·), u : [0, t], a.i. traiectoria satisface x(t) = x. Corolarul 39. R := Im R = Im Lc(t), ∀t > 0. Introducem notiunea de sistem controlabil (sau pereche (A, B) controlabila) cu semnificatia ca fiecare stare x ∈ Rn este controlabila. Avem atunci urmatorul rezultat central. Teorema 40. Fie perechea (A, B). 1. O stare x este controlabila daca si numai daca x ∈ R. 2. Perechea (A, B) (sau sistemul corespunzator) este controlabila (controlabil) daca si numai daca R = Rn (sau, echivalent, rank R = n). Observatie: Din punct de vedere procedural controlabilitatea unui sistem se poate testa verificand ca rangul matricii de controlabilitate este n, i.e. rank R = n. Pentru testarea controlabilitatii exista un algoritm dedicat foarte eficient numit “controllability staircase”. Cu toate ca acest algoritm este numeric stabil atragem atentia ca problema testarii controlabilitatii este o problema “ill–posed” (prost CAPITOLUL 3: PROPRIETATI STRUCTURALE

119

Controlabilitatea

conditionata numeric). Gramian de Controlabilitate in Timp Infinit Daca matricea A este asimptotic stabila (Λ(A) ⊂ C−) atunci limita lim Lc(t)

t→∞

este finita, se noteaza cu Lc ∈ Rn×n = LTc ≥ 0 si este numita gramian de controlabilitate asimptotic. El verifica automat ecuatia Lyapunov ALc + LcAT + BB T = 0 si are expresia explicita Lc :=

Z

∞

T

eAτ BB T eA τ dτ.

0


120

Controlabilitatea

Observatie: Ecuatia Lypunov verificata de gramianul asimptotic are solutie unica. Aceasta ecuatie are insa solutii (unice) in conditii mult mai generale decat atunci cand A este stabila. Propozitia 41. Daca A este asimptotic stabila si perechea (A, B) este controlabila atunci Lc > 0. Demonstrat¸ie. Rationam prin reducere la absurd. Stim ca Lc ≥ 0 si pp ca ∃x 6= 0 a.i. Lcx = 0. Atunci din ecuatia gramianului rezulta succesiv ca B T Ker Lc = 0, Ker Lc este AT invariant, B T AT Ker Lc = 0, . . . B T (AT )k Ker Lc = 0, ∀k ≥ 0. De aici rezulta ca pentru orice x 6= 0, x ∈ Ker Lc, avem xT R = 0 ceea ce contrazice ipoteza ca rank R = n si deci ipoteza ca (A, B) este controlabila.


121

Controlabilitatea

Semnificatia Gramianului de Controlabilitate in Timp Infinit Presupunem A stabila, perechea (A, B) controlabila si deci Lc > 0. Atunci avem Λ(Lc) = {σ1, σ2, . . . , σn}, σi > 0, unde indexarea s-a facut in ordine descrescatoare (i = 1, . . . , n). Fie xi vectori proprii ce formeaza o baza ortonormata (xi ⊥ xj , kxi k = 1). Ne propunem sa calculam energia corespunzatoare comenzii ce duce originea in starea xi. Avem xi =

Z

∞

eA(t−τ ) Bui(τ )dτ = Lczi

0

unde

T AT τ

ui(τ ) = B e

T AT τ

zi = B e

L−1 c xi

T AT τ

=B e

1 xi . σi

Energia comenzii este 1 2 kui(τ )k2 = 2 σi

Z

0

∞

T Aτ T AT τ xi e BB e xidτ


1 T 1 T 1 = 2 xi Lcxi = 2 xi σixi = . σi σi σi 122

Controlabilitatea

Din aceasta expresie concluzionam ca gramianul de controlabilitate asimptotic masoara efortul energetic al sistemului pentru a transfera originea pe sfera unitate (cu cat Gramianul este mai mare – mai pozitiv – avem nevoie de o energie a comenzii mai mica). Valorile proprii ale gramianului pun in evidenta nivelele energetice ale sistemului si dau o procedura efectiva de reducere dimensionala. Subspatii controlabile Se introduc Rk :=

B

AB

k−1

... A

B

,

Rk := Im Rk ,

k ≥ 1,

numite matricea de controlabilitate respectiv subspatiul controlabil in k pasi (semnificatia numelui va deveni clara la studiul sistemelor cu timp discret). Rk poseda urmatoarele proprietati: a) Rk+1 = Im B + ARk = Rk + Ak Im B, unde Ro := {0}; b) Ro ⊂ R1 ⊂ . . . Rk ⊂ . . . adica subspatiile formeaza un lant crescator. In limbaj CAPITOLUL 3: PROPRIETATI STRUCTURALE

123

Controlabilitatea

matricial avem rank Ro ≤ rank R1 ≤ · · · ≤ Rk ≤ · · · . Din finitudinea dimensionala rezulta ca aceste incluziuni nu pot fi stricte decat pentru un numar finit de subspatii (maxim n) si exista un subspatiu Rν , pentru un ν suficient de mare, care le va contine pe toate celelalte. Sa observam ca daca ν este cel mai mic indice pentru care Rν+1 = Rν atunci Rν+1 = Rν+2 = . . . = R. Acest indice ν se numeste indice de controlabilitate iar Rν = R := Im R adica Rν este exact subspatiul controlabil (al perechii (A, B)); c) R este A–invariant si contine Im B. Intr–adevar, avem ca R = Im B + AR; d) R este cel mai mic subspatiu A–invariant care contine Im B. Intr–adevar, fie V un spatiu A–invariant care contine Im B. Aratam prin inductie ca Rk ⊂ V de unde concluzia ca R ⊂ V. Deoarece Im B ⊂ V rezulta ca R1 ⊂ V. Presupunem ca Rk ⊂ V si aratam ca Rk+1 ⊂ V. Intr–adevar, Rk+1 = Im B + ARk . Dar Im B ⊂ V si ARk ⊂ V (deoarece V este A–invariant si din ipoteza Rk ⊂ V) de unde concluzia. Cu alte cuvinte, subspatiul controlabil R este solutia infimala in subspatii a ecuatiei T = Im B + AT CAPITOLUL 3: PROPRIETATI STRUCTURALE

124

Controlabilitatea

in necunoscuta T . Mai precis, R = inf{T |T = AT + Im B} = inf{T |AT ⊂ T

si Im B ⊂ T }.

Recapitulare: Subspatii invariante, spectru restrans la un subspatiu, operatii cu subspatii, suma directa, completari ortogonale etc. Ce inseamna ca subspatiul V de dimensiune ρ este A–invariant ? Avem AV ⊂ V iar daca V = Im V , unde V este o n × ρ matrice baza pentru V atunci automat AV = V J unde J este o matrice patrata ρ × ρ cu Λ(J) ⊂ Λ(A). Facand o completare pana la o matrice nesingulara S = V W si notand T := S −1 obtinem b := T AT −1 = A


A1 A3 O A2

125

. Controlabilitatea

Ce inseamna ca subspatiul V de dimensiune ρ este A–invariant si contine Im B ? Repetand schimbarea de coordonate si aplicand-o corespunzator si lui B avem b := T AT −1 = A

A1 A3 O A2

b = TB = B

,

B1 O

deoarece Im B ⊂ V. Cu aceasta schimbare de coordonate, matricea de controlab B) b este bilitate corespunzatoare a perechii (A, b= R

B1 A1B1 O O

A21B1 O

··· ···

An−1 B1 1 O

}ρ

.

Daca spatiul A–invariant (ce contine si Im B) in raport cu care s-a facut descompunerea este chiar R, atunci perechea (A1, B1) este automat controlabila si avem b = ρ = ν (indicele de controlabilitate). ca rank R = rank R Teorema 42 (Teorema de Descompunere Controlabila). Un sistem dinamic oarecare descris de (A, B, C, D), A ∈ Rn×n, B ∈ Rn×m, C ∈ Rp×n, D ∈ Rp×m este CAPITOLUL 3: PROPRIETATI STRUCTURALE

126

Controlabilitatea

b B, b C, b D) avand structura intotdeauna echivalent pe stare cu un sistem (A, b = T AT −1 = A

b = TB = B

B1 O

}ν , }n − ν

}ν }n − ν

A1 A3 O A2 |{z} |{z} ν n−ν

b = CT −1 = C

(40)

,

C1 C2 , |{z} |{z} ν n−ν

(41)

in care perechea (A1, B1) este controlabila. Mai mult, sistemele (A, B, C, D), b B, b C, b D) si (A1, B1, C1, D) sunt echivalente intrare–iesire, i.e., (A, T (s) =

A B C D


=

"

b B b A b D C

#

=

127

A1 B1 C1 D

.

Controlabilitatea

Observatii: a) Teorema afirma in particular ca dandu-se un sistem dinamic putem intotdeauna gasi un alt sistem echivalent intrare–iesire care este controlabil (avand dimensiunea spatiului starilor mai mica sau egala cu cea a sistemului initial). b) Obtinerea descompunerii controlabile se bazeaza in mod esential pe matricea S = T −1 care se poate obtine facand o completare pana la o inversabila a oricarei baze V a subspatiului controlabil R = Im R (consecinte procedurale). c) Proprietatea de controlabilitate este invarianta in raport cu relatia de echivalenta pe stare. Mai precis, un sistem este controlabil daca si numai daca orice sistem echivalent pe stare este controlabil. Criteriul lui Popov–Belevitch–Hautus (PBH) Folosind teorema de descompunere controlabila se poate obtine un criteriu extrem de util pentru testarea controlabilitatii unei perechi (A, B). Teorema 43 (Criteriul lui Hautus). Perechea (A, B), A ∈ Rn×n, B ∈ Rn×m, este CAPITOLUL 3: PROPRIETATI STRUCTURALE

128

Controlabilitatea

controlabila daca si numai daca rank

sI − A B

∀s ∈ C.

= n,

(42)

Demonstrat¸ie. Necesitatea: Pp prin absurd ca (42) nu este satisfacuta. Atunci exista s0 ∈ C si un vector x0 6= 0, x0 ∈ Cn a.i. xT0 De aici rezulta imediat ca xT0 R

=

xT0

s0 I − A B

B

AB

= 0.

n−1

...A

B

=0

si deci perechea (A, B) nu este controlabila intrucat rank R < n. Suficienta: Pp din nou prin reducere la absurd ca (A, B) nu este controlabila CAPITOLUL 3: PROPRIETATI STRUCTURALE

129

Controlabilitatea

(ν < n). Atunci conform teoremei de descompunere controlabila exista un sistem echivalent pe stare avand perechea (A1, B1) controlabila. Avem succesiv rank

sI − A B

−1

T O = rank T sIn − A B O I sIν − A1 −A3 B = rank . O sIn−ν − A2 O

Rangul ultimei matrici este insa mai mic decat n pentru orice s ∈ Λ(A2) ceea ce contrazice (42). Observatii: a) Pentru a decide controlabilitatea unei perechi (A, B) este suficient sa testam criteriul lui Hautus pentru s ∈ Λ(A). Intr–adevar, pentru s ∈ C − Λ(A) avem automat rank (sI − A) = n si deci criteriul este indeplinit. b) Observatia de mai sus justifica introducerea de valoare proprie (sau mod) controlabila/necontrolabila: O valoare proprie a lui A s.n. controlabila (necontrolabila) daca satisface (nu satisface) criteriul lui Hautus. Din teorema de descompunere CAPITOLUL 3: PROPRIETATI STRUCTURALE

130

Controlabilitatea

controlabila rezulta imediat ca o valoare proprie λ a lui A este controlabila (necontrolabila) daca si numai daca λ ∈ Λ(A1) (λ ∈ Λ(A2)). c) Din demonstratia de mai sus rezulta ca daca doua sisteme (A, B, C, D) si e B, e C, e D) e sunt echivalente pe stare cu matricea de echivalenta T atunci matri(A, e satisfac cile de controlabilitate corespunzatoare R si R e = T R. R

“Controlabilitatea este o proprietate generica” Teorema 44. Fie Fn,m := {(A, B)|A ∈ Rn×n, B ∈ Rn×m} familia tuturor perechilor (A, B) cu n si m fixati. Submultimea M ⊂ F a perechilor necontrolabile formeaza o suprafata algebrica iar submultimea perechilor controlabile n2 +nm este densa in R . Cu alte cuvinte, controlabilitatea este o proprietate generica in F (o pereche (A, B) selectata la intamplare din F este controlabila sau, echivalent, probabilitatea de a selecta o pereche necontrolabila este nula). Nul Controlabilitate CAPITOLUL 3: PROPRIETATI STRUCTURALE

131

Controlabilitatea

Am vazut ca proprietatea de controlabilitate exprima esentialmente capacitatea de a aduce un sistem din origine intr-o stare arbitrara. Introducem acum conceptul de nul controlabilitate (cu consecinte interesante in special in cazul sistemelor cu timp discret). Definitia 45. O stare x ∈ Rn se numeste nul controlabila la momentul t fixat daca exista o comanda u(·) care transfera starea x0 = x in starea x(t) = 0 (in origine). Exercitii: a) Aratati ca o stare este controlabila daca si numai daca este nul controlabila. b) Perechi cu matricea B monica. (Explicitare)


132

Controlabilitatea

2. Observabilitatea Observabilitatea este o proprietate calitativa a sistemului x(t) ˙ = Ax(t) + Bu(t), x(0) = xo y(t) = Cx(t) + Du(t),

(43)

de a determina o stare din prelucrarea marimii masurate y. Pentru observabilitate este relevanta evolutia sistemului in regim liber, i.e., sub comenzi externe nule, x(t) ˙ = Ax, y = Cx,

x(0) = xo,

(44)

deci observabilitatea este o proprietate in caracterizarea careia intervine numai perechea de matrici (C, A) – observati ordinea in pereche – . Din (44) rezulta y(τ ) = CeAτ xo, CAPITOLUL 3: PROPRIETATI STRUCTURALE

τ ≥ 0. 133

(45) Observabilitatea

Stare/Sistem Observabil(a) Pentru studiul observabilitatii este mai simplu sa introducem notiunea de stare neobservabila in loc de cea de stare observabila. Definitia 46. O stare x ∈ Rn se numeste neobservabila la momentul t > 0 daca pentru x(0) = x regimul liber al iesirii y este identic zero pe intervalul [0, t], i.e., y(τ ) = 0, 0 ≤ τ ≤ t, cu y(τ ) furnizat de (45). Notiunea de stare observabila se obtine prin negarea definitiei de mai sus. Gramian de Observabilitate Pentrul studiul observabilitatii se introduce Gramianul de Observabilitate la momentul t > 0 definit de Lo(t) =

Z

t

T

eA τ C T CeAτ dτ.

(46)

0


134

Observabilitatea

Observatii: a) Lo(t) = Lo(t)T ; b) Lo(t) ≥ 0; c) Se poate obtine din nou o descompunere ortogonala a lui Rn in raport cu Ker Lo si Im Lo. Caracterizarea Observabilitatii prin Gramianul de Observabilitate Teorema 47. Fie t > 0 fixat (se poate si t ≥ 0). Starea x este neobservabila la momentul t > 0 daca si numai daca x ∈ Ker Lo(t). Mai mult, daca o stare este neobservabila la un t > 0 atunci este neobservabila la orice alt moment de timp T > 0. Demonstrat¸ie. Necesitatea: Presupunem ca x este neobservabila la momentul t > 0 adica y(τ ) = CeAτ x = 0, 0 ≤ τ ≤ t. De aici rezulta T

2

0 = y (t)y(t) = ky(t)k =

Z

t

T AT τ

x e

C T CeAτ xdτ = xT Lo(t)x,

(47)

0

de unde rezulta ca Lo(t)x = 0 sau inca x ∈ Ker Lo(t), q.e.d. CAPITOLUL 3: PROPRIETATI STRUCTURALE

135

Observabilitatea

Suficienta: Avem x ∈ Ker Lo(t) de unde rezulta xT Lo(t)x = 0 si folosind lantul de egalitati din (47) obtinem ky(τ )k2 = 0, 0 ≤ τ ≤ t. Sa observam in plus ca deoarece y(τ ) este analitica si nula pe un interval inchis nenul rezulta ca y(T ) = 0 pentru orice T > 0, q.e.d.

Din cele discutate mai sus am vazut ca (ne)observabilitatea unei stari nu depinde de momentul de timp. In continuare vom obtine o caracterizare a subspatiului starilor neobservabile pe baza matricii de observabilitate – notiune duala celei de matrice de controlabilitate.

Caracterizarea Observabilitatii prin Matricea de Observabilitate CAPITOLUL 3: PROPRIETATI STRUCTURALE

136

Observabilitatea

Introducem matricea de observabilitate asociata unui sistem dinamic : 

  Q :=   

C CA CA2 .. CAn−1

     

(48)

(sau mai precis unei perechi matriciale (C, A), C ∈ Rp×n, A ∈ Rn×n). Matricea de observabilitate are dimensiune (np) × n. Teorema 48. Fie t > 0 fixat. Atunci x ∈ Ker Lo(t) ⇔ x ∈ Ker Q =: Q, i.e., Ker Lo(t) = Q.

(49)

Demonstrat¸ie. Exercitiu (demonstratie similara celei date pentru Teorema 38). CAPITOLUL 3: PROPRIETATI STRUCTURALE

137

Observabilitatea

Observatii: a) Avem deci ca Ker Lo(t) = Ker Q,

∀t > 0.

b) O stare x ∈ Rn este observabila/neobservabila independent de momentul t > 0 – cu anumite precautii se poate lua t ≥ 0. Proprietatea este intrinseca starii x si perechii (C, A). c) Se poate introduce definitia echivalenta: o stare x s.n. neobservabila daca exista t > 0 pentru care x este neobservabila la acest moment. Introducem notiunea de sistem observabil (sau pereche (C, A) observabila) cu semnificatia ca fiecare stare x ∈ Rn, x 6= 0 este observabila. Avem atunci urmatorul rezultat central. Teorema 49. Fie perechea (C, A). 1. O stare x este neobservabila daca si numai daca x ∈ Q. 2. Perechea (C, A) (sau sistemul corespunzator) este observabila (observabil) daca si numai daca singura stare neobervabila este 0, i.e. Q = {0} (sau, echivalent, rank Q = n). CAPITOLUL 3: PROPRIETATI STRUCTURALE

138

Observabilitatea

Gramian de Observabilitate in Timp Infinit Daca matricea A este asimptotic stabila (Λ(A) ⊂ C−) atunci limt→∞ Lo(t) este finita, se noteaza cu Lo ∈ Rn×n = LTo ≥ 0 si este numita Gramian de Observabilitate asimptotic. El verifica automat ecuatia Lyapunov AT Lo + LoAT + C T C = 0 si are expresia Lo :=

Z

∞

AT τ

e

C T CeAτ dτ.

0

Observatii: a) Similar ca in cazul controlabilitatii, observabilitatea unui sistem se poate testa dpdv procedural verificand ca rank Q = n (matricea Q este monica – rang intreg pe coloane). b) Daca perechea (C, A) este observabila atunci automat Lo(t) > 0 si Lo > 0. Gramianul de observabilitate asimptotic se poate calcula ca solutia unica a ecuatiei Lyapunov respective. CAPITOLUL 3: PROPRIETATI STRUCTURALE

139

Observabilitatea

c) Daca x ∈ Rn arbitrara, atunci putem descompune unic x = xI + xK , unde xI ∈ Im Lo(t) si xK ∈ Ker Lo(t) (deoarece Rn := Im Lo(t) ⊕ Ker Lo(t)). Atunci y(t) = CeAtx = CeAtxI + CeAtxK = CeAtxI . Deci cu exceptia sistemelor din Ker Lo(t), toate celelalte “se vad” la iesire. Subspatii neobservabile Se introduc 



C  CA  , Qk :=   ..  CAk−1

Nk := Ker Qk ,

k ≥ 1,

numite matricea de observabilitate respectiv subspatiul neobservabil in k pasi. Nk poseda urmatoarele proprietati: CAPITOLUL 3: PROPRIETATI STRUCTURALE

140

Observabilitatea

a) Nk = ∩ki=1Ker CAi−1 = ∩ki=1A−i+1Ker C (A−1 semnifica aici preimaginea si nu inversa !); b) Nk+1 = Ker C ∩ A−1Nk ; c) . . . ⊂ N2 ⊂ N1 ⊂ N0 := Rn adica subspatiile neobservabile Nk formeaza un lant descrescator. De aici rezulta ca exista un intreg µ, n ≥ µ ≥ 0, a.i. . . . Nµ+2 = Nµ+1 = Nµ 6= Nµ−1 6= . . . 6= N1 6= N0 sau pe scurt lim Nk = Nµ = Nn.

k→∞

Intregul µ se numeste indice de observabilitate iar Nµ = Nn se numeste subspatiul neobservabil a perechii (C, A). Avem ca N = Ker Q. CAPITOLUL 3: PROPRIETATI STRUCTURALE

141

Observabilitatea

In limbaj matricial obtinem 0 < rank Q1 < rank Q2 < rank Qµ = rank Qµ+1 = . . . . d) Din cele de mai sus obtinem ca N = Ker C ∩ A−1N sau inca AN ⊂ N , N ⊂ Ker C adica N este un subspatiu A–invariant continut in Ker C. Mai mult, se poate arata (exercitiu) ca N este cel mai mare subspatiu A–invariant continut in Ker C. Deasemenea, considerand ecuatia T = Ker C ∩ A−1T in necunoscuta T rezulta ca N este solutia sa supremala. CAPITOLUL 3: PROPRIETATI STRUCTURALE

142

Observabilitatea

Principiul Dualitatii Principiul dualitatii este un principiu fundamental in teoria sistemelor dinamice, aratand in ce conditii anumite proprietati structurale sunt echivalente. Teorema 50 (Principiul dualitatii). Subspatiul controlabil in k pasi al perechii (A, B) este complementul ortogonal al subspatiului neobervabil in k pasi al perechii (B T , AT ), i.e. Rk (A, B) = Nk (B T , AT )⊥. In particular, perechea (A, B) este controlabila daca si numai daca perechea (B T , AT ) este observabila. Pe baza principiului dualitatii se pot formula dualele tuturor rezultatelor obtinute in cazul controlabilitatii. Teorema 51 (Criteriul PBH). Perechea (C, A), C ∈ Rp×n, A ∈ Rn×n , este CAPITOLUL 3: PROPRIETATI STRUCTURALE

143

Observabilitatea

observabila daca si numai daca rank

sI − A C

∀s ∈ C.

= n,

(50)

Prin dualitate se introduc notiunile de valoare proprie (sau mod) observabil/neobservabil. Dam in continuare teorema de descompunere observabila in doua forme complet echivalente. Teorema 52 (Teorema de Descompunere Observabila). Un sistem dinamic oarecare descris de (A, B, C, D), A ∈ Rn×n, B ∈ Rn×m, C ∈ Rp×n, D ∈ Rp×m este b B, b C, b D) avand structura intotdeauna echivalent pe stare cu un sistem (A, b = T AT −1 = A


A1 A3 O A2 |{z} |{z} n−µ µ

}n − µ }µ

144

,

Observabilitatea

b = TB = B

B1 B2

}n − µ , }µ

b = CT −1 = C

O C2 , |{z} |{z} n−µ µ in care perechea (C2, A2) este observabila. Mai mult, sistemele (A, B, C, D), b B, b C, b D) si (A2, B2, C2, D) sunt echivalente intrare–iesire, i.e., (A, T (s) =

A B C D

=

"

b B b A b D C

#

=

A2 B2 C2 D

.

Teorema 53 (Teorema de Descompunere Observabila – varianta). Un sistem dinamic oarecare descris de (A, B, C, D), A ∈ Rn×n, B ∈ Rn×m, C ∈ Rp×n, b B, b C, b D) avand D ∈ Rp×m este intotdeauna echivalent pe stare cu un sistem (A, structura }µ b = T AT −1 = A1 O A A3 A2 }n − µ , |{z} |{z} µ n−µ CAPITOLUL 3: PROPRIETATI STRUCTURALE

145

Observabilitatea

b = TB = B

B1 B2

}µ , }n − µ

b = CT −1 = C

C1 O , |{z} |{z} µ n−µ

in care perechea (C1, A1) este observabila. Mai mult, sistemele (A, B, C, D), b B, b C, b D) si (A1, B1, C1, D) sunt echivalente intrare–iesire, i.e., (A, T (s) =

A B C D


=

"

b b B A b D C

#

=

146

A1 B1 C1 D

.

Observabilitatea

3. Teorema de Descompunere Structurala

Avem intai nevoie de reamintirea catorva rezultate de algebra matriciala: • Ecuatie Sylvester; • Subspatiu A–invariant si consecinte. Consideram un sistem definit de (A, B, C, D). Fie R subspatiul controlabil al perechii (A, B) si N subspatiul neobservabil al perechii (C, A). Fie X1 := R ∩ N

(51)

si introducem subspatiile X2 si X3 ca fiind complementii lui X1 in R si respectiv N , i.e., R = X1 ⊕ X2 , (52) N = X1 ⊕ X3 . CAPITOLUL 3: PROPRIETATI STRUCTURALE

(53) 147

Teorema de descompunere structurala

Fie deasemenea X4 complementul lui R ∪ N in Rn, i.e., Rn = (R ∪ N ) ⊕ X4 = X1 ⊕ X2 ⊕ X3 ⊕ X4

(54)

Subspatiile X2, X3 si X4 nu sunt unic definite. Deoarece AR ⊂ R,

Im B ⊂ R

(55)

AN ⊂ N ,

N ⊂ Ker C

(56)

AX1 ⊂ X1,

X1 ⊂ Ker C.

(57)

rezulta ca Fie Xi matrici baza pentru subspatiile Xi (i=1...4), Xi =< Xi > si T := CAPITOLUL 3: PROPRIETATI STRUCTURALE

X1 X2 X3 X4

−1

148

.

(58) Teorema de descompunere structurala

Atunci sistemul echivalent pe stare fata de transformarea (57) are forma 

A11  O −1 b A = T AT =   O O b = CT −1 = O C2 C

A12 A13 A22 O O A33 O O O C4 ,





A14 A24  , A34  A44



B1  B2  b  B = TB =   O  O

(59)

structura ce rezulta din (51)-(58). Din teorema de descompunere controlabila rezulta ca perechea A11 A12 B1 , (60) O A22 B2

este controlabila iar din teorema de descompunere observabila rezulta ca perechea


C2 C4

,

A22 A24 O A44 149

(61) Teorema de descompunere structurala

este observabila. Aplicand criteriul PBH pentru perechea (60) rezulta rank

sI − A11 −A12 B1 O sI − A22 B2

= dim X1 + dim X2,

∀s ∈ C

de unde rezulta automat ca rank

sI − A2 B2

= dim X2,

∀s ∈ C

deci perechea (A22, B2) este controlabila. Aplicand criteriul PBH dual perechii (61) rezulta similar ca perechea (C2, A22) este observabila. In consecinta rezulta ca (sub)sistemul (A22, B2, C2, D) este controlabil si observabil (se mai numeste partea controlabila si observabila a sistemului initial) si inca

T (s) =

A B C D


=

"

b B b A b D C

#

=

150

A22 B2 C2 D

.


Sintetizand cele de mai sus obtinem urmatorul rezultat remarcabil. Teorema 54 (Teorema de descompunere structurala). Orice sistem arbitrar b B, b C, b D) cu structura (59) (A, B, C, D) este echivalent pe stare cu un sistem (A, (unde unele blocuri pot avea dimensiune nula !) si echivalent intrare–iesire cu sistemul controlabil si observabil (A22, B2, C2, D).


151


4. Realizabilitate Am vazut ca orice sistem dinamic descris de ecuatii de tipul x(t) ˙ = Ax(t) + Bu(t), x(to) = xo y(t) = Cx(t) + Du(t)

(62)

este automat invariant in timp, liniar, cauzal, finit dimensional. In particular, sistemul dinamic este un sistem de convolutie avand matrice de transfer data de T (s) = C(sI − A)−1B + D. Matricea de transfer descrie comportarea intrare–iesire in conditii initiale nule si este o matrice avand drept elemente functii rationale proprii. Problema naturala: Stiind ca matricea de transfer a unui sistem MIMO este rationala si proprie exista o descriere dinamica a sistemului de tipul (62) ? Mai CAPITOLUL 3: PROPRIETATI STRUCTURALE

152

Realizabilitate

precis, stiind ca T (s) este o matrice rationala proprie de dimensiune p × m exista intotdeauna patru matrici (A, B, C, D), unde A ∈ Rn×n, B ∈ Rn×m, C ∈ Rp×n, D ∈ Rp×m a.i. sistemul dinamic corespunzator (62) sa aibe matricea de transfer T (s), i.e., T (s) = C(sI − A)−1 B + D? Atunci cand exista, cele patru matrici (A, B, C, D) se numesc o realizare a rationalei T (s) (sau a sistemului avand ca matrice de transfer pe T (s)). INTREBARI NATURALE: • • • • • ! • •

Exista intotdeauna o realizare si daca da cum se poate obtine ? DA! Este realizarea unica ? NU ! Exista o realizare de dimensiune minima (maxima) ? DA (NU) ! Cum se pot caracteriza realizarile minimale ? Controlabile + observabile! Cum se pot obtine realizarile minimale ? Teorema de Descompunere Structurala Sunt realizarile minimale unice ? NU ! Ce relatie exista intre doua realizari minimale ? Sunt echivalente pe stare !


153

Realizabilitate

Problema existentei

Fie T (s) o p × m matrice rationala proprie data de

T (s) =

rij (s) pij (s)

1≤i≤p 1≤j≤m

,

grad(pij ) ≥ grad(rij ),

∀i, j,

in care rapoartele se considera ireductibile. Deoarece rationala este proprie avem ca D := T (∞) ∈ Rp×m (finit). Problema realizabilitatii rationalei proprii T (s) se reduce atunci la problema realizabilitatii rationalei strict proprii Te(s) = T (s) − D, i.e., trebuie sa gasim trei matrici (A, B, C) a.i.


Te(s) = C(sI − A)−1B. 154

Realizabilitate

Deoarece Te(s) este strict proprie avem

k−1 + K s + . . . + K s K 0 1 k−1 Te(s) = γ0 + γ1s + . . . + γk−1sk−1 + sk

(63)

unde γ(s) := γ0 + γ1s + . . . + γk−1sk−1 + sk este cel mai mic multiplu comun (monic) al numitorilor tuturor elementelor rationalei Te(s) iar Ki, i = 0, . . . , k − 1, sunt p × m matrici constante. O realizare a lui Te(s) este data de 

 A= 

Om

Im

... Im

−γ0Im −γ1Im . . . −γk−1Im








Om   ..  ,B =   , C = K0 K1 . . . Kk−   Om  Im (64) 155

Realizabilitate

Intr–adevar, cu





Im  sIm   Θ(s) :=   ..  sk−1Im

se verifica direct ca

(sI − A)Θ(s) = Bγ(s) sau inca

Θ(s) = (sI − A)−1B. γ(s)

(65)

Cum CΘ(s) = K0 + K1s + . . . + Kk−1sk−1 inmultind (65) la stanga cu C si tinand cont de (63) obtinem Te(s) = C(sI − A)−1 B. Realizarea (A, B, C, D) astfel obtinuta este controlabila si de aceea se mai numeste realizarea standard controlabila a lui T (s). Controlabilitatea perechii (A, B) se poate testa imediat cu criteriul PBH. In general, realizarea obtinuta nu CAPITOLUL 3: PROPRIETATI STRUCTURALE

156

Realizabilitate

este insa observabila (poate fi!). O realizare standard observabila este data de 







−γ0Ip K0  K1  −γ1Ip     .. .. ... ,B =   , C = Op Op . . . Ip . Ip −γk−1Ip Kk−1 (66) Aceasta realizare nu este in general controlabila. Om  Ip A= 

Observatie: Pentru matrici de transfer rationale de dimensiuni arbitrare nu exista in general posibilitatea sa scriem direct o realizare care sa fie simultan controlabila si observabila. Coeficienti Markov si Matrici Hankel Studiem acum relatiile care exista intre doua realizari ale unei matrici rationale proprii. In primul rand este clar ca cele doua matrici ”D” sunt egale. Dezvoltand Te(s) in serie Laurent in jurul punctului s = ∞ obtinem pentru ksk > r, unde r CAPITOLUL 3: PROPRIETATI STRUCTURALE

157

Realizabilitate

este ales suficient de mare, Te(s) = Γ1s−1 + Γ2s−2 + . . . .

(67)

Identificand coeficientii din (67) cu ajutorul lui (63) obtinem Kk−1 Kk−2 ... K0 0

= = ... = =

Γ1 Γ2 + γk−1Γ1 ... Γk + γk−1 Γk−1 + . . . + γ1Γ1 Γk+i + γk−1 Γk−1+i + . . . + γ0Γi,

i ≥ 1.

Coeficientii matriceali Γi ∈ Rp×m, i ≥ 1, s.n. coeficientii Markov ai matricei rationale T (s). Daca (A, B, C, D) este o realizare a lui T (s) atunci avem C(sI − A)−1B + D = D + CBs−1 + CABs−2 + CA2Bs−3 + . . . , CAPITOLUL 3: PROPRIETATI STRUCTURALE

158

(68) Realizabilitate

pentru ksk > rA, unde rA este raza spectrala a matricei A. Coeficientii D si CAi−1 B, i ≥ 1, se numesc coeficientii Markov ai sistemului (realizarii) (A, B, C, D). Identificand coeficientii in (67) si (68) obtinem Γo := D,

Γi = CAi−1B,

∀i ≥ 1.

(69)

Deci toate realizarile lui T (s) au aceeasi coeficienti Markov, identici cu cei ai lui T (s). Introducem matricile de tip Hankel 





Γ1 Γ2 . . . Γj CB  Γ2 Γ3 . . . Γj+1   CAB = Hij =  ..  ..   Γi Γi+1 . . . Γj+i−1 CAi−1 B CAPITOLUL 3: PROPRIETATI STRUCTURALE

159

CAB CA2B CAiB

... ...

j−1



CA B CAj B    . . . CAj+i−2B (70) Realizabilitate





C   CA i−1   = (71) ..  B AB . . . A B = QiRj i ≥ 1, j ≥ 1, CAi−1B unde Rj este matricea de controlabilitate in j pasi si Qi este matricea de observabilitate in i pasi. Din aceasta relatie rezulta ca pentru orice doua realizari e B, e C, e D) ale aceluiasi T (s) avem (A, B, C, D) si (A, e iR ej , QiRj = Q

∀i ≥ 1, j ≥ 1.

(72)

Observatie: Matricile Hankel cu toate ca au dimensiuni arbitrar de mari au totusi rangul marginit de n. Acest lucru rezulta din ultima egalitate din (71). Realizari minimale Definitia 55. O realizare (A, B, C, D) a rationalei proprii T (s) se numeste minimala daca orice alta realizare are dimensiunea spatiului starilor mai mare sau egala cu aceasta. CAPITOLUL 3: PROPRIETATI STRUCTURALE

160

Realizabilitate

Teorema 56. O realizare este minimala daca si numai daca este controlabila si observabila. Demonstrat¸ie. Conditia este necesara. P.p. prin reducere la absurd ca realizarea minimala (A, B, C, D) de dimensiune n nu este controlabila si/sau observabila. Atunci printr–o transformare de echivalenta aducem sistemul la forma din teorema de descompunere structurala si rezulta ca realizarea (A22, B2, C2, D) are dimensiune strict mai mica ceea ce contrazice ipoteza de minimalitate a realizarii originale. Conditia este suficienta. Presupunem ca realizarea (A, B, C, D) de dimensiune n este controlabila si observabila. Atunci rank Rn = rank Qn = n rezultand in continuare ca rank QnRn = rank Rn − dim(Im Rn ∩ Ker Qn) = n. CAPITOLUL 3: PROPRIETATI STRUCTURALE

161


P.p. prin absurd ca (A, B, C, D) nu este minimala. Atunci exista o realizare e B, e C, e D) de dimensiune n (A, e cu Din (72) rezulta ca

n e < n.

e nR en = rank QnRn rank Q en ≤ n en ≤ n ceea ce este absurd intrucat rank Q e si rank R e.

Teorema 57. Oricare doua realizari minimale ale unei matrici de transfer proprii T (s) sunt echivalente pe stare. e B, e C, e D) doua realizari minimale ale lui Demonstrat¸ie. Fie (A, B, C, D) si (A, T (s). Conform teoremei precedente, ambele realizari au aceeasi dimensiune n si sunt controlabile si observabile. Din (71) avem


en+1 e nR QnRn+1 = Q

162


sau inca Qn

B

ARn

en =Q

h

e B

e e nB, QnB = Q

eR en A

i

de unde rezulta

eR en . e nA QnARn = Q

(75)

e Tn Q e n este nesingulara si din prima relatie din e n este monica atunci Q Deoarece Q (75) rezulta e = TB B (76) unde

eT Q e n)−1Q e T Qn ∈ Rn×n. T := (Q n n

en este epica rezulta ca R en R enT este nesingulara si din a doua Similar, deoarece R egalitate din (75) rezulta ca e = T AS A (77) unde

enT (R enT )−1 ∈ Rn×n. en R S = Rn R


163

Realizabilitate

Din (74) rezulta ca 





C  CA  Rn AnB =   ..

eR en sau inca de unde CRn = C



e C h i  en A enB e eA e  R C ..

e = CS. C (78) Din (76), (77) si (78) rezulta ca cele doua realizari sunt echivalente pe stare daca aratam ca S = T −1. Intr–adevar, e Tn Q e n)−1Q e Tn QnRnR enT (R enR enT )−1 = (Q e Tn Q e n)−1 Q e Tn Q e nR enR enT (R enR enT )−1 = I. T S = (Q Teorema 58. Fie µ si ν cei mai mici intregi pentru care rank Hµ,ν = rank Hµ+i,ν+j . Atunci ν = µ = n, unde n este dimensiunea realizarii minimale. CAPITOLUL 3: PROPRIETATI STRUCTURALE

164

Realizabilitate

Demonstrat¸ie. Rezulta automat din (71). Observatie: Pentru orice sistem descris de matrice de transfer rationala proprie T (s) putem calcula coeficientii Markov (unici) Γi pe baza descompunerii (67). Mai mult, daca stim o realizare (A, B, C, D) a sistemului dinamic cu matricea de transfer T (s), atunci coeficientii Markov se pot calcula pe baza expresiilor explicite (69). Mai mult, coeficientii Markov determina unic sirul dublu indexat de matrici Hankel Hij care au rang finit egal cu n, pentru i, j ≥ n, unde n este dimensiunea unei realizari minimale. Problema inversa (fundamentala): Presupunand acum ca avem un sir de coeficienti Markov Γi ∈ Rp×m, i ≥ 0, se pune problema fireasca daca exista intotdeauna un sistem dinamic care are acesti coeficienti Markov ? Mai exact, seria din membrul drept din (67) converge intotdeauna la o rationala proprie ce este matricea de transfer a unui sistem (A, B, C, D) ? Sau, echivalent, exista intotdeauna matricile (A, B, C, D) de dimensiuni potrivite a.i. sa aibe loc relatiile (69) ? Raspuns: NU (in general)! Rezultatul urmator da un raspuns complet acestei CAPITOLUL 3: PROPRIETATI STRUCTURALE

165

Realizabilitate

probleme. Teorema 59. Fie un sir de matrici reale Γi ∈ Rp×m, i ≥ 0, pentru care exista j ≥ 1 a.i. Γj 6= 0. Atunci exista o p × m matrice rationala proprie T (s) ai carei coeficienti Markov sunt exact elementele sirului Γi daca si numai daca exista un intreg n ≥ 1 a.i. n = rank Hn+i,n+j ,

∀i, j ≥ 0.

(79)

In cazul in care (79) are loc, intregul n ≥ 1 se numeste gradul McMillan al rationalei T (s). Observatie (fundamentala): Gradul McMillan al unei rationale proprii T (s) coincide cu dimensiunea unei realizari minimale. Corolarul 60. Functia f : N → Rp×m cu f (i) = Γi, i ≥ 0, este z–transformabila (are transformata z) si transformata z este o matrice rationala proprie daca si numai daca este indeplinita conditia (79).


166

Realizabilitate

Procedura de obtinere a unei realizari minimale pentru o matrice rationala proprie

T (s) =

rij (s) pij (s)

1≤i≤p 1≤j≤m

,

grad(pij ) ≥ grad(rij ),

∀i, j.

Pasul 0: Se pune D := T (∞) si se aduce matricea rationala (strict proprie) Te(s) := T (s) − D la forma k−1 + K s + . . . + K s K 0 1 k−1 Te(s) = γ0 + γ1s + . . . + γk−1sk−1 + sk

(80)

unde γ(s) := γ0 + γ1s + . . . + γk−1sk−1 + sk este cel mai mic multiplu comun (monic) al numitorilor tuturor elementelor rationalei Te(s) iar Ki, i = 0, . . . , k − 1, sunt p × m matrici constante. CAPITOLUL 3: PROPRIETATI STRUCTURALE

167

Realizabilitate

Pasul 1: Se scrie realizarea standard controlabila 

Om

Im







Om ...    ..      A=  , B =  Om  , C = K0 K1 . . . Kk− Im −γ0Im −γ1Im . . . −γk−1Im Im (81) in care perechea (A, B) este automat controlabila. Pasul 2: Se aplica teorema de descompunere observabila perechii (C, A) si se obtine }n − µ b = T AT −1 = A1 A3 A O A2 }µ , |{z} |{z} B1 }n − µ n − µ b µ −1 b B = TB = , C = CT = O C2 , B2 }µ |{z} |{z} n−µ µ in care perechea (C2, A2) este observabila. CAPITOLUL 3: PROPRIETATI STRUCTURALE

168

Realizabilitate

Pasul 3: Deoarece perechea (A, B) este controlabila, rezulta automat ca b B) b si (A2, B2) sunt deasemenea controlabile. Prin urmare sistemul perechile (A, (A2, B2, C2, D) care este echivalent intrare–iesire cu sistemul original (A, B, C, D) este controlabil, observabil si deci minimal. Prin urmare (A2, B2, C2, D) este o realizare minimala pentru T (s) si T (s) = C2(sI − A2)−1B2 + D. Observatii: a) Din punct de vedere procedural, algoritmul de calcul al realizarii minimale urmeaza exact pasii de mai sus cu observatia ca transformarea T de la pasul 2 se alege intotdeauna ortogonala T −1 = T T . b) Pentru obtinerea unei realizari minimale se poate proceda dual, calculand la Pasul 1 o realizare standard observabila (66) si facand la Pasul 2 o descompunere controlabila (40)–(41).


169

Realizabilitate

5. Conexiunile Sistemelor Dinamice pe Stare si Operatii cu Sisteme

Consideram cateva posibile conexiuni standard ale sistemelor dinamice descrise prin intermediul realizarilor de stare si ne punem problema sa gasim o realizare de stare pentru sistemul echivalent rezultant. In particular, vom considera urmatoarele tipuri de conexiuni: serie, paralel, bucla cu reactie inversa, transformare liniar fractionara si produs Redheffer. Intocmai ca in cazul sistemelor cu o intrare si o iesire (SISO) anumite conexiuni pot sa nu fie definite (in sens general sau in sens strict) – cu semnificatia ca sistemul rezultant nu are matrice de transfer (vectorul marimilor de iesire nu este unic definit pentru un vector dat de marimi de intrare) sau matricea de transfer rezultanta nu este proprie (sistemul rezultant nu are o realizare standard de stare). Prin urmare vom spune ca o anumita conexiune a doua sisteme pe stare este bine definita daca sistemul rezultant este deasemenea un sistem pe spatiul starilor. CAPITOLUL 3: PROPRIETATI STRUCTURALE

170

Conexiuni si operatii

Buna definire a conexiunii implica deci ca sistemul rezultant are o matrice de transfer rationala care este proprie. Ca un exemplu relevant pentru discutia de mai sus sa consideram inversul unui sistem (A, B, C, D) – sistemul care are intrarile si iesirile inversate. Inversul exista daca si numai daca matricea D este inversabila iar o realizare a inversului este data x˙ I (t) = (A − BD −1C)xI (t) + BD −1uI (t), + D −1uI (t), yI (t) = −D −1CxI (t)

(82)

(uI (t) = y(t), yI (t) = u(t)) iar matricea de transfer este T −1(s) =

AI CI

BI DI

=

−1

A − BD C −D −1C

−1

BD D −1

.

(83)

Observatii: • Un sistem este inversabil daca si numai daca are acelasi numar de intrari si iesiri (p = m). • Ipoteza de inversabilitatea a lui D nu este necesara pentru existenta inversei CAPITOLUL 3: PROPRIETATI STRUCTURALE

171


matricii de transfer T (vazuta ca matrice rationala) si este facuta doar pentru a asigura ca T −1(s) este proprie si deci este matricea de transfer a unui sistem pe spatiul starilor (AI , BI , CI , DI ). • Daca sistemul original este controlabil/observabil/minimal atunci realizarea inversului (83) este automat controlabila/observabila/minimala. – Exercitiu! Conexiunea paralel Fie doua sisteme

x˙ 1 (t) = A1x1 (t) + B1u1(t), y1 (t) = C1x1 (t) + D1u1(t),

(84)

si

x˙ 2 (t) = A2x2 (t) + B2u2(t), y2 (t) = C2x2 (t) + D2u2(t), avand matricile de transfer T1 =

A1 B1 C1 D1


,

T2 =

A2 B2 C2 D2 172

(85)

,

(86) Conexiuni si operatii

respectiv. Daca cele doua sisteme au acelasi numar de intrari si iesiri (m1 = m2, p1 = p2), atunci se defineste conexiunea paralel a lui T1 cu T2 ca fiind sistemul care are intrarea u obtinuta punand u1 ≡ u2 = u si iesirea y := y1 + y2. Conexiunea paralel este intotdeauna bine definita, matricea de transfer a sistemului rezultant este T (s) := T1(s) + T2(s), (87) avand o realizare data de 



A1 O B1 . B2 T (s) =  O A2 C1 C2 D1 + D2

(88)

Conexiunea serie Fie doua sisteme (84) si (85), avand matricile de transfer date in (86). Daca numarul de iesiri ale sistemului T1 este egal cu numarul de intrari ale sistemului CAPITOLUL 3: PROPRIETATI STRUCTURALE

173


T2 atunci se defineste conexiunea serie a lui T1 cu T2 (in aceasta ordine) ca fiind sistemul cu intrarea u := u1 si iesirea y := y2, obtinut punand u2 ≡ y1. Conexiunea serie este intotdeauna bine definita, matricea de transfer a sistemului rezultant este T (s) := T2(s)T1(s), (89) (observati ordinea !) iar o realizare pentru sistemul rezultant este data de 



A2 B2C1 B2D1 A1 B1  . T (s) =  O C2 D2C1 D2D1

(90)

Conexiunea in reactie inversa Fie doua sisteme (84) si (85), avand matricile de transfer date in (86). Daca numarul de iesiri ale sistemului T1 este egal cu numarul de intrari ale sistemului T2 si numarul de iesiri ale sistemului T2 este egal cu numarul de intrari ale sistemului CAPITOLUL 3: PROPRIETATI STRUCTURALE

174


T1 (p1 = m2, p2 = m1) atunci se defineste conexiunea in reactie inversa a lui T1 cu T2 (in aceasta ordine) ca fiind sistemul cu intrarea u si iesirea y := y1 , obtinut punand u1 ≡ u + y2 si u2 ≡ y1. Conexiunea in reactie inversa este intotdeauna bine definita daca si numai daca matricea I D1 (91) D2 I este nesingulara. In acest caz functia de transfer a sistemului echivalent este T (s) := T1(s)(I − T2(s)T1(s))−1, iar o realizare pentru sistemul rezultant este  A1 + B1D2Sb−1C1 B1S −1C2 B1S −1  −1 −1 b−1C1 S B A + B D S C B D S  2 2 2 1 2 2 1 T (s) =  Sb−1C1 Sb−1D1C2 D1S −1 CAPITOLUL 3: PROPRIETATI STRUCTURALE

175

(92)



 , 

(93)


unde Sb := I − D1D2 si S := I − D2D1 care sunt ambele inversabile din ipoteza de nesingularitate a matricii (91). Exercitiu: Ce se poate spune despre controlabilitatea/observabilitatea/minimalitatea sistemului echivalent paralel/serie/reactie inversa daca stim ca sistemele componente sunt controlabile/observabile/minimale ? Observatie: Pentru conexiunile paralel/serie/reactie inversa nu este necesar ca spatiul starilor sistemelor componente sa fie de dimensiune egala. Transformare liniar fractionara (TLF) Aceste conexiuni pot fi privite ca o extensie la clasa sistemelor (sau mai precis la clasa functiilor matriceale rationale) a transformari liniar fractionare (sau Moebius) din cazul scalar a + bλ f (λ) = , c + dλ unde a, b, c, d sunt scalari. CAPITOLUL 3: PROPRIETATI STRUCTURALE

176


Fie doua sisteme date de x˙ = Ax + B1u1 + B2u2, y1 = C1x + D11u1 + D12u2, y2 = C2x + D21u1 + D22u2,

(94)

x˙ c = Acxc + Bcuc, yc = Ccxc + Dcuc,

(95)

si avand matricile de transfer T (s) =

T11(s) T12(s) T21(s) T22(s)

si Tc(s) = CAPITOLUL 3: PROPRIETATI STRUCTURALE





A B1 B2 =  C1 D11 D12  C2 D21 D22

Ac Bc Cc Dc

.

177

(96)


Un sistem de tipul (96) se numeste sistem generalizat si are intrarile si iesirile partitionate in doua clase avand anumite semnificatii in controlul automat. Daca T22 are numarul de intrari/iesiri egal cu numarul de iesiri/intrari ale lui Tc (mc = p2, pc = m2) atunci de defineste transformarea liniar fractionara inferioara (TLFI) a lui T cu Tc (in aceasta ordine) ca fiind sistemul cu intrarea u := u1 si iesirea y := y1 obtinut punand u2 ≡ yc si uc ≡ y2. Conexiunea este bine definita daca si numai daca matricea

I D22 Dc I

(98)

este inversabila si in acest caz matricea de transfer a sistemului rezultant echivalent este TR = T LF I(T, Tc) := T11 + T12Tc(I − T22Tc)−1T21, CAPITOLUL 3: PROPRIETATI STRUCTURALE

178


si are o realizare data de 

e−1

e−1

e−1



A + B2S DcC2 B2S Cc B1 + B2S DcD21   −1 −1 −1 B S C A + B S D C B S D  , c 2 c c 22 c c 21 TR(s) =   C1 + D12DcS −1C2 D12Se−1Cc D11 + D12DcS −1D21 (100) unde S := I − D22Dc si Se := I − DK D22 care sunt ambele inversabile din ipoteza de inversabilitate asupra matricii (98). In particular avem DcS −1 = Se−1Dc si S −1D22 = D22Se−1 asa cum rezulta din identitatea matriciala U (I − V U )−1 = (I − U V )−1 U care are loc pentru oricare matrici U si V de dimensiuni compatibile. Consideram din nou doua sisteme (94) si (95) avand matricile de transfer (96) si (97). Daca T11 are numarul de intrari/iesiri egal cu numarul de iesiri/intrari ale lui Tc (mc = p1, pc = m1) atunci se defineste transformarea liniar fractionara superioara (TLFS) a lui T cu Tc (in aceasta ordine) ca fiind sistemul cu intrarea u := u2 si iesirea y := y2 obtinut punand u1 ≡ yc si uc ≡ y1. Conexiunea este CAPITOLUL 3: PROPRIETATI STRUCTURALE

179


bine definita daca si numai daca matricea I D11 Dc I

(101)

este inversabila si in acest caz matricea de transfer a sistemului rezultant echivalent este TR = T LF S(T, Tc) := T22 + T21Tc(I − T11Tc)−1T12, (102) si are o realizare data de   e −1DcC1 e −1Cc e −1DcD12 B1 U B2 + B1 U A + B1 U   −1 −1 −1 B U C A + B U D C B U D ,  c 1 c c 11 c c 12 TR =   e −1Cc C2 + D21DcU −1C1 D21U D22 + D21DcU −1D12 (103) e := I − DcD11 care sunt ambele inversabile unde am notat U := I − D11Dc si U e −1Dc intrucat matricea (101) este inversabila. Avem deasemenea ca DcU −1 = U e −1. si U −1D11 = D11U CAPITOLUL 3: PROPRIETATI STRUCTURALE

180


Produs Redheffer Aceasta conexiune este o extensie a transformarii liniar fractionare. Consideram doua sisteme generalizate (94) si Acxc + Bc1uc1 + Bc2uc2, x˙ c = yc1 = Cc1 xc + Dc11uc1 + Dc12uc2, yc2 = Cc2 xc + Dc21uc1 + Dc22uc2,

(104)

avand matricile de transfer date de (96) si respectiv

Tc =

Tc11 Tc12 Tc21 Tc22





Ac Bc1 Bc2 =  Cc1 Dc11 Dc12  . Cc2 Dc21 Dc22

(105)

Daca T22 are numarul de intrari/iesiri egal cu numarul de iesiri/intrari ale lui Tc11 (mc1 = p2, pc1 = m2) atunci se defineste produsul Redheffer al lui T cu Tc (in CAPITOLUL 3: PROPRIETATI STRUCTURALE

181


u1 y1 si iesirea y := uc2 yc2 si uc1 ≡ y2. Conexiunea este bine definita daca si numai

aceasta ordine) ca fiind sistemul cu intrarea u :=

obtinut punand u2 ≡ yc1 I D22 daca este inversabila. In acest caz obtinem sistemul generalizat Dc11 I

TR

=

T ⊗ Tc :=

−1

−1

T11 + T12Tc11(I − Tc22Tc11) T21 T12(I − Tc11T22) Tc12 Tc21(I − T22Tc11)−1T21 Tc22 + Tc21T22(I − Tc11T22)−1Tc12 (106)


182


avand o realizare data de 

A + B2Se−1Dc11C2 B2Se−1Cc1 B1 + B2Se−1Dc11D21  Bc1S −1C2 Ac + Bc1S −1D22Cc1 Bc1S −1D21  TR =    C1 + D12Dc11S −1C2 D12Se−1Cc1 D11 + D12Dc11S −1D21 Dc21S −1C2 Cc2 + Dc21S −1D22Cc1 Dc21S −1D21  B2Se−1Dc12 Bc2 + Bc1S −1D22Dc12     −1 e  D12S Dc12 Dc22 + Dc21S −1D22Dc12 (107) unde s–a notat S := I −D22Dc11 si Se := I −Dc11D22 care sunt ambele inversabile.

Observatie: Daca in (96) avem T22(∞) = D22 = 0 atunci TLF si produsul Redheffer ale lui T cu Tc sunt automat bine definite.


183


6. Elemente Structurale ale Matricilor Rationale Anumite elemente structurale ale matricilor rationale joaca un rol aparte in teoria controlului sistemelor dinamice pe spatiul starilor: poli, zerouri, forma Smith McMillan, directiile de poli/zerouri, indicii singulari stanga si dreapta. Conceptele de pol si zerou sunt considerabil mai dificile decat in cazul scalar in principal datorita posibilitatii ca o matrice rationala sa aibe pol si zerou in acelasi punct so ∈ C, cat si datorita posibilitatii existentei polilor si zerourilor la infinit (un concept relativ greu de explicitat in cazul multivariabil). In cazul sistemic avem doua notiuni de poli: poli ai matricii de transfer (vazuta ca matrice rationala) si poli ai sistemului pe spatiul starilor definiti ca fiind valorile proprii ale matricii A. Mai precis, so ∈ C este pol al matricii de transfer rationale T (s) daca este pol cel putin al unui element al sau considerat ca rationala ireductibila. Polii matricii de transfer coincid cu polii sistemului daca si numai daca realizarea corespunzatoare este minimala. CAPITOLUL 3: PROPRIETATI STRUCTURALE

184

Elemente Structurale ale Rationalelor

In cazul sistemic exista si doua notiuni de zerouri: zerouri de transmisie si zerouri invariante. Notiunea de zerou de transmisie se introduce pe baza matricii de transfer rationale iar cea de zerou invariant pe baza unei matrici polinomiale construite pe baza unei realizari de stare (A, B, C, D). Pentru a intelege intuitiv notiunea de zerou sa presupunem ca so ∈ C nu este pol al rationalei. Atunci s0 se numeste zerou al rationalei T (s) daca si numai rank T (so) < rank nT (s) unde prin rank nT (s) intelegem rangul normal al rationalei, i.e., rangul pentru aproape toti s ∈ C. In termeni sistemici, cand T (s) are semnficatia de matrice de transfer a unui sistem, zerourile ei se mai numesc zerouri de transmisie ale sistemului. Pentru a introduce notiunea de zerou invariant al unui sistem de tipul (A, B, C, D) CAPITOLUL 3: PROPRIETATI STRUCTURALE

185


sa presupunem conditii initiale nule. Atunci avem in transformate Laplace (sI − A)x − Bu = 0, Cx + Du = y sau echivalent

sI − A −B C D Matricea polinomiala (de grad 1) S(s) :=

sI − A −B C D

x u

=

0 y

.

∈ R[s](n+p)×(n+m)

(108)

se numeste matricea sistem (sau de transmisie) si joaca un rol central in studiul sistemelor dinamice liniare atat din punct de vedere teoretic cat si procedural. s0 ∈ C se numeste zerou invariant al sistemului daca rank S(s0) < rank nS(s) =: r. CAPITOLUL 3: PROPRIETATI STRUCTURALE

186


Rangul normal este egal cu dimensiunea maxima a unui minor al lui S(s) care nu are determinantul identic nul. Fie χ(s) cel mai mare divizor comun al tuturor determinantilor minorilor de rang (avand dimensiunea egala cu rangul normal). Atunci zerourile invariante ale sistemului (A, B, C, D) sunt exact zerourile polinomului χ(s). Din identitatea

sI − A −B C D

=

−1

I O sI − A O I −(sI − A) B C(sI − A)−1 I O I O T (s) se observa ca daca s0 6∈ Λ(A) atunci so este zerou invariant daca si numai daca este zerou de transmisie. Problemele majore apar insa atunci cand exista zerouri comune cu poli. Pentru a intelege riguros aceste concepte avem nevoie de o teorie mai sofisticata a formelor canonice pentru matrici rationale si matrici polinomiale de gradul 1 (numite fascicole matriciale). CAPITOLUL 3: PROPRIETATI STRUCTURALE

187


Forma Smith–McMillan a rationalei T (s) – o forma canonica sub transformari unimodulare – Teorema 61 (Forma Smith–McMillan). Fie T (s) o p × m matrice rationala cu coeficienti in R avand rangul normal r. Atunci exista o p × p matrice polinomiala U (s) si o m × m matrice polinomiala V (s), ambele cu coeficienti in R si determinant constant nenul (independent de s), care aduce T (s) la forma Smith–McMillan S(s) = U (s)T (s)V (s), (109) unde

ǫ1(s) ǫ2(s) ǫr (s) , ,..., , 0, . . . , 0 , (110) S(s) := diag η1 (s) η2(s) ηr (s) polinoamele ǫi(s), ηi (s) sunt monice (au coeficientul termenului de grad maxim egal cu 1), sunt doua cate doua coprime pentru i = 1, . . . , r, si satisfac proprietatile de divizibilitate ǫi(s) | ǫi+1(s), ηi+1(s) | ηi(s), CAPITOLUL 3: PROPRIETATI STRUCTURALE

i = 1, . . . , r − 1. 188

(111)


Mai mult, polinoamele ǫi(s) si ηi(s) sunt unic definite de T (s) si se numesc divizori elementari ai lui T (s). Definim

z(s) := ǫ1(s) · · · ǫr (s), (112) p(s) := η1(s) · · · ηr (s). Atunci cele nz (np) radacini ale lui z(s) (p(s)) sunt prin definitie zerourile (polii) finiti ai lui T (s). Ordinul zeroului (polului) s0 al lui T (s) este prin definitie multiplicitatea sa ca radacina a polinomului z(s) (p(s)). Ordinele partiale ale zeroului (polului) s0 al lui T (s) sunt prin definitie multiplicitatile nenule ale lui s0 ca radacina a polinoamelor ǫi(s) (ηi(s)), pentru i = 1, . . . , r. Spunem ca ∞ este zerou (pol) al lui T (s) daca s = 0 este zerou (pol) al matricii rationale Tb(s) = T ( 1s ), si definim ordinele zeroului (polului) s = ∞ al lui T (s) ca fiind ordinele zeroului (polului) s = 0 al lui Tb(s). CAPITOLUL 3: PROPRIETATI STRUCTURALE

189


Notam cu Z(T ) si respectiv P(T ) reuniunea tuturor zerourilor si respectiv tuturor polilor (incluzand infinitul si repetitii in acord cu ordinele elementelor). Gradul McMillan al lui T este prin definitie suma tuturor ordinelor polilor (finiti si infiniti). Deci gradul McMillan al unei matrici rationale este egal cu numarul de poli (socotind ordinele inclusiv ale polilor de la infinit). Observatie: Daca rationala este proprie atunci nu are poli la infinit si definitiile de mai sus se simplifica corespunzator. Cand suntem interesati de un singur punct s0 se poate folosi o forma Smith– McMillan locala care pune in evidenta numai ordinele zeroului si polului din s0. Teorema 62 (Forma Smith–McMillan locala). Fie T (s) o p×m matrice rationala cu coeficienti in R, avand rangul normal r, si fie s0 ∈ C. Atunci exista o p × p matrice rationala U (s) si o m × m matrice rationala V (s), ambele nesingulare si fara poli sau zerouri in so, care aduc T (s) la forma Smith–McMillan locala (in jurul lui s0), Sℓ(s) = U (s)T (s)V (s), (113) CAPITOLUL 3: PROPRIETATI STRUCTURALE

190


unde si

k1 k2 kr Sℓ(s) := diag (s − s0) , (s − s0) , . . . , (s − s0) ,

(114)

k1 ≤ k2 ≤ . . . ≤ kr sunt numere intregi. Mai mult, intregii strict pozitivi (sau strict negativi) ki sunt ordinele partiale ale lui s0 ca zerou (pol) al lui T . Forma Smith–McMillan in jurul lui s = ∞ se obtine din forma Smith–McMillan a lui T ( 1s ) in jurul lui s = 0. Baze minimale pentru spatiile nucleu la stanga si dreapta Fie T (s) o p × m matrice rationala avand rangul normal r. Nucleul la dreapta (peste rationale) are dimensiune m − r iar nucleul la stanga are dimensiune p − r. Introducem in continuare notiunile de indici minimali la dreapta si stanga. Pentru acesta avem nevoie de cateva notiuni de subspatii rationale. CAPITOLUL 3: PROPRIETATI STRUCTURALE

191


Definim gradul unui vector de polinoame ca fiind cel mai mare grad al elementelor respectivului vector. Dandu–se un subspatiu in Rm(s) (vectori rationali de dimensiune m), putem intotdeauna construi o baza polinomiala pentru el. Coloanele unei matrici polinomiale P(s) formeaza o baza minimala pentru spatiul pe care-l genereaza daca au loc simultan: 1. P (s) este monica pentru toti s ∈ C finiti; 2. P (s) este redusa pe coloane (sau proprie pe coloane). Mai precis, fie ni gradul coloanei i a lui P (s) si construim matricea constanta Pn a carei coloana i este coeficientul vectorial al lui sni in coloana i a lui P(s). Atunci P(s) este de tip coloana redusa daca Pn este monica. Echivalent, o baza polinomiala este minimala daca suma tuturor gradelor vectorilor polinomiali care o formeaza este cat mai mica posibila. Multimea gradelor vectorilor din orice baza minimala a unui subspatiu este invarianta in raport cu operatiile unimodulare pe coloane, si aceste grade se numesc CAPITOLUL 3: PROPRIETATI STRUCTURALE

192


indici minimali (sau indici Kronecker ) ai subspatiului. Se numesc indici minimali la stanga si dreapta ai unei matrici rationale multimea indicilor minimali ai subspatiilor nule (nucleu) la stanga si respectiv la dreapta. Pentru o matrice rationala arbitrara are loc o relatie interesanta intre indicii structurali. Fie nr si nℓ suma indicilor minimali la dreapta si respectiv la stanga si fie nz si np numarul total de zerouri si respectiv de poli. Atunci are loc relatia np = nz + nr + nℓ.


193


7. Fascicole Matriciale si Forme Canonice Fie M si N doua m × n matrici cu elemente in R. Matricea polinomiala (de grad 1) sM − N se numeste fascicol matricial sau pe scurt fascicol. Ne concentram intai atentia asupra fascicolelor sM − N care sunt regulate, i.e., care sunt patrate (n × n) si au un determinant neidentic nul det(sM − N ) 6≡ 0. Un fascicol care nu este regulat se numeste singular. In particular, daca M sau N sunt inversabile atunci fascicolul sM − N este regulat. In general vom fi interesati de fascicole arbitrare (inclusiv singulare). Dandu-se un fascicol regulat sM − N , cu M, N ∈ Rn×n, problema de gasire a solutiilor ecuatiei polinomiale χ(s) := det (sM − N ) = 0

(115)

se numeste problema de valori proprii generalizate. CAPITOLUL 3: PROPRIETATI STRUCTURALE

194

Fascicole matriciale

Deoarece M poate fi singulara, polinomul caracteristic χ(s) are gradul nf ≤ n. Cele nf radacini ale lui χ(s) se numesc valori proprii generalizate finite ale fascicolului sM − N . s = ∞ este o valoare proprie (generalizata) a lui sM − N daca s = 0 este o valoare proprie (generalizata) a fascicolului reciproc sN − M . Multiplicitatea n∞ a valorii proprii de la infinit este prin definitie multiplicitatea valorii proprii s = 0 pentru fascicolul sN − M . Evident avem n∞ = n − nf . Prin urmare un fascicol matricial regulat de dimensiune n × n are intotdeauna n valori proprii (finite si infinite) care formeaza spectrul fascicolului notat Λ(M, N ). Pentru o valoare proprie s0 exista intotdeauna un vector nenul x ∈ Cn – numit vector propriu generalizat a.i.

N x = s0 M x Mx = 0


daca s0 este finita, daca s0 este infinit. 195


Forma canonica Weierstrass a unui fascicol regulat Introducem o relatie de echivalenta pentru fasciole matriciale si studiem intai proprietatile si consecintele asupra fascicolelor regulate. f−N e , cu M, N, M f, N e ∈ Cm×n se numesc (strict) Doua fascicole sM − N si sM echivalente daca exista doua matrici inversabile Q ∈ Cm×m, Z ∈ Cn×n, a.i. f−N e. Q(sM − N )Z = sM

(116)

Relatia de echivalenta stricta (116) induce o forma canonica pe multimea fascicolelor regulate de dimensiune n × n numita forma canonica Weierstrass. Prin urmare, pentru oricare fascicol regulat sM − N , cu M, N ∈ Cn×n, exista doua matrici inversabile Q, Z ∈ Cn×n a.i. Q(sM − N )Z = sMW − NW CAPITOLUL 3: PROPRIETATI STRUCTURALE

196


unde sMW − NW := diag (sM∞ − In∞ , sInf − Nf ),

(117)

Nf este in forma canonica Jordan, M∞ este nilpotenta si este in forma canonica Jordan (0), Js∞ (0), . . . , Js∞ (0)) (118) M∞ := diag (Js∞ 1 2 h ∞

si Jsi (0) este un bloc elementar (nilpotent) Jordan de dimensiune si × si cu valoare proprie s = 0. Observatii: • Valorile proprii generalizate finite ale fascicolului sM − N coincid cu valorile proprii ale matricii Nf . Prin urmare se poate folosi matricea Nf pentru a defini conceptele de multiplicitate partiala, algebrica si geometrica a unei valori proprii generalizate finite a lui sM − N . • Similar, se definesc multiplicitatea partiala, algebrica si geometrica a valorii proprii generalizate de la infinit ca fiind multiplicitatea corespunzatoare a valorii proprii s = 0 a matricii M∞. Prin urmare pentru s = ∞ multiplicitatile partiale sunt s∞ Ph ∞ ∞ i (i = 1, . . . , h∞), multiplicitatea algebrica este n∞ si satisface n∞ = i=1 si , iar multiplicitatea geometrica este h∞. CAPITOLUL 3: PROPRIETATI STRUCTURALE

197


•Multimea valorilor proprii generalizate impreuna cu multiplicitatile partiale determina complet forma canonica Weierstrass a unui fascicol matricial regulat (pana la o permutare a blocurilor diagonale). Daca M este inversabila atunci fascicolul nu are are valori proprii infinite si forma canonica Weierstarss se reduce la forma canonica Jordan a matricii M −1N .


198


Problema de valori proprii generalizate: cazul general Extindem in continuare studiul asupra fascicolelor arbitrare (posibil singulare) sM − N de dimensiune m × n cu elemente in R. Un fascicol este numit singular daca nu este patrat sau daca este patrat dar det(sM − N ) ≡ 0. In particular, sM − N are rang constant pentru toti s ∈ C cu exceptia unui numar finit pentru care are rang strict mai mic. Observatii: Rangul normal r al fascicolului sM − N este rangul lui sM − N pentru aproape toti s ∈ C. Pentru un fascicol regulat avem m = n = r. Daca νr := n − r > 0 atunci fasciolul are structura singulara la dreapta. Daca νℓ := m − r > 0 atunci fascicolul are structura singulara la stanga. Un fascicol regulat nu are structura singulara nici la stanga si nici la dreapta. Polinomul caracteristic χ(s) al fascicolului este cel mai mare divizor comun al polinoamelor Ri(s), unde {Ri(s)} este multimea tutoror minorilor de dimensiune r. CAPITOLUL 3: PROPRIETATI STRUCTURALE

199


Problema rezolvarii ecuatiei polinomiale χ(s) := χ0 + χ1s + . . . + χnf snf = 0, cu χnf 6= 0, se numeste problema de valori proprii generalizate pentru fascicolul sM − N . Cele nf radacini ale lui χ(s) se numesc valori proprii finite. Spunem ca s = ∞ este valoare proprie lui sM − N daca s = 0 este valoare proprie a fascicolului reciproc sN − M sau, echivalent, daca rank M < r. Multiplicitatea n∞ a v.p. de la infinit este prin definitie multiplicitatea v.p. s = 0 a lui sN − M . Reuniunea (nedisjuncta) a celor nf + n∞ v.p. formeaza spectrul lui sM − N notat Λ(M, N ).

generalizate (finite si infinite)

Forma canonica Kronecker a unui fascicol general Relatia de stricta echivalenta induce o forma canonica pe multimea fascicolelor de dimensiune m × n numita forma canonica Kronecker. Mai exact, pentru oricare CAPITOLUL 3: PROPRIETATI STRUCTURALE

200


fascicol sM − N , cu M, N ∈ Cm×n, exista doua matrici inversabile Q ∈ Cm×m si Z ∈ Cn×n a.i. Q(sM − N )Z = sMKR − NKR , unde 

sMKR − NKR

     :=     

Lǫ1



... Lǫνr

sM∞ − In∞ sInf − Nf

LTη1

...

LTην

ℓ

     ,    

(119)

Nf este o matrice in forma canonica Jordan, M∞ este o matrice nilpotenta in CAPITOLUL 3: PROPRIETATI STRUCTURALE

201


forma canonica Jordan, si Lk (k ≥ 0) este un k × (k + 1) fascicol bidiagonal 

s −1 ... Lk := 

... s

−1



.

k poate fi zero corespunzand unei linii sau coloane de zerouri in fascicolul (119). Structura Kronecker este complet determinata de partea regulata si singulara. Valorile proprii (finite si infinite) ale fascicolului sM − N sunt valorile proprii ale fascicolului regulat M∞ O I n∞ O s − O I nf O Nf Partea singulara a fascicolului este determinata de structura singulara Kronecker la stanga si dreapta. Blocurile de dimensiune ǫi × (ǫi + 1) notate Lǫi , (i = 1, . . . , νr ), sunt blocurile elementare Kronecker la dreapta si ǫi ≥ 0 sunt indicii Kronecker la dreapta. Blocurile de dimensiune (ηj + 1) × ηj notate Lηj T , (j = 1, ..., νℓ), sunt blocurile elementare Kronecker la stanga si ηj ≥ 0 sunt indicii Kronecker la stanga. CAPITOLUL 3: PROPRIETATI STRUCTURALE

202


Din forma canonica Kronecker avem rank n(sM − N ) = nr + n∞ + nf + nℓ, Pνr

(120)

P νℓ

unde nr := i=1 ǫi si nℓ := j=1 ηj . Daca sM − N este regulat atunci nu exista indici Kronecker (i.e., blocurile Lǫi , LTηj dispar) si forma canonica Kronecker se reduce la forma canonica Weierstrass.


203


8. Elemente Structurale ale unei Matrici Rationale in Termenii Realizarilor de Stare

Intre elementele structurale ale matricii de transfer rationale T (s) a unui sistem dinamic si formele canonice ale fasciolelor sI − A,

sI − A −B C D

asociate unei realizari arbitrare – numite fascicolul de poli si fascicolul de zerouri (sau matricea de transmisie) – exista o legatura stransa. Teorema 63. Fie T (s) o p×m matrice rationala proprie avand gradul McMillan n si rangul normal r. Fie A B T = (121) C D CAPITOLUL 3: PROPRIETATI STRUCTURALE

204

o realizare de dimensiune k cu coeficienti in R si fie sI − A,

sET − AT :=

sI − A −B −C −D

fasciolele de poli si respectiv de zerouri asociate acestei realizari. 1. Pentru orice realizare (121) avem: (a) Rangul normal: Rangurile normale ale lui T (s) si sET − AT satisfac rank nT (s) = rank n(sET − AT ) − k.

(b) Poli: Reuniunea polilor P(T ) este inclusa Λ(A), P(T ) ⊂ Λ(A). CAPITOLUL 3: PROPRIETATI STRUCTURALE

205

(c) Zerouri: Reuniunea zerourilor de transmisie Z(T ) (finite si infinite) ale lui T este inclusa in Λ(ET , AT ), Z(T ) ⊂ Λ(ET , AT ).

2. Pentru o realizare minimala (121) avem in plus: (a) Poli: Polii lui T (s) coincid cu valorile proprii ale lui A. Ordinele partiale ale polilor lui T (s) sunt egale cu multiplicitatile partiale ale v.p. ale lui A. (b) Zerouri finite : Zerourile finite (de transmisie) ale lui T coincid cu v. p. finite ale lui sET − AT . Ordinele partiale ale zerourilor finite ale lui T (s) sunt egale cu multiplicitatile partiale ale v.p. finite ale lui sET − AT . (c) Zerouri infinite: Ordinele partiale ale zerourilor infinite (de transmisie) ale lui T sunt egale cu multiplicitatile partiale ale v.p. infinite a lui sET − AT minus 1. CAPITOLUL 3: PROPRIETATI STRUCTURALE

206

(d) Indici minimali la stanga. Indicii minimali la stanga ai lui T sunt egali cu indicii Kronecker la stanga ai lui sET − AT . (e) Indici minimali la dreapta. Indicii minimali la dreapta ai lui T sunt egali cu indicii Kronecker la dreapta ai lui sET − AT .


207

CAPITOLUL 4: SINTEZA ELEMENTARA 1. Compensatoare Dinamice : Problematica 2. Lege de Comanda, Stabilizabilitate, Alocabilitate 3. Estimatori de Stare 4. Estimatori de Tip 1 5. Compensatorul Kalman 6. Estimatori de Stare de Ordin Redus (Tip 2) 7. Reglarea Sistemelor Dinamice

CAPITOLUL 4: SINTEZA ELEMENTARA

208

SINTEZA ELEMENTARA

1. Compensatoare Dinamice : Problematica

Consideram un sistem liniar x(t) ˙ = Ax(t) + Bu(t), y(t) = Cx(t) + Du(t)

x(0) = xo

(122)

cu x(t) ∈ Rn, u(t) ∈ Rm, y(t) ∈ Rp. Problema sintezei (naturala): Cum putem sa modificam dinamica acestui sistem astfel incat sa satisfaca anumite cerinte ? Cerintele elementare discutate si in cazul sistemelor SISO sunt legate de stabilitate si comporatarea sistemului la diverse semnale de referinta/perturbatii. Raspuns: Cerintele de proiectare se pot realiza prin cuplarea unui nou sistem dinamic (de preferinta din aceeasi clasa de modele) astfel incat sistemul rezultant sa se comporte in modul dorit. CAPITOLUL 4: SINTEZA ELEMENTARA

209

Compensatoare Dinamice: Problematica

Asa cum am vazut in cazul sistemelor SISO, conexiunile serie si paralel nu pot asigura in general nici macar cerinta minimala de stabilitate (interna) si acest fapt este specific si sistemelor dinamice (Ex: Aratati acest lucru prin analogie cu cazul SISO sau direct pe realizarile de stare ale conexiunilor serie/paralel). Prin urmare ne indreptam atentia din nou asupra conexiunii in bucla de reactie negativa. In conjunctie cu sistemul (122) consideram sistemul dinamic pe spatiul starilor (numit compensator dinamic sau regulator)

x˙ c(t) = Acxc(t) + Bcuc(t), yc(t) = Ccxc(t) + Dcuc(t),

xc(0) = xco

(123)

unde xc(t) ∈ Rnc , uc(t) ∈ Rp, yc(t) ∈ Rm, cuplat in reactie inversa cu (122) a. i. u ≡ yc + uR,

yR ≡ y ≡ uc

unde uR este intrarea (semnal extern) si yR este iesirea sistemului rezultant. CAPITOLUL 4: SINTEZA ELEMENTARA

210


Pentru simplificare presupunem S := Ip − DDc = I, Sb = Im − DcD = I (de exemplu D = 0 sau Dc = 0). Atunci ecuatiile dinamice ale sistemului echivalent sunt ˙ A + BDcC BCc x B x = + uR xc BcC Ac + xc Bc D BcDCc x C DCc yR = + DuR. xc

(124)

Notand xR :=

x xc

, AR :=

A + BDcC Bc C

CR := CAPITOLUL 4: SINTEZA ELEMENTARA

C

DCc

BCc Ac + BcDCc

, BR :=

B Bc D

,

DR := D

, 211


obtinem echivalent   x˙ R (t) = ARxR (t) + BRuR(t),  yR (t) = CRxR (t) + DRuR(t).

xR (0) =

xo xco

(125)

Se formuleaza urmatoarele probleme fundamentale: 1. Problema stabilizarii: Pentru sistemul original (A, B, C, D) sa se gaseasca un regulator (sau clasa tuturor !!!) (Ac, Bc, Cc, Dc) a. i. sistemul rezultant in bucla inchisa sa fie intern asimptotic stabil (Λ(AR) ⊂ C−). 2. Problema alocarii: Pentru sistemul original (A, B, C, D) sa se gaseasca un regulator (sau clasa tuturor !!!) (Ac, Bc, Cc, Dc) a. i. sistemul rezultant in bucla inchisa sa aibe o dinamica impusa (mai precis valorile proprii ale sistemului in bucla inchisa sa coincida cu multimea Λ0 de n + nc valori complexe date, i.e., Λ(AR) = Λ0. CAPITOLUL 4: SINTEZA ELEMENTARA

212


Observatii: a) Ambele probleme impun conditii numai asupra matricii AR . b) In ambele probleme trebuie implicit determinat si nc (dimensiunea compensatorului) fiind de dorit ca aceasta sa fie cat mai mica. Problemele de stabilizare/alocare in care se impune conditia suplimentara de minimalitate a lui nc sunt probleme structurale in general foarte dificile. c) Multimea Λ0 se ia in general simetrica, i.e. daca s ∈ Λ0 atunci si s ∈ Λ0, regulatorul rezultand automat cu coeficienti reali. Λ0 se da in general ca cerinta de proiectare asigurand automat o anumita viteza de raspuns, timp tranzitoriu, etc. d) Spre deosebire de problema alocarii, problema stabilizarii nu pretinde spectru fix ci doar locatia acestuia in C−. In mod traditional au existat cateva abordari ale acestei probleme: • Prin extensie dinamica: Problema se reduce simplu la o problema algebrica de alocare de poli ce insa s-a dovedit a fi foarte dificil de rezolvat in conditii generale. • Principiul separatiei: S–a pus in evidenta un principiu fundamental in teoria CAPITOLUL 4: SINTEZA ELEMENTARA

213


sistemelor liniare numit principiul separatiei si care reduce problema originala la doua probleme algebrice de alocare ce se rezolva independent. • Parametrizarea lui Youla: cea mai completa solutie disponibila (foloseste implicit principiul separatiei) necesitand insa dezvoltarea teoriei factorizarilor de matrici rationale peste S (relativ sofisticata) – solutia este formal identica cu cazul SISO. Extensie dinamica Consideram pentru simplitate D = 0. Metoda se bazeaza pe observatia ca matricea de stare AR a sistemului rezultant se poate scrie succesiv AR :=

A + BDcC Bc C

BCc Ac

=

A O B + O O O

= Ae + BeKCe CAPITOLUL 4: SINTEZA ELEMENTARA

214

O I nc

Dc Cc Bc Ac

C O O I nc (126)


unde

Dc Cc , Ce := , K := . Ae := , Be := Bc Ac (127) Deci problema originala de stabilizare/alocare dinamica prin gasirea compensatorului (Ac, Bc, Cc, Dc) s–a redus la problema echivalenta de gasire a matricii constante K astfel incat spectrul matricii (126) sa fie in C−. Aceasta din urma problema este in fapt o problema de gasire a unei reactii constante dupa iesire (reactie inversa cu compensator constant) pentru sistemul (Ae, Be, Ce). A O O O

B O

O I nc

C O O I nc

Sistemul extins (Ae, Be, Ce) se obtine prin adaugarea la sistemul initial (A, B, C, D) a sistemului x˙ a(t) = ua(t), ya(t) = xa(t), CAPITOLUL 4: SINTEZA ELEMENTARA

215


unde xa(t), ua(t), ya(t) ∈ Rnc . Obtinem astfel ecuatiile dinamice

x˙ e(t) = Aexe(t) + Beue(t), ye(t) = Cexe(t),

x(t) u(t) , ue(t) := xa(t) ua(t) sunt starea, intrarea si respectiv iesirea extinsa. xe(t) :=

,

ye(t) :=

y(t) ya(t)

Daca conectam un compensator constant in reactie inversa cu sistemul extins obtinem ca matricea de stare a sistemului in bucla inchisa este (126). Deci problema originala de gasire a unui compensator (Ac, Bc, Cc, Dc) s-a redus la problema de gasire a unei reactii cst. K (127) pentru sistemul extins (Ae, Be, Ce). Cu toate ca aceasta problema pare mai simpla decat cea originala, solutionarea ei este foarte dificila intrucat nu este cunoscuta dimensiunea nc. Chiar cu nc impus, problema se reduce la rezolvarea unei probleme de optimizare neconvexe (dificile !). CAPITOLUL 4: SINTEZA ELEMENTARA

216


Principiul separatiei Un compensator dinamic se poate obtine rezolvand independent problemele: • Constructia unei legi de reactie dupa stare F ∈ Rm×n care aloca sau stabilizeaza (face ca matricea A + BF sa aibe spectrul dorit sau sa fie asimptotic stabila). • Constructia unui estimator de stare (prelucreaza semnalele exogene – marimile de intrare u si de iesire y – si genereaza o estimare a marimii de stare x). In final, regulatorul (de tip Kalman) se obtine luand reactia F dupa starea estimata. Problema de alocare (cu reactie dinamica dupa iesire) are solutie daca si numai daca perechea (A, B) este controlabila si perechea (C, A) este observabila. Problema de stabilizare (cu reactie dinamica dupa iesire) are solutie daca si numai daca perechea (A, B) este stabilizabila si perechea (C, A) este detectabila. CAPITOLUL 4: SINTEZA ELEMENTARA

217


2. Lege de Comanda, Alocabilitate, Stabilizabilitate Definitia 64. • Pentru un sistem (A, B, C, D) dependenta u = F x + Gv

(128)

se numeste lege de comanda prin reactie dupa stare, unde F ∈ Rm×n, G ∈ Rm×m, F se numeste matricea de reactie si v este noua marime de intrare. (FIG) • Perechea (A, B), A ∈ Rn×n, B ∈ Rn×m se numeste stabilizabila daca exista o matrice de reactie dupa stare F ∈ Rm×n a.i. Λ(A + BF ) ⊂ C−. • Perechea (C, A), C ∈ Rp×n, A ∈ Rn×n se numeste detectabila daca exista o matrice de reactie dupa stare K ∈ Rn×p a.i. Λ(A + KC) ⊂ C−. CAPITOLUL 4: SINTEZA ELEMENTARA

218

Lege de Comanda, Alocabilitate, Stabilizabilitate

• Perechea (A, B), A ∈ Rn×n, B ∈ Rn×m , se numeste alocabila daca oricare ar fi multimea simetrica Λ0 de n numere complexe (orice s ∈ Λ0 ⇒ s ∈ Λ0), exista o matrice de reactie dupa stare F ∈ Rm×n a.i. Λ(A + BF ) = Λ0.

Proprietatile de stabilizabilitate si detectabilitate sunt duale. Considerand sistemul dinamic

x(t) ˙ = Ax(t) + Bu(t), y(t) = Cx(t) + Du(t)

x(0) = xo

(129)

legea de comanda dupa stare implica accesul (din punct de vedere tehnic) la stare, i.e., cunoasterea marimii de stare ! Dupa implementarea comenzii (128) sistemul CAPITOLUL 4: SINTEZA ELEMENTARA

219


in bucla inchisa devine

x(t) ˙ = (A + BF )x(t) + BGv(t), y(t) = (C + DF )x(t) + DGv(t)

x(0) = xo

(130)

avand noua intrare v si iesirea y. Exercitiu: Explicitati in domeniul timp si al transformatelor Laplace traiectoria, iesirea si legea de comanda pentru sistemul (130). Scrieti o realizare de stare pentru acest sistem si precizati cum sunt influentate controlabilitatea/ observabilitatea/ minimalitatea/ stabilizabilitatea/ detectabilitatea/ polii/ zerourile printr–o lege de comanda cu reactie dupa stare. Teorema 65. Fie A ∈ Rn×n, B ∈ Rn×m, F ∈ Rm×n, G ∈ Rm×m nesingulara si fie AF := A + BF . a) Perechea (A, B) este controlabila daca si numai daca perechea (AF , BG) este controlabila. b) Subspatiile controlabile in k pasi ale perechii (A, B) si perechii (AF , BG) CAPITOLUL 4: SINTEZA ELEMENTARA

220


coincid, i.e., Rk (A, B) = Rk (AF , BG).

(131)

Demonstratie. a) Avem succesiv rank

sI − A − BF

BG

= rank

sI − A B

I −F

O G

= rank

sI − A

si concluzia rezulta folosind criteriul PBH de controlabilitate. b) Demonstram prin inductie. Pentru k = 0 avem prin definitie R0(A, B) = R0(AF , BG) = {0} iar pentru k = 1 avem R1(A, B) = Im B = Im BG = R1(AF , BG). CAPITOLUL 4: SINTEZA ELEMENTARA

221


Presupunem acum (131) adevarata. Atunci pentru k + 1 avem Rk+1(AF , BG) = Im BG + AF Rk (AF , BG)

= Im B + AF Rk (A, B) = Im B + ARk (A, B) = Rk+1(A, B). Solutia problemei alocarii Teorema 66. Perechea (A, B), A ∈ Rn×n, B ∈ Rn×m este alocabila daca si numai daca este controlabila. Demonstratia acestui rezultat este relativ complicata si o vom face in cateva etape formulate ca rezultate separate: • Demonstram suficienta pentru m = 1 (o intrare); • Aratam ca problema cu m > 1 se poate reduce printr-o (pre)reactie dupa stare F la problema cu m = 1; • Demonstram teorema pentru m general. CAPITOLUL 4: SINTEZA ELEMENTARA

222


Teorema 67 (Cazul m=1). Perechea (A, b), A ∈ Rn×n, b ∈ Rn×1 este alocabila daca este controlabila. Demonstrat¸ie. Fie Λ0 un set simetric de n numere si ∈ C, i = 1, 2, . . . , n. Aratam ca exista f ∈ Rn×1 a.i. Λ(A + bf T ) = Λ0. Demonstratia este constructiva (furnizeaza reactia care aloca). Deoarece (A, b) este controlabila, matricea de controlabilitate R=

2

n−1

b Ab A b . . . A

b

are dimensiune n × n si rang n si deci este inversabila. Atunci ecuatia q T R = eTn T

eTn R−1

1×n

(132)

are solutie unica q = ∈ R , unde = 0 . . . 0 1 (q T este ultima linie a lui R−1 ). Fie Λ0 un set simetric fixat de n numere complexe si, CAPITOLUL 4: SINTEZA ELEMENTARA

eTn

223


i = 1, 2, . . . , n si fie χ(s) = Πni=1(s − si) = sn + αn−1 sn−1 + . . . + α0

(133)

polinomul avand radacinile date de Λ0. Aratam ca exista un f a.i. polinomul caracteristic a lui A + bf T sa coincida cu χ(s) ceea ce este echivalent cu a spune ca matricea A + bf T are spectrul Λ0. Pentru aceasta este suficient sa aratam ca χ(A + bf T ) = 0 pentru un f potrivit ales. Scriind (132) explicit obtinem qT b = 0 q T Ab = 0 .. q T An−2b = 0 q T An−1b = 1 CAPITOLUL 4: SINTEZA ELEMENTARA

224


care se pot rescrie pentru orice f ∈ Rn sub forma qT = qT q T (A + bf T ) = q T A q T (A + bf T )2 = q T A2 .. q T (A + bf T )n−1 = q T An−1 q T Anb = q T An + q T An−1 bf T = q T An + f T .

(134)

Inmultind succesiv ecuatiile cu α0, α1, . . . αn−1 si 1, adunandu-le membru cu membru si folosind (133) rezulta q T χ(A + bf T ) = q T χ(A) + f T .

(135)

f T := −q T χ(A)

(136)

q T χ(A + bf T ) = 0.

(137)

Alegand rezulta automat ca


225


Folosind (134), obtinem prin inmultire succesiva cu A, A2, . . ., An−1 ca

T χ(A + bf T ) = 0,



  TR =   

0 0 .. 0 1

0 0 .. 1 0

... ... .. ... ...

0 1 .. 0 0

1 0 .. 0 0



  ,  



T



q   qT A .  T :=  .  . q T An−1

Deci T este inversabila si prin urmare χ(A + bf T ) = 0 pentru f dat de (136), q.e.d. Dam in continuare un rezultat care permite reducerea problemei generale de alocare cu m > 1 la cazul m = 1. Teorema 68. Daca perechea (A, B) este controlabila atunci pentru orice b ∈ Rn, b 6= 0, exista o matrice de reactie F astfel incat perechea (A + BF, b) este controlabila. CAPITOLUL 4: SINTEZA ELEMENTARA

226


Demonstrat¸ie. Fie b 6= 0 fixat. Definim recurent n vectori k = 1, 2, . . . , n − 1,

xk+1 = Axk + Buk ,

x1 = b

(138)

unde uk ∈ Rm. Aratam ca putem intotdeauna alege vectorii uk (in numar de n − 1) a. i. vectorii x1, . . . , xn sa fie liniar independenti. Presupunem prin reducere la absurd ca am construit vectorii liniar independenti x1, . . . , xk (k < n) si oricare ar fi uk ∈ Rm avem ca xk+1 este liniar dependent de precedentii, i.e., xk+1 = Axk + Buk ∈ Sk := Im Din (139) rezulta automat ca

Axk ∈ Sk , CAPITOLUL 4: SINTEZA ELEMENTARA

x1 x2 . . . , xk

,

∀uk ∈ Rm.

(139)

Im B ∈ Sk . 227


Avem deasemenea ASk = Im

= Im

Ax1 Ax2 . . . Axk

x2 − Bu1 x3 − Bu2 . . . xk+1 − Buk

⊂ Sk

ceea ce inseamna ca Sk este A–invariant si contine Im B. Deoarece perechea (A, B) este controlabila avem ca R = Rn si deci Rn = R ⊂ Sk ceea ce implica automat k = n obtinand astfel o contradictie. Consideram acum ecuatia F

x1 x2 . . . xn


=

u1 u2 . . . , un−1 0 228

(140)


care are o solutie unica F . Daca premultiplicam ecuatia de mai sus cu B obtinem Bui = BF xi,

i = 1, 2, . . . , n − 1

care inlocuite in (138) genereaza xk+1 = (A + BF )xk ,

k = 1, 2, . . . , n − 1,

x1 = b

sau inca xk = Ak−1 k = 1, 2, . . . , n. F b, Deoarece xk sunt liniar independenti rezulta ca matricea

b AF b . . .

An−1 F b

este inversabila si deci perechea (AF , b) cu F dat de (140) este controlabila. Teorema 69. Perechea (A, B), A ∈ Rn×n, B ∈ Rn×m este alocabila daca si numai daca este controlabila. CAPITOLUL 4: SINTEZA ELEMENTARA

229


Demonstrat¸ie. Suficienta: Deoarece perechea (A, B) este controlabila inseamna ca B 6= 0 si deci exista g ∈ Rm a.i. b = Bg 6= 0. Din Teorema 67 rezulta atunci ca exista Fe a.i. perechea (AFe , b) sa fie controlabila, unde AFe := A + B Fe . Din teorema 67 rezulta ca pentru orice Λ0 set simetric de n numere exista f ∈ Rm a.i.

Prin urmare punand

Λ(AFe + bf T ) = Λ0. F := Fe + gf T

rezulta ca

(141)

Λ(A + BF ) = Λ(A + B(Fe + gf T )) = Λ(AFe + bf T ) = Λ0

de unde concluzia ca perechea (A, B) este alocabila si reactia care aloca este data de (141). Necesitatea: Pp prin absurd ca perechea (A, B) este alocabila dar nu este CAPITOLUL 4: SINTEZA ELEMENTARA

230


controlabila. Atunci aplicand teorema de descompunere controlabila obtinem in noul sistem de coordonate A1 A3 B1 −1 b b b F1 F2 T (A + BF )T = A + B F = + O A2 O =

A1 + B1F1 A3 + B1F2 O A2

unde am notat Fb := F T −1. De aici rezulta ca

(142)

b+B b Fb) = Λ(A1 + B1F1) ∪ Λ(A2) Λ(A + BF ) = Λ(A

si deci Λ(A2) ⊂ Λ(A + BF ) oricare ar fi reactia F ceea ce contrazice ipoteza de alocabilitate a perechii (A, B). Observatii: a) Relatia (142) evidentiaza ca orice pereche (A, B) are o subpereche care poate fi alocata (parte din spectru poate fi alocat) – aceasta coincide cu CAPITOLUL 4: SINTEZA ELEMENTARA

231


partea controlabila – si o parte nealocabila, i.e. anumiti poli ficsi dati de Λ(A2). Acesti poli sunt invarianti in raport cu orice reactie dupa stare. b) Teorema de mai sus arata ca proprietatea ”benefica” fundamentala a unei perechi controlabile (A, B) este ca dinamica sistemului (determinata de v.p. ale matricii de stare) poate fi modificata in mod arbitrar printr–o reactie dupa stare. c) Alocarea se poate extinde si asupra vectorilor proprii (simultan cu valorile proprii) cu anumite precautii privitoare la alegerea acestora. d) Demonstratia teoremelor de mai sus este constructiva rezultand proceduri de obtinere a reactiei care aloca. Aceaste metode au insa numeroase dezavantaje dpdv numeric si de aceea s-au dezvoltat alte proceduri numeric stabile de constructie a reactiei F (algoritm de tip Schur, alocare cu norma minima, etc). e) Alocabilitatea nu implica in general faptul ca matricea A + BF are orice elemente prescrise ci doar orice spectru prescris ! Procedura de Alocare: Cazul m = 1 Pasul 0: Dandu–se perechea controlabila (A, b), A ∈ Rn×n, b ∈ Rn, si un set CAPITOLUL 4: SINTEZA ELEMENTARA

232


simetric de n valori proprii s1, s2, . . . , sn se construieste polinomul χ(s) = Πni=1(s − si) = α0 + α1s + α2s2 + . . . + αn−1sn−1 + sn cu α0, α1, . . . , αn−1 ∈ R.

Pasul 1: Se construieste matricea de controlabilitate R=

n−1

b Ab . . . A

b

care este automat patrata si nesingulara.


233


Pasul 2: Se rezolva ecuatia 

  T R q = en =   

0 0 .. 0 1

     

in necunoscuta q ∈ Rn. Pasul 3: Se calculeaza f T = −q T χ(A).

Pentru a explicita procedura pentru cazul multivariabil avem nevoie de un rezultat auxiliar. CAPITOLUL 4: SINTEZA ELEMENTARA

234


Propozitia 70. Fie (A, B) controlabila, A ∈ Rn×n, B ∈ Rn×m. Controlabilitatea perechii (A + BF, b) este generica in raport cu F ∈ Rm×n si b := Bg, 0 6= g ∈ Rm. Mai exact, alegand aleator perechea (F, g) perechea (AF , b) este (generic) controlabila. Demonstrat¸ie. Demonstratia este lasata ca exercitiu fiind asemanatoare cu demonstrarea genericitatii controlabilitatii unei perechi de matrici alese arbitrar. Procedura de Alocare: Cazul General Pasul 0: Dandu–se perechea controlabila (A, B), A ∈ Rn×n , B ∈ Rn×m, si un set simetric de n valori proprii s1, s2, . . . , sn se construieste polinomul χ(s) = Πni=1(s − si) = α0 + α1s + α2s2 + . . . + αn−1sn−1 + sn cu α0, α1, . . . , αn−1 ∈ R. CAPITOLUL 4: SINTEZA ELEMENTARA

235


Pasul 1: Se aleg Fe ∈ Rm×n si g ∈ Rm aleator si se construiesc matricile AFe := A + B Fe ,

b = Bg.

Pasul 2: Se aplica procedura de alocare (cu m = 1) perechii (AFe , b) si polinomului χ(s) obtinandu-se reactia f ∈ Rm. Pasul 3: Calculam reactia finala sub forma F = Fe + gf T . Propozitia 71 (Criteriul Hautus de Stabilizabilitate/Detectabilitate). • Perechea (A, B), A ∈ Rn×n, B ∈ Rn×m este stabilizabila daca si numai daca rank


sI − A B

= n,

∀s ∈ C+ ∪ C0. 236

(143)


• Perechea (C, A), C ∈ Rp×n, A ∈ Rn×n este detectabila daca si numai daca rank

sI − A C

= n,

∀s ∈ C+ ∪ C0.

(144)

Demonstrat¸ie. Exercitiu ! Indicatie: Se foloseste teorema de descompunere controlabila punandu-se in evidenta polii ficsi.


237


3. Estimatori de Stare

Asa cum am vazut, legea de comanda cu reactie dupa stare poate asigura in mod satisfacator cerintele fundamentale ale sintezei sistemelor de stabilizare si alocare cu conditia ca starea sa fie disponibila pentru masura (sa fie accesibila dpdv tehnic). Din pacate acest lucru nu este in general posibil si atunci ne punem problema estimarii cat mai exacte a starii unui sistem dinamic prin constructia unui nou sistem care sa citeasca marimile accesibile sau masurabile (intrarea u si iesirea y) si care sa genereaze la iesire o estimare a starii x b. Un astfel de sistem se numeste estimator de stare (FIG). Problema: Dandu–se un sistem

x(t) ˙ = Ax(t) + Bu(t), y(t) = Cx(t) + Du(t),


238

x(0) = xo

(145) Estimatori de Stare

dorim sa construim un nou sistem

w(t) ˙ = Jw(t) + Hy(t) + M u(t), x b(t) = Kw(t) + N y(t) + P u(t)

(146)

(care are deci ca intrari intrarea u si iesirea y, are ca iesiri starea estimata x b, si marimea de stare w) care sa indeplineasca simultan urmatoarele doua conditii: 1. Sa fie intern asimptotic stabil, i.e., matricea de stare J sa satisfaca Λ(J) ⊂ C−.

2. limt→∞(b x(t)−x(t)) = 0, i.e., iesirea x b(t) (numita estimatia starii) sa aproximeze asimptotic starea sistemului original x(t). CAPITOLUL 4: SINTEZA ELEMENTARA

239

Estimatori de Stare

Observatii: a) Ideal ar fi x(t) = x b(t), ∀t. Acest lucru nu este insa in general posibil (explicati de ce !) si atunci aceasta cerinta se relaxeaza la cea asimptotica. b) Cerinta de stabilitate interna este esentiala pentru constructia estimatorului (explicati de ce!). Pentru a solutiona problema punem in evidenta ”fidelitatea” cu care starea estimatorului (146) urmareste starea sistemului original, i.e. evaluam w−Vx unde V este o matrice ce ”adapteaza” dimensiunile eventual diferite ale lui x si w. Folosind (145) si (146) avem succesiv w˙ − V x˙ = Jw + Hy + M u − V Ax − V Bu, ′

(w − V x) = J(w − V x) + JV x + HCx + HDu − V Ax + (M − V B)u, CAPITOLUL 4: SINTEZA ELEMENTARA

240

Estimatori de Stare

′

(w − V x) = J(w − V x) + (JV + HC − V A)x + (M − V B + HD)u. (147) Calculam succesiv x b − x = Kw + N y + P u − x = K(w − V x) + KV x + N Cx + N Du − x + P u

x b − x = K(w − V x) + (KV + N C − I)x + (P + N D)u Combinand (147) cu (148) obtinem

(w − V x) x b−x

′

(148)

= J(w − V x) + (JV + HC − V A)x + (M − V B + HD)u, = K(w − V x) + (KV + N C − I)x + (P + N D)u.

Pentru ca starea estimatorului sa urmareasca asimptotic starea sistemului original (conditia 2) trebuie ca iesirea sistemului dinamic de mai sus sa tinda asimptotic la zero (indiferent de initializari si de semnalele de intrare x si u). Acest lucru este posibil daca satisfacem simultan urmatoarele conditii: CAPITOLUL 4: SINTEZA ELEMENTARA

241

Estimatori de Stare

a) J asimptotic stabila; b) JV + HC − V A = 0; c) M − V B + HD = 0; d) KV + N C − I = 0; e) P + N D = 0. Daca aceste conditii sunt simultan satisfacute obtinem comportarea dinamica Obtinem deci

(w − V x) x b−x

′

= J(w − V x), = K(w − V x).

lim (w(t) − V x(t)) = 0,

t→∞

lim (b x(t) − x(t)) = 0

t→∞

indiferent de initializarea sistemului sau estimatorului ! Problema de constructie a estimatorului asimptotic stabil s–a redus la problema CAPITOLUL 4: SINTEZA ELEMENTARA

242

Estimatori de Stare

algebrica de satisfacere simultana a conditiilor a) – e): avem 5 conditii (4 ecuatii algebrice si o locatie de spectru) si 7 necunoscute. Evident c) si e) se pot satisface automat alegand M := V B − HD si P := −N D. Raman in continuare mai multe grade de libertate in satisfacerea restului de conditii Λ(J) ⊂ C−, JV + HC − V A = 0, KV + N C − I = 0, functie de care se deosebesc mai multe tipuri de estimatori.


243

Estimatori de Stare

4. Estimatori de Tip 1: N = 0

Conditia este echivalenta cu a a spune ca estimatorul nu are transfer direct I/O, i.e., matricea sa “D” este zero. In acest caz obtinem JV + HC − V A = 0, KV = I si putem alege K = I, V = I, ramand de satisfacut doar conditia J = A − HC,

Λ(J) ⊂ C−.

Aceasta conditie se poate satisface automat daca perechea (C, A) este detectabila, caz in care alegem −H egal cu reactia care stabilizeaza (problema de stabilizare pentru perechea (AT , C T )). Mai mult, daca perechea (C, A) este observabila, atunci spectrul matricii de stare J a estimatorului poate fi alocat arbitrar. CAPITOLUL 4: SINTEZA ELEMENTARA

244

Estimatori de Tip 1

In concluzie am obtinut pentru un estimator de tipul 1 urmatoarea constructie:


245

Estimatori de Tip 1

Pasul 1: Se foloseste procedura de alocare pentru perechea (AT , C T ) si se determina o matrice Fe a.i. (AT ) + (C T )Fe sa aibe spectrul dorit (un anumit spectru impus sau doar localizat in C− in functie de cerinta de proiectare). Pasul 2: Se calculeaza estimatorul cu parametrii H = −Fe T ,

rezultand

J = A − HC,

K = V = I,

M = B − HD,

w(t) ˙ = (A − HC)w(t) + Bu(t) − HDu(t) + Hy(t), x b(t) = w(t),

P = 0,

(149)

sau, sub forma echivalenta,

x b˙ = Ab x + Bu + L(C x b + Du − y)

(150)

in care este cunoscut sub numele de estimator Luenberger (am notat L := −H). CAPITOLUL 4: SINTEZA ELEMENTARA

246

Estimatori de Tip 1

Observatii: a) Pentru a construi un estimator Luenberger avem nevoie doar sa specificam spectrul estimatorului Λ0 si sa construim reactia L care aloca respectivii poli pentru estimator Λ(A + LC) = Λ0. Pentru ca estimatorul sa rezulte cu coeficienti reali, spectrul se alege intotdeauna simetric. b) Daca perechea (C, A) este observabila atunci spectrul matricii de stare a estimatorului poate fi alocat arbitrar si deci este posibil ca estimatorul sa furnizeze o estimatie cat de precisa a starii intr-un timp oricat de scurt ! c) Din (150) observam ca estimatorul “copiaza” dinamica sistemului original + termen proportional cu “inovatia” C x b + Du − y care de fapt masoara “calitatea” estimarii ! Pentru o estimare perfecta avem x b(t) = x(t) si deci inovatia este zero deoarece Cx b + Du − y = C x b − Cx = 0. d) Daca facem o transformare de similaritate asupra sistemului original estimatorul Luenberger se modifica corespunzator (Ex: aratati cum ! ) e) Pentru a construi estimatorul Luenberger singura conditie pe care am impus-o sistemului intitial este cea de detectabilitate (sau respectiv de observabilitate) asupra perechii (C, A). Conditia este nu numai suficienta pentru constructia unui CAPITOLUL 4: SINTEZA ELEMENTARA

247

Estimatori de Tip 1

estimator Luenberger ci si necesara asa cum vom vedea in continuare. Mai mult, conditia este necesara pentru existenta unui estimator general de tipul (146). f) Estimatorul de tipul 1 (Luenberger) are dimensiunea n si de aceea se mai numeste de ordin integ. Asa cum vom vedea, in anumite situatii se pot construi estimatori de ordin mai mic. Teorema 72. Fie sistemul (A, B, C, D) descris de (145). Atunci exista un estimator (146) daca si numai daca perechea (C, A) este detectabila. Daca (C, A) este detectabila atunci un estimator (de tip 1 sau Luenberger) este dat de ecuatille w˙ = (A + LC)w + Bu + LDu − Ly, (151) x b(t) = w(t) unde L este orice matrice a.i. Λ(A + LC) ⊂ C−.

Demonstrat¸ie. Partea de suficienta am aratat-o deja. Demonstram necesitatea prin reducere la absurd. Presupunem ca perechea (C, A) nu este detectabila si fara a restrange generalitatea presupunem deasemenea ca perechea (C, A) este in CAPITOLUL 4: SINTEZA ELEMENTARA

248

Estimatori de Tip 1

forma de descompunere observabila A=

A1 A3 O A2

,

C=

O C2

unde Λ(A1) 6⊂ C− (aceasta rezulta automat din testul PBH aplicat perechii nedetectabile (C, A)). Fie s+ 6∈ C− o valoare proprie si x+ un vector propriu corespunzator ale lui A1. Luam starea initiala x0 a sistemului (A, B, C, D) de forma x+ . xo = O

Evident xo apartine subspatiului neobservabil al perechii (C, A), i.e., x0 ∈ N (C, A). Deasemenea luam w(0) = 0 si u(t) ≡ 0. Atunci ecuatiile pentru x si estimatorul (146) sunt x˙ = Ax, w˙ = Jw + HCx, x b = Kw + N Cx. CAPITOLUL 4: SINTEZA ELEMENTARA

249

Estimatori de Tip 1

Deoarece x0 ∈ N (C, A) rezulta ca iesirea sistemului (A, B, C, D) este identic nula y(t) = Cx(t) = CeAtx0 = 0, ∀t ≥ 0, si deasemenea w(t) = 0, Pe de–alta parte, avem

x b(t) = 0,

∀t.

x(t) = eAtx0 = es+tx0 6→ 0 si deci x b(t) − x(t) 6→ 0 pentru comanda u ≡ 0, starea initiala a estimatorului w(0) = 0 si x0 aleasa ca mai sus ceea ce contrazice ipoteza ca (146) este un estimator pentru sistemul (A, B, C, D). Observatii: a) Dimensiunea unui estimator de tip Luenberger (de tip 1) este egala cu n (dimensiunea spatiului starilor sistemului orginal (A, B, C, D)). Asa cum vom vedea mai tarziu, in anumite situatii se pot construi estimatoare de dimensiune mai CAPITOLUL 4: SINTEZA ELEMENTARA

250

Estimatori de Tip 1

mica si se poate formula problema de constructie a unui estimator de dimensiune minimala (legata de teoria estimatoarelor de tipul 2). b) Am vazut ca un sistem poate fi stabilizat/alocat cu o reactie constanta dupa stare. Deoarece starea nu este in general cunoscuta am construit mai sus un sistem (numit estimator) care estimeaza asimptotic starea sistemului pe baza informatiilor furnizate de semnalele de intrare u si de iesire y. Intrebarea naturala este daca putem stabiliza/aloca sistemul original prin implementarea reactiei constante dupa starea estimata x b (in locul starii reale x care nu este accesibila) ? Raspunsul este pozitiv obtinandu-se compensatorul Kalman.


251

Estimatori de Tip 1

5. Compensatorul Kalman Fie (A, B, C, D) un sistem dinamic si presupunem pentru problema de stabilizare cu reactie dinamica dupa iesire ca (A, B) este stabilizabila si (C, A) este detectabila iar pentru problema cu alocare dinamica dupa iesire ca (A, B) este controlabila si (C, A) este observabila. Consideram un compensator cu reactie constanta F dupa starea estimata de catre un estimator Luenberger descris de ecuatiile (151). Obtinem atunci ecuatiile dinamice ale compensatorului – numit compensator Kalman – sau inca

x b˙ = (A + LC)b x + Bu + LDu − Ly, u = Fx b,

x b˙ = (A + LC + BF + LDF )b x − Ly, u = Fx b,


252

(152)

(153) Compensatorul Kalman

avand matricea de transfer AK BK A + LC + BF + LDF K(s) := = CK DK F

−L O

,

u = Ky.

Matricile F si L se aleg a.i. A + BF si A + LC sa fie asimptotic stabile (si eventual cu spectru impus). Conectand compensatorul Kalman in reactie inversa cu sistemul original obtinem pentru matricea de stare a sistemului rezultant in bucla inchisa AR =

A −LC

BF A + BF + LC

.

Aplicand transformarea de similaritate T := CAPITOLUL 4: SINTEZA ELEMENTARA

I −I

O I

253

Compensatorul Kalman

asupra lui AR obtinem T ART −1 =

A + BF O

BF A + LC

ceea ce arata ca dinamica (polii) sistemului in bucla inchisa satisfac Λ(AR) = Λ(A + BF ) ∪ Λ(A + LC) si deci sistemul in bucla inchisa este intern asimptotic stabil (si eventual are dinamica prescrisa). Observatii: a) Polii sistemului in bucla inchisa sunt dati de reuniunea polilor alocati ai lui A + BF prin reactia dupa stare F cu polii alocati de estimator Λ(A + LC) prin reactia L. Cele doua alocari se pot face independent, punandu-se astfel in evidenta celebrul principiu al separatiei. b) Un sistem este stabilizabil/alocabil prin reactie (dinamica) dupa iesire daca CAPITOLUL 4: SINTEZA ELEMENTARA

254


perechea (A, B) este stabilizabila/controlabila si perechea (C, A) este detectabila/observabila. Aceste conditii sunt nu numai suficiente ci si necesare asa cum reiese din urmatoarea teorema. Teorema 73. Un sistem (A, B, C, D) este stabilizabil/alocabil prin reactie dinamica dupa iesire daca si numai daca perechea (A, B) este stabilizabila/controlabila si perechea (C, A) este detectabila/observabila. Demonstrat¸ie. Suficienta a fost demonstrata constructiv mai sus. Ramane sa aratam necesitatea (Exercitiu !). Indicatie: Pp prin reducere la absurd ca nu este adevarat si puneti in evidenta printr-o descompunere controlabila/observabila anumiti poli ficsi ai sistemului rezultant (ce nu pot fi modificati indiferent de reactia dupa stare.


255


6. Estimatori de Stare de Ordin Redus (Tip 2)

Fie un sistem (A, B, C, D) cu m intrari, p iesiri si ordinul n (dimensiunea spatiului starilor). Daca dorim estimarea starii acestui sistem nu este nevoie sa construim un estimator care sa estimeze direct toate cele n stari intrucat o parte dintre acestea rezulta automat pe baza iesirilor. Intr–adevar, sa presupunem ca C are rangul egal cu numarul de iesiri p. Atunci cunoscand iesirea y(t) si estimand numai n − p stari rezulta ca celelate p stari se pot calcula din ecuatiile corespunzatoare ale iesirii. Un astfel de estimator de ordin redus se numeste estimator de tipul 2. Pentru constructia estimatorului de tipul 2 facem ipotezele: i) Matricea C este epica, i.e., rank C = p; ii) Matricea C are forma C = O Ip .

(154)

Observatii: a) Ipoteza i) nu constituie o restrictie majora intrucat o putem asigura in etapa de modelare printr-o alegere judicioasa a iesirilor sistemului. In cazul in CAPITOLUL 4: SINTEZA ELEMENTARA

256

Estimatori de Ordin Redus

care prin modelare nu s-a asigurat indeplinirea ei se poate face o schimbare de variabile in spatiul marimilor de iesire punandu–se in evidenta anumite iesiri identic zero sau redundante ce pot fi eliminate ramanand o matrice C ce satisface ipoteza. b) Ipoteza ii) se poate asigura printr–o simpla transformare de coordonate in spatiul starilor (presupunand evident ipoteza i) adevarata) ! c) Rationand prin dualitate, in anumite circumstante matricea intrarilor B se poate Im presupune monica si de forma . O d) Ipotezele i) si ii) implica ca y = Cx + Du =

O Ip

x1 x2

+ Du = x2 + Du

deci starile x2 – in numar de p – sunt automat cunoscute (prin cunoasterea intrarilor si iesirilor) si raman de estimat starile x1 – in numar de n − p. Asa cum am vazut, pentru constructia unui estimator general (146) trebuie sa CAPITOLUL 4: SINTEZA ELEMENTARA

257


satisfacem relatiile

Λ(J) ⊂ C−, JV + HC − V A = 0, KV + N C − I = 0,

(celelalte relatii fiind automat satisfacute prin alegerea lui P si M ). Pentru a explicita aceste relatii, partitionam matricile A, B, V , K, N conform cu C in (154), A=

A1 A3 A2 A4

,B =

B1 B2

,V =

V1 V2

,K =

K1 K2

,N =

N1 N2

si obtinem V1A1 + V2A2 = JV1,

V1 A3 + V2A4 = JV2 + H,

K1V1 = I, K1V2 + N1 = 0, K2V1 = 0, K2V2 + N2 = I. Alegem K1 := V1 := I si rezulta automat K2 = 0, N2 = I, N1 = −V2 ceea ce CAPITOLUL 4: SINTEZA ELEMENTARA

258


determina complet matricile K si N , ramanand de satisfacut doar conditiile A1 + V2A2 = J,

Λ(J) ⊂ C−,

H = A3 + V2A4 − (A1 + V2 A2)V2 .

(155)

Daca perechea (A1, A2) este detectabila (observabila) atunci putem alege automat V2 := L unde L este reactia care aloca Λ(A1 + LA2) ⊂ C− iar H se defineste pe baza ultimei ecuatii din (155). Ramane sa aratam ca perechea (A1, A2) este detectabila daca sunt indeplinite conditiile de existenta ale unui estimator general, i.e. perechea (C, A) este detectabila. Formulam acest rezultat sub forma unei propozitii de sine statatoare. Teorema 74. Fie un sistem (A, B, C, D) avand matricea C epica. i) Exista o transformare de coordonate a.i. T AT −1 =


A1 A3 A2 A4 |{z} |{z} n−p p

}n − p }p

259

,


TB =

B1 B2

}n − p , }p

CT

−1

=

O Ip , |{z} |{z} n−p p

(156)

ii) Perechea (A2, A1) este detectabila (observabila) daca si numai daca perechea (C, A) este detectabila (observabila). Demonstrat¸ie. i) Intrucat C este epica de dimensiune p × n, exista o matrice C de dimensiune (n − p) × n a. i. matricea T :=

C C

sa fie inversabila. Avem evident CAPITOLUL 4: SINTEZA ELEMENTARA

C C

T −1 =

In−p O O Ip 260


de unde concluzionam ca CT −1 are forma din (156). ii) Avem succesiv

rank

sI − A C

= rank

T (sI − A)T −1 CT −1

= p + rank

sI − A1 A2





sI − A1 −A3 sI − A4  = rank  −A2 O Ip

,

∀s ∈ C

de unde concluzia rezulta direct din criteriul Hautus de detectabilitate (observabilitate).

In concluzie am obtinut pentru un estimator de tipul 2 urmatoarea constructie: Pasul 0: Dandu-se sistemul (A, B, C, D) cu perechea (C, A) detectabila (observabila) si matricea C epica, se gaseste cf. Teoremei 74 o transformare de similaritate CAPITOLUL 4: SINTEZA ELEMENTARA

261


T a.i. in noul sistem de coordonate sa avem (refolosind notatiile)

A1 A2 |{z} n−p B1 }n − p B= B2 }p A=

A3 A4 |{z} p

,

}n − p }p

C=

(157)

,

O Ip , |{z} |{z} n−p p

in care perechea (A2, A1) este detectabila (observabila). Pasul 1: Se foloseste procedura de alocare pentru perechea (A2, A1) si se determina o matrice V2 a.i. A1 + V2A2 sa aibe spectrul dorit (un anumit spectru impus sau doar localizat in C− in functie de cerinta de proiectare). Pasul 2: Se calculeaza estimatorul cu parametrii J = A1 + V2A2,

H = A3 + V2A4 − A1V2 − V2A2V2,


262

M = B1 + V2B2 − HD, Estimatori de Ordin Redus

K=

In−p O

rezultand  

,

N=

−V2 Ip

,

V =

In−p V2

,

P =

V2 D −D

w(t) ˙ = (A1 + V2A2)w(t) + Hy(t) + (B1 + V2B2 − HD)u(t), In−p −V2 V2D x b1 (t) = w(t) + y(t) + u(t). b(t) =  x x b2 (t) O Ip −D (158) Pasul 3: Se “reverseaza” corespunzator transformarea de similaritate asupra estimatorului, obtinandu-se in final un estimator de tip 2 pentru sistemul original. Observatii: a) Estimatorul de tip 2 obtinut are ordinul egal cu n − p (dimensiunea spatiului starii w(t)). b) Ecuatia iesirii pentru estimatorul de tip 2 (158) contine o parte de dimensiune n − p ce este estimata prin intermediul dinamicii w(t) de forma

x b1(t) = w(t) − V2y(t) + V2Du(t)


263


si o parte ce este deja cunoscuta de dimensiune p (nu se estimeaza prin intermediul dinamicii) de forma x b2(t) = y(t) − Du(t).

De obicei in ecuatiile dinamice ale estimatorului de tip 2 se pastreaza numai prima parte (b x1(t)). c) Din cele de mai sus rezulta ca in ipoteza (C, A) detectabila si C epica putem intotdeauna construi un estimator de ordin n − p (dimensiunea matricii J). Problema naturala care se pune este daca pe baza acestui estimator putem construi in continuare un compensator care stabilizeaza intern – exact cum am facut in cazul estimatorului de tip 1 obtinand compensatorul Kalman. Interpretarea Estimatorului de Tip 2 (Ordin Redus) Estimatorul de tip 2 poate fi obtinut si prin scrierea directa a unui estimator de tip 1 pentru partea starii ce trebuie efectiv estimata. Intr–adevar, cu notatiile deja introduse avem ca sistemul original este descris de ecuatiile (pentru simplificarea CAPITOLUL 4: SINTEZA ELEMENTARA

264


calculelor facem ipoteza D = 0) x˙ 1 = A1x1 + A3x2 + B1u, x˙ 2 = A2x1 + A4x2 + B2u, y = x2

(159)

si inlocuind ultima ecuatie in precedentele doua avem x˙ 1 x˙ 2 = y˙

= A1x1 + A3y + B1u, = A2x1 + A4y + B2u,

sau inca x˙ 1 = A1x1 + A3y + B1u, y˙ − A4y − B2u = A2x1,

(160)

care este un sistem cu dinamica x1 ce se doreste estimata si intrarile u si y. CAPITOLUL 4: SINTEZA ELEMENTARA

265


Reamintim ca un estimator de tip 1 se poate pune sub forma x b˙ = Ab x +Bu+L(C x b +Du−y) = Ab x +Bu+L×“EROAREA DE ESTIMARE”. (161) Scriind un astfel de estimator pentru sistemul (160) obtinem b1 − y˙ + A4y + B2u). x b˙1 = A1xb1 + A3y + B1u + L(A2x

(162)

Eliminam y˙ facand schimbarea de variabile x b1 = w − Ly si notam V2 := L. Obtinem echivalent w˙ − V2y˙ = A1(w − V y) + A3 y + B1u + V2(A2(w − V2 y) − y˙ + A4y + B2u) (163) sau inca w˙ = (A1 + V2 A2)w + (−A1V2 + A3 − V2A2V2 + V2A4)y + (B1 + V2B2)u. (164) CAPITOLUL 4: SINTEZA ELEMENTARA

266


Din ultima ecuatie din (159) obtinem

x b1 x b2

=

In−p O

w+

−V2 Ip

y.

(165)

Comparand ecuatille (164), (165) cu ecuatille (158) observam ca acestea coincid in ipoteza facuta D = 0. In consecinta am reobtinut expresia estimatorului de tip 2 scriind un estimator de tip 1 pentru susbsisemul cu dinamica ce trebuie efectiv estimata x1 ! Exercitiu: Aratati acelasi lucru fara a face ipoteza D = 0 ! Stabilizarea cu Estimatoare Generale Am vazut ca daca folosim o schema de compensare cu reactie constanta F dupa starea estimata printr-un estimator de tip 1 se obtine un compensator Kalman care stabilizeaza intern sistemul si eventual aloca o dinamica dorita. Aratam in continuare ca o schema similara in care insa estimarea se face cu un estimator general se poate deasemenea folosi pentru stabilizare/alocare. CAPITOLUL 4: SINTEZA ELEMENTARA

267


In particular, in cazul in care estimarea se face cu un estimator de ordin redus (de tipul 2) sistemul rezultant va avea dimensiunea spatiului starilor de dimensiune redusa (< 2n). Fie un sistem

x˙ = Ax + Bu, y = Cx + Du,

(166)

si un estimator general descris de ecuatiile

w˙ = Jw + Hy + M u, x b = Kw + N y + P u,

(167)

ce satisface automat conditiile: a) J asimptotic stabila; b) JV + HC − V A = 0; c) M − V B + HD = 0; d) KV + N C − I = 0; CAPITOLUL 4: SINTEZA ELEMENTARA

268


e) P + N D = 0.

Consideram o schema de compensare cu reactie constanta F dupa starea estimata x b, i.e., u = Fx b.

(168)

N y + P u = N Cx + N Du − N Du = N Cx,

(169)

Studiem comportarea dinamica in bucla inchisa a sistemului descris de (166), (167) si (168). Evaluam intai

unde am folosit proprietatea e). Avem succesiv x˙ = Ax + Bu = Ax + BF x b = Ax + BF (Kw + N y + P u) = Ax + BF Kw + BF N Cx = (A + BF N C)x + BF Kw CAPITOLUL 4: SINTEZA ELEMENTARA

269

(170)


in care am folosit (169). Pentru dinamica w obtinem w˙ = Jw + Hy + M u = Jw + HCx + HDu + M F (Kw + N Cx) = (HC + M F N C)x + (J + M F K)w + HDu

(171)

in care am folosit succesiv (168) si (169). Evaluam separat HDu = HDF x b = HDF (Kw + N Cx) = HDF N Cx + HDF Kw

pe care il inlocuim in (171) obtinand

w˙ = (HC + M F N C + HDF N C)x + (J + M F K + HDF K)w.

(172)

Din (170) si (172) avem ca dinamica sistemului rezultant este data de ˙ x A + BF N C = w HC + (M + HD)F N C CAPITOLUL 4: SINTEZA ELEMENTARA

BF K J + (M + HD)F K 270

x w


si deci matricea de stare a sistemului rezultant este A + BF N C BF K AR = HC + V BF N C J + V BF K in care am folosit proprietatea c). Pentru a pune in evidenta spectrul acestei matrici facem o transformare de coordonate I O T = −V I si obtinem T ART −1 =

A + BF N C + BF KV −V A + HC + JV

BF K J

=

A + BF O

BF K J

,

unde pentru ultima egalitate am folosit proprietatile d) si b). Din relatia de mai sus concluzionam ca Λ(AR) = Λ(A + BF ) ∪ Λ(J) CAPITOLUL 4: SINTEZA ELEMENTARA

271


si deci Λ(AR) ⊂ C− daca alegem F a.i. Λ(A + BF ) ⊂ C−. Observatii: a) Daca (A, B) controlabila atunci putem aloca orice spectru pentru A + BF si daca (C, A) observabila atunci putem aloca orice spectru pentru estimator Λ(J) rezultand ca putem aloca orice dinamica pentru sistemul rezultant in bucla inchisa. b) Ordinul sistemului rezultant este n + ne unde ne este ordinul estimatorului.


272


7. Reglarea Sistemelor Dinamice Problematica, Ipoteze In aceasta sectiune abordam problema reglarii sistemelor dinamice. Problema clasica de reglare intern stabila consta in gasirea unui regulator care sa realizeze simultan urmatoarele deziderate asupra sistemului rezultant in bucla inchisa: (S) Sa fie intern asimptotic stabil; (Re) Sa urmareasca (macar) asimptotic anumite semnale (sau clase de semnale) prescrise numite referinte r; (Rj) Sa rejecteze (macar) asimptotic anumite perturbatii d sau zgomote w; (FIG). Solutia generala a problemei de reglare intern stabila are o serie de inconveniente majore: CAPITOLUL 4: SINTEZA ELEMENTARA

273

Reglarea Sistemelor Dinamice

(i) Este foarte complicata; (ii) Este bazata pe geometria interna a sistemului original si pe o serie de descompuneri structurale sofisticate in spatiul starilor; (iii) Conditiile de solvabilitate sunt in general greu de verificat dpdv procedural; (iv) Solutia generala este complet nerobusta in raport cu perturbatiile parametrice sau structurale ale modelului (A, B, C, D) limitand major aplicabilitatea metodelor la cazul sistemelor cu dimensiuni medii sau relativ mari. In continuare vom prezenta solutia in anumite cazuri particulare insa de mare interes practic in care neajunsurile de mai sus sunt partial eliminate prin ipotezele facute. Ne restrangem la prezentarea unei solutii in caz particular deoarece: • Efortul de a prezenta/intelege solutia completa (in intreaga ei complexitate) nu se justifica in general in raport cu clasa aplicatiilor concrete ”real–life”; CAPITOLUL 4: SINTEZA ELEMENTARA

274


• Solutia generala este nerobusta; • Exista abordari alternative bazate pe teoria sistemelor robuste ce furnizeaza solutii mult mai fezabile; Ipotezele pe care le facem sunt: (I1) d = 0 (nu apar perturbatii); (I2) w = 0 (nu apar zgomote); (I3) D = 0 (ipoteza facuta ptr. simplificarea calculelor); (I4) r(t) = 1(t) (referintele sunt semnale de tip treapta). Conditiile de reglare asimpotic stabila CAPITOLUL 4: SINTEZA ELEMENTARA

275


Incepem prin a explicita conditiile pe care trebuie sa le indeplineasca sistemul in bucla inchisa pentru a realiza dezideratele (S) si (Re) sub ipotezele (I1)-(I3). In final, vom introduce principiul modelului intern pentru sistemele descrise pe spatiul starilor si vom particulariza constructia efectiva a unui regulator in ipoteza (I4) – care realizeaza urmarirea asimptotica a unor referinte de tip treapta –. PROBLEMA: Dandu–se sistemul dinamic x˙ = Ax + Bu y = Cx

(173)

avand m intrari, p iesiri si dimensiunea spatiului starilor n, si vectorul de semnale de referinta r(t) ∈ Rp, se cere un sistem dinamic (regulator) x˙ K u

= AK xK + BK ǫ = CK xK + DK ǫ,

(174)

in care ǫ = r − y, astfel incat sa aibe loc: CAPITOLUL 4: SINTEZA ELEMENTARA

276


(S) Sistemul in bucla inchisa sa fie intern asimptotic stabil; (Re) Iesirile y sa urmareasca asimptotic referintele r(t), i.e., lim ǫ(t) = 0.

t→∞

Clasa semnalelor referinta se considera de tip persistent generate de un generator liniar de semnal (de tipul celor introduse la studiul regimului permanent/tranzitoriu) x˙ r r

= Ar xr = Cr xr .

Λ(Ar ) ⊂ C− ∪ C0

xr (0) = xro,

(175)

Referintele vor avea atunci expresia r(t) = Cr eAr txro. CAPITOLUL 4: SINTEZA ELEMENTARA

277


Eliminand succesiv semnalele din bucla si tinand cont ca ǫ = r − y = r − Cx obtinem x˙ K = AK xK + BK r − BK Cx (176) u = CK xK + DK r − DK Cx. Inlocuind ultima ecuatie in x˙ = Ax + Bu obtinem succesiv x˙ = Ax + B(CK xK + DK r − DK Cx) = (A − BDK C)x + BCK xK + BDK r si deci pentru sistemul in bucla inchisa obtinem ecuatiile dinamice ˙ x A − BDK C BCK x BDK = + r xK −BK C AK xK BK x −C O + Ip r ǫ = x K x C O y = xK CAPITOLUL 4: SINTEZA ELEMENTARA

278

(177)


sau x˙ R = AR xR + BRr ǫ = CR xR + DRr,

(178)

unde

AR =

A − BDK C −BK C

BCK AK

, BR =

BDK BK

, CR =

−C

O

, D R = Ip , (179)

Conditia (S) de stabilitate interna devine atunci Λ(AR) ⊂ C− si explicitam in continuare conditia de reglare (Re). Combinand ecuatiile sistemului in bucla inchisa (178) cu cele ale generatorului de semnale de referinta (175) CAPITOLUL 4: SINTEZA ELEMENTARA

279


xR

obtinem ˙ xR AR BRCr xR = , xr O Ar x r xR CR Cr ǫ = xr

xR (0) = xRo,

xr (0) = xro, (180)

sau

x˙ Rr = ARr xRr , xRr (0) = xRro, ǫ = CRr xRr unde am folosit notatiile AR BRCr xR ARr = , CRr = CR Cr , xRr = , O Ar xr

(181)

xRo xRro = xro (182)

Conditia de reglare (Re) lim ǫ(t) = 0,

t→∞ CAPITOLUL 4: SINTEZA ELEMENTARA

∀ 280

xRro Reglarea Sistemelor Dinamice

devine atunci lim CRr eARr txRro = 0,

∀

t→∞

xRro.

(183)

Observatie fundamentala: Aceasta cerinta nu poate fi realizata prin impunerea conditiei ca matricea de stare ARr sa fie intern asimptotic stabila deoarece ARr contine valori proprii care sunt sigur in C+ ∪ C0 (semnalul r a fost presupus persistent)! Singura posibilitate pentru a satisface conditia de (Re) ramane sa impunem ca dinamica care nu este stabila sa fie neobservabila in raport cu perechea (CRr , ARr ) si acest lucru sa-l satisfacem prin alegerea judicioasa a parametrilor regulatorului ce se regasesc implicit in parametrii sistemului rezultant (AR , BR, CR, DR) ! In consecinta conditia de reglare implica satisfacerea anumitor proprietati structurale relativ sofisticate in spatiul starilor sistemului rezultant ! Pentru a satisface conditia (Re) trebuie sa impunem deci conditia ca subspatiul invariant asociat dinamicii Ar sa fie neobservabil in perechea (CRr , ARr ) explicitata in (182). O baza pentru subspatiul invariant corespunzator lui Ar – notat V+ are CAPITOLUL 4: SINTEZA ELEMENTARA

281


evident expresia

V I nr unde V este o matrice ce se determina din conditia ca V+ sa fie neobservabil. Facand o completare pana la o transformare inversabila obtinem V+ =

S=

I nR O

V I nr

de unde S

−1

ARr S =

AR ARV + BRCr − V Ar O CR V + Cr

,

CRr S =

CR CRV + Cr

iar in noul sistem de coordonate avem O V+ = . I nr CAPITOLUL 4: SINTEZA ELEMENTARA

282


Din conditia ca V+ este ARr invariant si inclus in Ker CRr se obtin conditiile AR V + BRCr − V Ar = 0,

CR V + Cr = 0.

(184)

Deci existenta unei matrici V care satisface relatiile (184) este echivalenta cu satisfacerea cerintei de reglare (Re) explicitata sub forma (183). Observatie: Prima conditie (184) este o ecuatie Sylvester ce are intotdeauna o solutie unica deoarece Λ(AR) ⊂ C− si Λ(Ar ) ⊂ C+ ∪ C0 (Explicati acest lucru pe baza conditiilor generale de existenta/unicitate a solutiilor ecuatiilor Sylvester – vezi Appendix). In concluzie am redus problema originala de reglare intern asimptotic stabila la gasirea unui sistem (AK , BK , CK , DK ) a.i. : (S) Λ(AR) ⊂ C−; (Re) Solutia unica V a ecuatiei Sylvester AR V + BRCr − V Ar = 0 sa satisfaca CRV + Cr = 0. CAPITOLUL 4: SINTEZA ELEMENTARA

283


Observatie: Tinand cont de expresiile explicite ale matricilor sistemului in bucla inchisa (AR , BR, CR, DR) ca functii de parametrii regulatorului (AK , BK , CK , DK ) (vezi (179)) este clar ca aceste conditii algebrice nu sunt deloc triviale sau usor de explicitat intr-o forma procedurala. De aceea ne vom limita la prezentarea cazului reprezentativ al referintelor de tip treapta. Reglarea la Referinte Treapta Fie sistemul (A, B, C, D = 0) avand matricea de transfer T (s) si y = T u. Facem ipotezele ca (A, B) este stabilizabila si (C, A) este detectabila, conditii ce sunt necesare si suficiente pentru existenta unui compensator stabilizator. Considerand o schema clasica de reglare cu regulatorul K(s) montat pe calea directa intre eroare ǫ := r − y si comanda u, i.e., u = Kǫ. Conform principiului modelului intern, pentru a regla la referinte de tip treapta trebuie ca modelul referintei M (s) sa fie inclus in matricea de transfer in bucla deschisa, in cazul nostru L(s) := T (s)K(s). Mai exact, cum T (s) este dat, CAPITOLUL 4: SINTEZA ELEMENTARA

284


impunem ca modelul referintei sa fie inclus in e K(s) = K(s)M (s)

(185)

unde M (s) este matricea de transfer a modelului referintei. Aceasta conditie asigura automat cerinta de reglare (Re). Daca consideram reglarea la referinta treapta atunci 1 M (s) = Ip. s Pentru a asigura cerinta (S) trebuie ca regulatorul K(s) sa stabilizeze intern T (s) e sau, echivalent, ca K(s) sa stabilizeze intern Te(s) = M (s)T (s) (FIG) – K(s) are o parte fixata R(s) pe care o includem in Te(s) –. In consecinta proiectam e un compensator stabilizator K(s) pentru Te(s) dupa care regulatorul dorit se calculeaza din (185). Explicitam in continuare aceste conditii in termenii ecuatiilor dinamice de stare. CAPITOLUL 4: SINTEZA ELEMENTARA

285


Fie

x˙ M ye

sau inca

= AM xM + BM ǫ = CM xM + DM ǫ

(186)

x˙ M = AM xM + BM (r − Cx) ye = CM xM + DM (r − Cx) ecuatiile ce descriu dinamica modelului referintei si

(187)

x˙ = Ax + Bu, y = Cx, ecuatiile ce descriu sistemul. O realizare de stare pentru sistemul Te cu ye = Teu se obtine automat inseriind T (s) cu M (s) (semnalul exogen r = 0) Te =

"


e B e A e D e C

#



A =  −BM C O 286

O AM CM



B O . O

(188)


Deci problema s-a redus la constructia unui compensator pentru Te dat de (188).

In cazul particular in care dorim reglarea la referinte de tip treapta avem AM = 0, BM = Ip, CM = Ip, DM = 0 si (188) devine

Te =

"

e B e A e D e C

#



A =  −C O



O B O O . Ip O

(189)

Pentru scrierea unui compensator stabilizator pentru Te putem aplica schema standard de scriere a unui compensator Kalman (sau orice schema de stabilizare e este cu estimator de stare si reactie dupa starea estimata). Intrucat matricea C epica preferam sa scriem un estimator de ordin redus si sa luam o reactie dupa starea estimata obtinand in final un sistem compensator de ordin mai mic decat Te(s) (si de acelasi ordin cu T (s)). Pentru scrierea unui estimator de ordin redus folosim direct formulele (158) CAPITOLUL 4: SINTEZA ELEMENTARA

287


observand in prealabil ca realizarea (189) este in forma (157) si facand identificarile

e= A

A −C

O O

=

A1 A3 A2 A4

e= ,B

B O

=

B1 B2

e= ,C

O Ip

.

Conditia necesara si suficienta pentru existenta unui estimator este ca perechea (A2, A1) = (−C, A) sa fie detectabila ceea ce este automat asigurat in ipotezele de e = −L a.i. Λ(A + LC) = Λ(A − LC) e ⊂ C−. lucru ((C, A) este detectabila). Fie L Obtinem pentru ecuatiile estimatorului de ordin redus  

b=  x

w (A + LC)w y + Bu, ˙ = + (A + LC)Le In−p L x b1 = w+ ye. x b2 O Ip

(190)

Un compensator stabilizator se obtine atunci luand o reactie stabilizanta dupa CAPITOLUL 4: SINTEZA ELEMENTARA

288


starea estimata de forma h u= F

i x b1 = F (w + Le y ) + Feye. Fe x b2

(191)

e B) e este O astfel de reactie stabilizanta exista daca si numai daca perechea (A, stabilizabila. Acest lucru nu este insa automat indeplinit decat daca facem ipoteza ca modelul referintei (polii s = 0) nu este simplificat de modelul sistemului T (s) ! (Ex: faceti conexiunea cu sistemele SISO – trebuie ca diag { 1s } sa apara in fctia de transfer in bucla deschisa si deci nu trebuie sa se simplifice in produsul L = T K –. O conditie suficienta ca sa nu apara aceasta simplificare este ca sistemul T sa nu aibe zerouri in s = 0 ceea ce este asigurat de impunerea conditiei −A −B = n + p. (192) rank C O e B) e este stabilizabila Intr-adevar, daca (A, B) stabilizabila si are loc (192) atunci (A, (Ex: Demonstrati acest lucru folosind criteriul PBH). CAPITOLUL 4: SINTEZA ELEMENTARA

289


Deci in ipotezele (A, B) stabilizabila, (C, A) detectabila si (192) exista un compensator stabilizator care se obtine luand o reactie dupa starea estimata prin intermediul unui estimator de ordin redus pentru sistemul Te. Ecuatiile compensatorului sunt w˙ x b1 x b2 u

= = = =

(A + LC)w + (A + LC)Le y + Bu w + Le y ye F (w + Le y ) + Fe ye

(193)

sau eliminand w prin inlocuire din a doua ecuatie si inlocuind u in prima ecuatie obtinem x b˙1 = (A + LC + BF )b x1 + +B Fe x b2 + Lǫ x b˙2 = ǫ e2 u = Fx b1 + Fe x

(194)

unde am tinut cont ca ye = x b2 si x b˙2 = ǫ. Deci un compensator stabilizator pentru CAPITOLUL 4: SINTEZA ELEMENTARA

290


T (s) este dat de

K(s) =

AK CK

BK DK



A + LC + BF  O = F



B Fe L I  O . Fe O

(195)

A ramas de verificat ca intr–adevar acest compensator (regulator) asigura de fapt reglarea. Acest lucru se arata verificand conditiile de reglare (184) ARV + BRCr − V Ar = 0,

CRV + Cr = 0

in care Ar = O, Cr = I. Aceasta este echivalent cu a arata ca solutia ecuatiei ARV = −BR verifica CRV = −Ip. Inlocuind expresiile lui AR , BR si CR cu datele obtinute CAPITOLUL 4: SINTEZA ELEMENTARA

291


rezulta dupa partitionarea corespunzatoare a lui V

(AR V =)



A   −LC −C

BF A + BF + LC O



   e BF O V1  B Fe   V2  =  −L  V3 −Ip O

si



(= −BR) (196)



V1 −C O O  V2  = −Ip. (CR V =) (197) V3 Inspectand ultima relatie observam ca este identica cu ultima ecuatie din (196) si deci daca V verifica (196) atunci automat verifica si (197). In final, V exista si este unic intrucat AR este inversabila (Λ(AR) ⊂ C− asa cum rezulta din teoria stabilizarii cu compensatoare de ordin redus).

Procedura de reglare la referinta treapta cu compensare asimptotic intern stabila – Exercitiu – CAPITOLUL 4: SINTEZA ELEMENTARA

292


ANEXA: COMPLEMENTE DE ALGEBRA LINIARA 1. Forma Canonica Jordan si Notiuni Conexe 2. Aspecte Geometrice in Algebra Liniara Finit Dimensionala 3. Ecuatii Matriciale Liniare

COMPLEMENTE DE ALGEBRA LINIARA

293


1. Forma Canonica Jordan si Notiuni Conexe In aceasta parte a Anexei prezentam cateva rezultate de teoria operatorilor liniari pe spatii finit dimensionale. Punctul de vedere este axat pe reprezentarea matriciala (intr-o baza fixata) a aplicatiei liniare. In principal vom da rezultate privind valorile proprii, vectorii proprii, spatii invariante si forme canonice Jordan. Fie C si R multimea numerelor complexe si respectiv reale. Notam cu Rn spatiul vectorial n–dimensional cu elemente in R (vectorii sunt considerati prin conventie intotdeauna de tip coloana) si fie Rp×m multimea matricilor de dimensiune p × m cu elemente in R (prin simpla inlocuire a lui R cu C vom folosi notatii similare pentru cazul elementelor complexe). Notam R sau C cu F. Fie N ∈ Fn×n. N reprezinta in mod natural o transformare liniara din Fn in Fn. Problema rezolvarii ecuatiei polinomiale de grad n χ(s) := det(sIn − N ) = 0 COMPLEMENTE DE ALGEBRA LINIARA

294

(198) Forma Canonica Jordan si Notiuni Conexe

in necunoscuta s ∈ C se numeste problema de valori proprii iar χ(s) se numeste polinom caracteristic al matricii N . Din teorema fundamentala a algebrei aceasta ecuatie are intotdeauna n radacini complexe (eventual care coincid) care se numesc valori proprii ale lui N . Setul celor n valori proprii se numeste spectrul lui N si se noteaza cu Λ(N ). Daca s0 este o valoare proprie a lui N , atunci exista intotdeauna un vector nenul x ∈ Cn – numit vector propriu al lui N – astfel incat N x = s0x. Daca s0 = 0 este o valoare proprie a lui N atunci N se numeste singulara. O matrice nesingulara are o inversa si se numeste inversabila. Mai exact, daca N ∈ Fn×n este nensingulara, atunci exista o matrice unica in Fn×n, numita inversa lui N si notata N −1 , a.i. N −1N = N N −1 = In (matricea identitate). Pe multimea matricilor n × n introducem relatia de echivalenta numita similaritate. e ∈ Fn×n s.n. similare daca exista o matrice inversabila Doua matrici N, N T ∈ Fn×n a. i. e. T N T −1 = N (199)

T se asociaza cu o schimbare de baza in Fn. Astfel orice x ∈ Fn se transforma e reprezinta aceeasi transformare liniara din Fn in Fn in x e = T x, iar N si N COMPLEMENTE DE ALGEBRA LINIARA

295

Forma Canonica Jordan si Notiuni Conexe

reprezentata in doua baze diferite. Forma Canonica Jordan Prezentam in continuare forma canonica Jordan indusa de transformarile de similaritate. Forma canonica Jordan complexa Transformarea de similaritate (199) induce o forma canonica pe multimea matricilor de dimensiune n × n cu elemente in C numita forma canonica Jordan complexa. Fie N ∈ Cn×n si fie {s1, s2, . . . , sk } multimea celor k valori proprii distincte ale lui N . Atunci exista intotdeauna o transformare inversabila T ∈ Cn×n a.i. T N T −1 = NJ

(200)

NJ := diag (N11(s1), N22(s2), . . . , Nkk (sk )),

(201)

unde


296


Nii(si) := diag (Js(i) (si), Js(i) (si), . . . , Js(i) (si)), 1

2

(202)

hi

si Js(si) este o s × s matrice elementara de forma 



si 1  si . . .  . . . 1 , Js(si) :=  si

(203)

numita bloc elementar Jordan. Multimea de valori proprii distincte {s1, s2, . . . , sk } impreuna cu multimea indicilor (i) {sj , i = 1, . . . , k, j = 1, . . . , hi} determina complet forma canonica Jordan (pana la o permutare a blocurilor pe diagonala principala). Pentru o valoare (i) proprie si, dimensiunile blocurilor sj , (j = 1, . . . , hi) se numesc indici Jordan elementari (sau multiplicitati partiale ) ale valorii proprii si. Intregii pozitivi hi (i) (i) se numesc multiplicitati geometrice a lui si. Suma ni = s1 + · · · + shi se COMPLEMENTE DE ALGEBRA LINIARA

297


numeste multiplicitate algebrica a lui si si este multiplicitatea lui si ca radacina a polinomului caracteristic.


298


Forma canonica Jordan reala Fie N o matrice cu elemente reale. O matrice N ∈ Rn×n nu are intotdeauna n valori proprii reale dar are intotdeauna n valori proprii complexe. Valorile proprii care nu sunt reale sunt prezente in perechi complex conjugate. Aceasta face ca studiul formelor canonice sub transformari de similaritate avand elemente reale sa fie oarecum diferit. Fie {s1, s2, . . . , sr , sr+1, . . . , sk , sr+1, . . . , sk } spectrul lui N , unde s1, . . . , sr , sunt valorile proprii reale si sr+1, . . . , sk , sr+1, . . . , sk , sunt valorile proprii care nu sunt reale si apar in perechi complex conjugate. Astfel daca restrangem clasa transformarilor de similaritate T exclusiv la cele cu elemente reale obtinem forma canonica Jordan reala NJ a lui N , unde NJ are forma din (201), Nii(si) are forma (202)–(203) pentru valorile proprii reale si (i = 1, . . . , r) in timp ce pentru valorile proprii care nu sunt reale si = αi + jβi COMPLEMENTE DE ALGEBRA LINIARA

299


(αi, βi ∈ R, βi 6= 0, i = r + 1, . . . , k), avem Nii(si) := diag (Js(i) (αi, βi), Js(i) (αi, βi), . . . , Js(i) (αi, βi)), 1

2

(204)

hi

unde Js(αi, βi) este o 2s × 2s matrice elementara de forma 

K(αi, βi)

  Js(αi, βi) :=  

I2 K(αi, βi)

I2 K(αi, βi) . . . ...

 I2 K(αi, βi)

   

(205)

numita bloc Jordan elementar real, unde K(αi , βi ) := COMPLEMENTE DE ALGEBRA LINIARA

αi βi −βi αi 300

. Forma Canonica Jordan si Notiuni Conexe

Observatie: Orice doua matrici similare au aceeasi forma Jordan (si deci acelasi spectru si indici Jordan elementari). Subspatiu Invariant al unei Matrici Patrate Definitia 75. Fie A ∈ Fn×n. Subspatiul vectorial V ⊂ Fn se numeste subspatiu invariant al lui A daca AV ⊂ V. (206)

Cel mai simplu exemplu de spatiu invariant sunt vectorii proprii. Este usor de verificat ca daca V este un subspatiu invariant de dimensiune ℓ, atunci exista o transformare de similaritate U , partitionata U


=

U1

U2

|{z} |{z} ℓ n−ℓ 301

,

(207)


cu V = Im U1, astfel incat U

−1

AU

=

A11 A12 O A22 | {z } |{z} ℓ n−ℓ

}ℓ }n − ℓ

(208)

si Λ(A) = Λ(A11)∪Λ(A22). In acest nou sistem de coordonate V este reprezentata prin Iℓ V = Im . (209) O

Matricea A restrictionata la subspatiul (invariant) V si spectrul ei restrictionat la subspatiul (invariant) V se definesc prin A|V := A11, Λ(A)|V := Λ(A11). COMPLEMENTE DE ALGEBRA LINIARA

302


Reciproc, daca (208) este adevarata pentru o matrice nesingulara U ca in (207), atunci V = Im U1 este un subspatiu invariant a lui A si Λ(A)|V = A11. Consideram o a partitie a planului complex in doua submultimi disjuncte C = Cg ∪ Cb. Un subspatiu invariant V se numeste Cg –invariant daca Λ(A)|V ⊂ Cg . Daca Λ1 ∪ Λ2 = Λ(A) este o partitie a spectrului lui A ∈ Fn×n atunci exista un susbaptiu invariant V a lui A astfel incat Λ(A)|V = Λ1. Acest lucru rezulta din forma canonica Jordan. Daca A are elemente reale si Λ1 este un set simetric (in raport cu axa imaginara), atunci putem alege V ⊂ Rn. Mai mult, daca Λ1 ∩Λ2 = ∅ atunci V este unic. Urmatorul rezultat este folosit intens in Teoria Sistemelor Liniare. Teorema 76. Fie A ∈ Fn×n. 1. Daca V = Im V ⊂ Fn este un subspatiu invariant al lui A de dimensiune ℓ, COMPLEMENTE DE ALGEBRA LINIARA

303


unde V ∈ Fn×ℓ este o matrice baza pentru V, atunci exista o matrice S ∈ Fℓ×ℓ a.i. AV = V S. (210) Mai mult, S = A|V . 2. Reciproc, daca AV = V S pentru o anumita amtrice baza V ∈ Fn×ℓ si o matrice S ∈ Fℓ×ℓ, atunci V = Im V este un subspatiu invariant a lui A si S = A|V . Demonstrat¸ie. Rezulta automat din definitia subspatiului invariant.


304


2. Aspecte Geometrice in Algebra Liniara Finit Dimensionala Fie A o aplicatie liniara dintr–un spatiu vectorial X de dimensiune n intr–un spatiu vectorial Y de dimensiune m. Daca X si Y sunt spatii vectoriale peste F (tipic R sau C), atunci liniaritatea lui A implica ca daca yi = Axi ,

i = 1, 2,

atunci (α1y1 + α2y2) = A(α1x1 + α2x2), ∀α1, α2 ∈ F. Alegand baze in ambele subspatii X si Y putem intotdeauna reprezenta aplicatia A printr-o matrice m × n pentru care se foloseste adesea (prin abuz de notatie!) tot simbolul A. In Teoria Sistemelor este adesea util sa consideram anumite aspecte geometrice ale aplicatiei A mai degraba decat proprietatile matricii A, cu toate ca – evident – cele doua puncte de vedere sunt strans relationate. COMPLEMENTE DE ALGEBRA LINIARA

305

Aspecte Geometrice in Algebra Liniara

Nucleu si Imagine Consideram doua subspatii S ⊂ X si R ⊂ Y. Definim imaginea lui S prin aplicatia A ca fiind multimea AS := {y | y = Ax, x ∈ S} si preimaginea (sau imaginea inversa) a lui R prin aplicatia A ca fiind multimea A−1R := {x | y = Ax,

y ∈ R} .

Se poate verifica imediat ca ambele multimi sunt de fapt subspatii ale lui Y si respectiv X . Observatie: Preimaginea (sau imaginea inversa) se poate defini pentru orice aplicatie A, chiar daca matricea corespunzatoare A nu este patrata sau inversabila. In particular, daca S = X si R = {0} obtinem doua spatii remarcabile asociate oricarei aplicatii liniare: COMPLEMENTE DE ALGEBRA LINIARA

306


• Subspatiul AX este imaginea intregului spatiu X prin aplicatia A si se numeste imaginea lui A (notata Im A), Im A := AX = {y | y = Ax,

x ∈ X } ⊂ Y;

• Subspatiul A−1{0} este preimaginea vectorului nul si se numeste nucleul lui A (notata Ker A), Ker A := A−1 {0} = {x | Ax = 0} ⊂ X .

Baze pentru aceste subspatii se obtin facand anumite descompuneri ale matricii A. COMPLEMENTE DE ALGEBRA LINIARA

307


Propozitia 77. O m × n matrice Y de forma Y =

Y1 O

}r }m − r

(211)

cu Y1 avand rang intreg pe linii r are imaginea Im

i.e., orice vector

y1 O

}r

Ir O

,

apartine imaginii lui Y .

O m × n matrice X de forma X=


X1 O |{z} |{z} r n−r

308

(212)


cu X1 avand rang intreg pe coloane r are un nucleu egal cu Im

i.e., orice vector

O x2

}n − r

O In−r

,

apartine nucleului lui X.

Demonstrat¸ie. Consideram y = Y x pentru oricare x ∈ Cn si partitionam y conform cu (211) de unde obtinem y1 = Y1x, y2 = 0. Din ipoteza ca Y1 are rang intreg pe linii r rezulta ca exista r coloane liniar independente care genereaza orice vector y1 ∈ Cr . Consideram Xx = 0, x ∈ Cn, de unde obtinem partitionand x in conformitate cu (212) X1x1 = 0, 0 · x2 = 0. Din ipoteza ca X1 are coloane independente rezulta ca x1 = 0 este unica solutie a ecuatiei X1x1 = 0. Pe de–alta parte, orice vector x2 satisface 0 · x2 = 0. COMPLEMENTE DE ALGEBRA LINIARA

309


Propozitia 78. Fie B o aplicatie din X in Z si A o aplicatie din Z in Y. Atunci

Im (A · B) = AIm B Ker (A · B) = B −1Ker A

Demonstrat¸ie. Avem Im (AB) = {y | ABx = y, x ∈ X }. Deoarece Im B = {z | Bx = z, x ∈ X } COMPLEMENTE DE ALGEBRA LINIARA

310


avem deasemenea Im (AB) = {y | Az = y, z ∈ Im B} = AIm B. Din definitia nucleului obtinem Ker (AB) = {x | ABx = 0}, sau inca {x | Bx = z,

z ∈ Ker A} = B −1Ker A.

Propozitia 79. • Daca B este inversabila la dreapta atunci Im AB = Im A. • Daca A este inversabila la stanga atunci Ker AB = Ker B. COMPLEMENTE DE ALGEBRA LINIARA

311


Demonstrat¸ie. Daca B este inversabila la dreapta atunci are liniile liniar independente si Im B = Z. Din Propozitia 78 Im (A · B) = AIm B = AZ = Im A. Daca A este inversabila la stanga atunci are coloanele liniar independente si Ker A = {0}. Din Propozitia 78 avem Ker (A · B) = B −1Ker A = B −1{0} = Ker B.

Descompuneri si Transformari de Coordonate Consideram descompunerea in valori singulare a unei matrici generale ∗

A = U ΣV = COMPLEMENTE DE ALGEBRA LINIARA

U1 U2

Σr O

O O 312

V1 V2

∗

(213)


unde Σr este diagonala si inversabila. Aceasta descompunere genereaza baze ortonormale pentru cateva subspatii importante ale aplicatiei A. Propozitia 80. Fie descompunerea in valori singulare a lui A din (213). Atunci avem Im A = Im U1, Ker A = Im V2 , Im A∗ = Im V1,

Ker A∗ = Im U2.

Demonstrat¸ie. Din Propozitiile 78 si 79 avem Im A = Im U ΣV ∗ = Im U Σ = U Im Σ

Ker A = Ker U ΣV ∗ = Ker ΣV ∗ = V Ker Σ COMPLEMENTE DE ALGEBRA LINIARA

313


Din Propozitia 77 avem Im Σ = Im si Ker Σ = Im De aici rezulta imediat Im A = U Im si Ker A = V Im

Ir O

O In−r

Ir O O

.

= Im U1

= Im V2. In−r Pentru imaginea si nucleul lui A∗ se pot folosi descompuneri similare pentru A∗ = V Σ∗U ∗. Corolarul 81. Im A⊥ = Ker A∗, COMPLEMENTE DE ALGEBRA LINIARA

Ker A⊥ = Im A∗ 314


unde ·⊥ semnifica complementul ortogonal. Demonstrat¸ie. Rezulta din ortogonalitatea lui U1 si U2 si respectiv a lui V1 si V2. Constructia lui AS si A−1 R Fie S si R doua matrici astfel incat S = Im S si R = Ker R. Aplicam transformari ortogonale (unitare) Vs∗ si Ur liniilor lui S, respectiv coloanelor lui R (i.e. facem o descompunere QR a acestor matrici) astfel incat 



∗  ..  S1 ∗  Vs S = =  ∗  O O

n1

,

RUr =

O R2

=

O ∗ ··· ∗ | {z } n2

Aplicam Vs coloanelor lui A, respectiv Ur∗ liniilor lui A si partitionam matricea COMPLEMENTE DE ALGEBRA LINIARA

315


rezultanta precum urmeaza

As1 As2 |{z} n1

:= AVs ,

n2{

Ar1 Ar2

:= Ur∗A.

Atunci Im As1 = AS si Ker Ar2 = A−1R. Intr–adevar, AS = AIm S = Im AS = Im [(AVs)(Vs∗S)] = Im As1S1 = Im As1,

A−1R = A−1Ker R = Ker RA = Ker [(RUr )(Ur∗A)] = Ker R2Ar2 = Ker Ar2 Daca in plus dorim sa obtinem baze ortonormale atunci efectuam aplicam transformari ortogonale asupra lui As1 respectiv asupra lui Ar2 pentru a obtine un numar COMPLEMENTE DE ALGEBRA LINIARA

316


maxim de linii respectiv coloane de zero   ∗ s2 {  ∗ := U s A Vs , ∗  0 |{z} s1

n2{

∗ 0

∗ |{z} n1

:= Ur∗AVr .

Atunci AS este generat de primele s2 coloane ale lui Us si A−1 R este generat de primele n − n2 coloane ale lui Vr , i.e.: AS = Im Us,1

A−1R = Im Vr,1.

Din relatiile de mai sus observam ca AS si A−1R sunt concepte duale, similar precum Im cu Ker . Intr–adevar avem (A−1S)⊥ = (A∗)S ⊥ COMPLEMENTE DE ALGEBRA LINIARA

317


(AS)⊥ = (A∗)−1S ⊥ Subspatii Nestate Lema 82. Presupunem ca avem o multime crescatoare de subspatii ( nestate) : 0 = V 0 ⊂ V 1 ⊂ V 2 ⊂ · · · ⊂ Vk = X de dimensiune 0 = d0 < d1 < d2 < · · · dk = n. Atunci exista o matrice unitara V a.i. V = [ V1 | V2 | · · · | Vk ] |{z} |{z} |{z} r1 r2 ··· rk unde ri = di − di−1 si astfel incat Vi = Im [V1| · · · |Vi]. Spatiile transformate V ∗Vi sunt acoperite de “vectorii baza ordonati ”: Id i V ∗Vi = Im 0 COMPLEMENTE DE ALGEBRA LINIARA

318


Un subspatiu invariant V al unei matrici patrate A (sau un subspatiu A-invariant este orice spatiu astfel incat AV ⊂ V Id Daca V este acoperit de atunci matricea A are forma bloc 0 A=

A11 A12 0 A22 |{z} d

}d

si este clar ca Λ(A) = Λ(A11) ∪ Λ(A22). Matricea A11 se numeste restrictia lui A la V : A11 = A|V . Observati ca suma R1 + R2 si intersectia R1 ∩ R2 a doua subspatii A-invariante este deasemenea un subspatiu A-invariant. De aici rezulta ca un subspatiu Ainvariant formeaza o latice sub operatiile de adunare si intersectie care prin urmare va avea intotdeauna un infimum si un supremum. COMPLEMENTE DE ALGEBRA LINIARA

319


3. Ecuatii Matriciale Liniare

Anumite ecuatii matriciale liniare precum ecuatia Sylvester, Stein si versiunile lor simetrice de tip Lyapunov joaca un rol central in teoria sistemelor dinamice liniare. Prezentam in continuare conditii de solvabilitate si anumite proprietati remarcabile ale acestor ecuatii. Reamintim intai cateva concepte de teoria matricilor. O matrice A se numeste simetrica daca A = AT si se numeste hermitica daca A = A∗. Daca A este hermitica atunci toate valorile ei proprii sunt reale si in acest caz introducem semnul matricii A (sau matricea semn) prin formula sgn (A) := diag (In− , In+ , On0 )

(214)

unde n−, n+ si n0 sunt numarul de valori proprii strict negative, strict pozitive si COMPLEMENTE DE ALGEBRA LINIARA

320

Ecuatii Matriciale Liniare

nule iar On0 semnifica matricea nula de dimensiune n0 × n0. Matricea semn este unic definita de matricea hermitica A. Teorema 83 (Ecuatii Sylvester si Stein). Fie A ∈ Fn×n, B ∈ Fm×m, si C ∈ Fn×m. 1. Ecuatia Sylvester AX + XB + C = 0 are o solutie unica X ∈ Fn×m daca si numai daca s + µ 6= 0,

oricare

s ∈ Λ(A), µ ∈ Λ(B).

(215)

(216)

2. Ecuatia Stein AXB − X + C = 0 are o solutie unica X ∈ Fn×m daca si numai daca sµ 6= 1, COMPLEMENTE DE ALGEBRA LINIARA

oricare

s ∈ Λ(A), µ ∈ Λ(B). 321

(217)

(218) Ecuatii Matriciale Liniare

Daca conditia (216) (sau (218)) nu este indeplinita atunci ecuatia Sylvester (respectiv ecuatia Stein) poate sa nu aibe nici o solutie sau poate avea o infinitate de solutii in functie de termenul liber C. Ecuatii Lyapunov Daca B = A∗ si Q := C = C ∗ atunci ecuatia Sylvester este cunoscuta sub numele de ecuatie Lyapunov (in timp continuu) si are forma AX + XA∗ + Q = 0,

(219)

iar ecuatia Stein este cunoscuta sub numele de ecuatie Lyapunov (in timp discret) si are forma AXA∗ − X + Q = 0. (220) Urmatorul rezultat este o consecinta directa a Teoremei 83. Teorema 84 (Ecuatii Lyapunov). Fie A ∈ Fn×n si Q = Q∗ ∈ Fn×n. COMPLEMENTE DE ALGEBRA LINIARA

322


1. Ecuatia Lyapunov (in timp continuu) AX + XA∗ + Q = 0

(221)

are solutie unica X ∈ Fn×n daca si numai daca s + µ 6= 0,

oricare s, µ ∈ Λ(A).

(222)

Mai mult, daca X este unica, atunci este hermitica. 2. Ecuatia Lyapunov (discreta) AXA∗ − X + Q = 0

(223)

are o solutie unica X ∈ Fn×n daca si numai daca sµ 6= 1, COMPLEMENTE DE ALGEBRA LINIARA

oricare s, µ ∈ Λ(A). 323


Mai mult, daca X este unica, atunci este hermitica. Dam in continuare cateva rezultate ce leaga interia solutiei X de cea a matricii A. Fie A ∈ Fn×n. Notam νc(A), πc(A), si δc(A), numarul de valori proprii ale lui A cu parte reala strict negativa, strict pozitiva si respectiv nula si cu νd(A), πd(A), si δd(A), numarul de valori proprii ale lui A cu modul strict mai mic, strict mai mare si respectiv egal cu 1. Tripletul de numere intregi (νc(A),πc(A),δc(A)) este numit c–inertia matricii A iar tripletul de numere intregi (νd(A),πd(A),δd(A)) este numit d–inertia matricii A. Evident avem νc(A) + πc(A) + δc(A) = νd(A) + πd(A) + δd(A) = n. Teorema 85. Fie A, Q, X ∈ Fn×n, cu X = X ∗ si Q = Q∗ ≥ 0. 1. Presupunem ca A, Q, X satisfac ecuatia Lyapunov AX + XA∗ + Q = 0. COMPLEMENTE DE ALGEBRA LINIARA

324


Atunci avem: (a) Daca δc(A) = 0 atunci νc(A) ≥ πc(X) si πc(A) ≥ νc(X). (b) Daca δc(X) = 0 atunci νc(X) ≥ πc(A) si πc(X) ≥ νc(A). 2. Presupunem ca A, Q, X satisfac ecuatia Lyapunov discreta AXA∗ − X + Q = 0. Atunci avem: (a) Daca δd(A) = 0 atunci νd(A) ≥ πc(X) si πd(A) ≥ νc(X). (b) Daca δc(X) = 0 atunci νc(X) ≥ πd(A) si πc(X) ≥ νd(A). Presupunem ca Q = Q∗ ≥ 0 este de forma Q = BB ∗. Daca perechea (A, B) este controlabila atunci inegalitatile din Teorema 85 pot fi intarite la egalitati. Teorema 86. Fie A, X ∈ Fn×n, B ∈ Fn×m, X = X ∗, si presupunem ca (A, B) este controlabila. COMPLEMENTE DE ALGEBRA LINIARA

325


1. Daca A, X, B satisfac ecuatia Lyapunov AX + XA∗ + BB ∗ = 0 atunci avem δc(A) = 0, δc(X) = 0, νc(A) = πc(X), πc(A) = νc(X). 2. Daca A, X, B satisfac ecuatia Lyapunov discreta AXA∗ − X + BB ∗ = 0 atunci avem δd(A) = 0, δc(X) = 0, νd(A) = πc(X), πd(A) = νc(X). Daca relaxam ipoteza de controlabilitate a perechii (A, B) obtinem urmatorul rezultat. Teorema 87. Fie A, X ∈ Fn×n, B ∈ Fn×m, si X = X ∗. 1. Daca perechea (A, B) este stabilizabila (in timp continuu) si A, X, B satisfac ecuatia Lyapunov AX + XA∗ + BB ∗ = 0 COMPLEMENTE DE ALGEBRA LINIARA

326


atunci avem δc(A) = 0, νc(A) = πc(X) + δc(X), πc(A) = νc(X). 2. Daca perechea (A, B) este stabilizabila (in timp discret) si A, X, B satisfac ecuatia Lyapunov discreta AXA∗ − X + BB ∗ = 0 atunci δd(A) = 0, νd(A) = πc(X) + δc(X), πd(A) = νc(X). Daca in Teoremele 86 si 87 inlocuim A cu A∗ si B cu C ∗ obtinem versiunile duale corespunzatoare. Nucleul solutiei X are anumite proprietati dupa cum reiese din urmatoarea teorema. Teorema 88. Fie A, X ∈ Fn×n, C ∈ Fp×n, X = X ∗ si fie N (C, A) subspatiul neobservabil al perechii (C, A). 1. Presupunem ca A, X, C satisfac ecuatia Lyapunov A∗X + XA + C ∗C = 0. COMPLEMENTE DE ALGEBRA LINIARA

327


Atunci avem: (a) Ker X ⊂ N (C, A). (b) Daca ecuatia Lyapunov (225) are o unica solutie X atunci avem N (C, A) ⊂ Ker X. 2. Presupunem ca A, X, C satisfac ecuatia Lyapunov discreta A∗XA − X + C ∗C = 0.

(226)

Atunci avem: (a) Ker X ⊂ N (C, A). (b) Daca ecuatia Lyapunov discreta (226) are o unica solutie X atunci avem N (C, A) ⊂ Ker X.


328


TSA-global

Recommend Documents