Instituto Federal de Educação, Ciência e Tecnologia do Pará (IFPA) Engenharia de Controle e Automação Engenharia de Controle I
Regulador Linear Quadrático Pedro Santos Renan Godinho Barbara Gonçalves Abner Barbosa Rodrigo Pena
Belém/PA Setembro/2013
SUMÁRIO INTRODUÇÃO.......................................................................................................3 DESENVOLVIMENTO.............................................................................................4 1. PROBLEMAS DE CONTROLE ÓTIMO.................................................................4
a) PROBLEMA DO CONTROLE ÓTIMO QUADRÁTICO:........... QUADRÁTICO:......................... ..............4 b) TEMPO MÍNIMO DE CONTROLE:....................................................6 c) CONTROLE TERMINAL:...................................................................6 d) MÍNIMO ESFORÇO DE CONTROLE:.................................................6 e) O SERVOMECANISMO ÓTIMO:.......................................................6 f) PROBLEMA DO REGULADOR ÓTIMO:...............................................7 2. O Problema do Regulador Linear Quadrático Invariante Invariante no Tempo.7 3. Motivação física para o Regulador Linear Quadrático......................10 4. As Matrizes Q e R................................................................................13 13 5. Projeto de Regulador Linear Quadrático no MATLAB................... MATLAB.......................18 6. Conclusão.............................................................................................21 21 22 7. Bibliografia............................................................................................22
INTRODUÇAO O Regulador linear quadrático (LQR do inglês Linear Quadratic Regulator ) possui grande aplicação em controle ótimo. A teoria do controle ótimo lida com operação de um sistema dinâmico com custo mínimo. Sabemos que a natureza não é linear, portanto por meio de uma linearização podemos conduzir a uma solução que se aproxime da solução real do problema. O LQR é uma estratégia de controle,criada pelo matemático Kalman em 1960, que é baseada na realimentação de estados , ou seja , tem a vantagem de se apresenta a solução do problema através das variáveis de estado, é fundamental para o LQR que os ganhos do controlador sejam calculados pelas matrizes que regem o desempenho do sistema. Esses ganhos obtidos são encontrados por meio da solução da equação de Riccati, que é uma equação diferencial não-linear de primeira ordem, a resolução de problemas de controle ótimo através de sistemas lineares é bem conhecida e seus estudos são bastantes consolidados , entretanto quando o sistema não é linear a solução do problema torna-se complexa. Com o objetivo de amenizar esse problema parcialmente Al´brekht (1962) estudou o problema de controle ótimo de maneira geral considerando um sistema de equações nãolineares , mas analíticas e invariantes no tempo. Lukes (1969) utilizou esses conceitos e estendeu a teoria do LQR a sistemas não-lineares, mas analíticos em torno da origem, invariantes no tempo e com horizonte infinito. Willemstein (1975) mostrou que essa extensão é valida para sistemas não-lineares, mas analíticos em torno da origem, variantes no tempo e com horizonte finito. A situação onde a dinâmica do sistema é descrita por um conjunto de equações diferenciais lineares é descrita por uma função quadrática, denominada de problema linear quadrático.
DESENVOLVIMENTO O controle ótimo está desempenhando um papel cada vez mais importante nos projetos de sistemas modernos com o objetivo a maximização do retorno de, ou a minimização do custo de, a operação do processo físico e econômico.
A situação onde a dinâmica do sistema é descrita por um conjunto de equações diferenciais lineares é descrita por uma função quadrática, denominada de problema linear quadrático. Nos projetos via Regulador Linear Quadrático, o projetista deverá atribuir ponderações as matrizes que definem a importância relativa dos estados e do esforço de controle, no entanto o LQR não possui um método para definir antecipadamente os parâmetros de desempenho do sistema em função do tempo em função das ponderações impostas pelo projetista, mostrando-se basicamente empírica.
1.
PROBLEMAS DE CONTROLE ÓTIMO:
a) PROBLEMA DO CONTROLE ÓTIMO QUADRÁTICO: *Regulador de tempo contínuo: O sistema dinâmico abaixo descrito pelas equações de estados:
̇
(1)
Onde u = -kx Com função custo dada por:
∫
(2)
A minimização do valor custo é representada pela seguinte lei de controle de retroalimentação:
(3)
Sendo P encontrado através da solução da Equação de Ricatti(*) dada abaixo:
(4)
* Equação de Ricatti é uma equação diferencial ordinária não-linear de primeira ordem, na forma:
(5)
Onde a(x),b(x) e c(x) são três funções que dependem de Se conhecermos uma solução particular da equação, por exemplo
,a
seguinte mudança de variável transformará a equação em equação linear:
=
(6)
(7)
*Regulador de tempo discreto: Sendo o sistema de tempo discreto descrito por:
(8)
Função custo definida por:
A lei de controle de realimentação é:
̂ ̂
(9)
Onde:
(10)
(11)
E P é a solução para a Equação de Ricatti discreta:
(12)
O objetivo do controle ótimo é determinar o vetor de controle
u(t)
que forçará o comportamento do sistema a minimizar algum tipo de função custo, enquanto ao mesmo tempo satisfaz as limitações físicas do sistema.
b) TEMPO MÍNIMO DE CONTROLE: O problema resumisse em encontrar o vetor exigido seja mínimo, ou seja, função custo abaixo :
a
de u(t)
. Onde este tempo é calculado pela
∫
c) Controle terminal :
modo que o tempo
(13)
Dada a função abaixo:
()()()
Onde ξ(
é o valor final desejado para
(14)
, S é a matriz de estados
terminais, ou seja, S está relacionada com os estados finais fixos, os quais são os estados desejados, positiva semidefinida de pesos. Neste caso, o interesse é definir u(t) , tal que o erro x (t ) ) f – ξ(t f seja mínimo.
d) Mínimo esforço de controle: Dada a função :
∫
(15)
Na expressão acima J representa a energia consumida pelo vetor de controle u(t) na ação de controlar o sistema, onde R é um matriz de peso
semidefinida positiva com t Є (
e) O servomecanismo ótimo: Dada a função de custo:
∫ ∫
(16)
Onde Q é uma matriz de pesos real semidefinida positiva para
t Є (t f ,t ) 0 e
. O vetor de ξ(t) é a trajetória pré-especificada, desejada, do vetor de estado x(t) e = x(t) – ξ(t) é
o erro que se deseja minimizar. Isto deve ser completado pela
escolha de um u(t) adequado. Neste tipo de problema, frequentemente inclui-se tanto o esforço de controle, quanto o problema de controle terminal:
( )( )[( )( )] ∫ }
(17)
f) Problema do regulador ótimo:
Dada a função de custo abaixo:
∫
(18)
Aqui o objetivo é restabelecer o estado de equilíbrio do sistema após este ser submetido a uma perturbação. Em projetos de controle ótimo envolvendo este tipo de problema, nos quais não se requer estados finais fixos, a função de custo J se reduz a:
∫
(19)
2. O Problema do Regulador Linear Quadrático Invariante no Tempo Para iniciar, será exposto o problema do LQR, sua solução e hipóteses
usadas na obtenção da solução. Será dado o teorema abaixo, avaliado s em provas, somente hipóteses acerca do LQR, abordando a existência da solução do problema.
Teorema 1: Dada a dinâmica do sistema:
̇
(19)
Com x(t) Є Rn e deixando pequena
u(t) Є
(20)
Rm ao longo de uma combinação linear de estados,
(21)
Com y(t) Є Rp. Define-se a função custo quadrática:
∫
(22)
No qual o tamanho dos estados de interesse, relativamente à ação de controle equivalente de pesos
R .
z(t)
é comparado
, através u(t)
da matriz de
Considerando, sem prova formal, se as seguintes hipóteses são
corretas: a) O vetor de estado x(t) está inteiramente disponível para realimentação; b)
[ A B ] é
estabilizável e [ A
c)
R = R >0 ;
C ] é
detectável;
T
Então: i)
O controlador linear quadrático é único, ótimo e a lei de controle de realimentação de estados total é:
Com:
(23)
(24)
Que minimiza a função custo J , sujeito à restrição dinâmica imposta pela dinâmica de malha aberta em eq.1. ii)
S é uma matriz única, simétrica, positiva e semidefinida, a qual é solução da equação algébrica de Riccati:
iii)
25
(26)
A dinâmica em malha fechada, através da substituição de 2 em 1: (27)
̇ O qual é garantido haver estabilidade. iv)
O mínimo valor do funcional quadrático de custo J na equação 11 é:
28
A prova (simplificada) do teorema anterior decorre do sistema dado na equação 1 e da função de Lyapunov
Com
S>0 calculada
(29)
a partir da equação de Riccati. Derivando em relação
ao tempo, obtem-se:
̇
30
Cuja integral de 0 a +∞ fornece
() () ∫ Com ρ = R sendo escalar (no caso geral de uma única entrada
(31)
u(t) ).
3. Motivação física para o Regulador Linear Quadrático O problema do LQR e o custo podem ser motivados da seguinte maneira. Dado o sistema da equação 1, que está inicialmente excitado, e o resultado desta excitação está refletido no vetor de estado
x 0 . Esta
condição inicial pode
ser considerada como um desvio indesejável da posição de equilíbrio do sistema,
x(t) =0.
Uma vez conhecido esse desvio, o objetivo de controle pode
ser essencialmente visto como a seleção do vetor de controle vetor de estado x(t) =0 tão rapidamente o possível.
que u(t)
regula o
Se a equação 1 é controlável, então é possível levar o sistema de
x(t) para
zero em um curto período de tempo arbitrário. Isto irá requerer altos valores do sinal de controle (grande esforço de controle), o qual do ponto de vista da engenharia é inaceitável. Altos valores para sinais de controle irão saturar os atuadores e se implementados na forma de realimentação, irá requerer projetos com grandes larguras de banda que por sua vez, irão excitar dinâmicas não modeladas. Por este motivo, fica óbvio que deve existir no projeto um balanço entre o desejo de regular perturbações em estado de equilíbrio e a magnitude do sinal de controle necessário. Minimizando o funcional quadrático de custo da equação 11 é uma forma de quantificar o desejo do engenheiro de controle em alcançar este balanço. Compreender que a natureza quadrática de ambos os termos no custo
(32)
(33)
Assegura que estes termos são não-negativos para todo t. Ora, avaliando o efeito de
R e C C = Q no T
desempenho do sistema, é possível chegar às
seguintes conclusões: i)
Se Q>>R>0
O peso do sinal de controle no cálculo do critério é reduzido;
O sinal de controle pode atingir valores elevados;
O sistema responde com maior velocidade;
Há a possibilidade de saturação dos atuadores;
ii)
Em contrapartida, se 0≤Q<
A energia de controle tem maior peso no cálculo do critério;
As componentes do ganho de realimentação de estado serão de pequeno valor absoluto;
Exemplo:
O sistema não apresentará uma resposta rápida.
Considere-se o sistema mostrado na Figura 2.1. Admitindo-se que o sinal de controle seja: u(t) = - Kx(t) Determinar a matriz de ganho de realimentação K ótima tal que o seguinte índice de desempenho seja minimizado:
Onde:
Fig.2.1. Sistema de controle
A partir da figura acima, acha-se a equação de estado para o processo é:
Onde
̇
, B=
Será demonstrado o uso da equação matricial de Riccati reduzida no projeto do sistema de controle ótimo, como: Observando-se que a matriz A é real e que a matriz Q é real e simétrica, a matriz P é uma matriz real simétrica. Portanto, esta última equação pode ser escrita como:
Esta equação pode ser simplificada para
A partir da qual se obtém as três equações seguintes
Resolvendo-se estas três equações simultâneas em p11, p12 , p22 , com o requisito de que P seja definida positiva, obtém-se:
Pode-se obter a matriz de ganho de realimentação K ótima como sendo:
Assim, o sinal de controle ótimo é
Note-se que a lei de controle dada pela equação acima conduz a um resultado ótimo para qualquer estado inicial sob o índice de desempenho dado. Além disso, observa-se que a matriz Q só afeta o segundo elemento da matriz de ganho de realimentação K.
4. As Matrizes Q e R. Um problema do LQR é a determinação das matrizes de ponderação que satisfazem determinadas condições, onde, associada aos estados do sistema e
R é
Q
é uma matriz de ponderação
uma matriz de ponderação associada às
variáveis de controle. A determinação dessas matrizes influencia para o cálculo do ganho. Diversas técnicas foram desenvolvidas para determina-las que tem por base métodos determinísticos e Heurísticos. A liberdade de escolha das matrizes
de ponderação do projeto LQR são variáveis de projeto livres que são utilizadas para a sintonia dos ganhos de controle ótimo. O principal enfoque deste tópico é fazer uma breve explanação dos métodos de busca das matrizes de ponderação Q e R que compõem índice de desempenho J. a) Métodos Heurísticos: são métodos que constituem uma das primeiras técnicas concebidas para a seleção das matrizes de ponderação. Uma abordagem dessa metodologia é o chamado quadrado do inverso ou Método de Bryson, cuja idéia básica é normalizar as saídas e o termo controle dentro da função de índice de desempenho quadrático. Esta normalização é normalmente realizada usando o máximo de valores antecipados (ou derivados) do controle e das saídas individuais. Porém, sua desvantagem é por ser um método intuitivo. Os parâmetros
geralmente Q e R
necessitam ser sintonizados até um
comportamento satisfatório ser obtido, ou até o projetista se satisfazer com o resultado. Uma conjectura inicial é escolher uma diagonal de
b)
Q e R
[4.1]
Onde Q e R têm diagonais positivas, dentre as quais:
c) d)
e)
[4.2] [4.3] [4.4]
Onde m é o numero de estados e k é o número de atuadores do sistema de controle. O desempenho desejado do sistema obtido pelo ajuste das matrizes de ponderações são escolhidas pelas equações 4.3 e 4.4. O número Δx i m ax está baseado na faixa/intervalo de operação dos estados. A outra quantidade Δu i m ax tem um significado similar para a i-ésima
componente da entrada u, e está baseada no máximo esforço de controle ou valor máximo de operação de atuadores. Partindo desta conjectura inicial os valores das diagonais principais de
Q e R devem
ser ajustados por método de
tentativa e erro, sistematicamente. Na figura 4.1 apresenta-se um algoritmo ilustrando o procedimento de determinação das matrizes de ponderação
Q e R , implementando
o método de
Bryson. b) Metodologia usando Controle ótimo Modal O objetivo do controle ótimo modal é determinar uma lei de realimentação de estado, utilizando a equação 4.4:
de modo que a matriz do sistema de malha fechada
̇
[4.5]
tenha os seus autovalores pré estabelecidos. O controle ótimo modal é baseado na convencional alocação de pólos, que em vez de escolher o ganho de realimentação diretamente, os parâmetros de projeto da função quadrática são posicionados de acordo com as matrizes
Q e R até
atingir os objetivos do
projeto de controle.
c) Projeto do Regulador com Condições de Estabilidade. Neste método troca-se a determinação das localizações exatas de todos os pólos à malha fechada pela simples especificação de uma região do semipleno complexo esquerdo onde deverão estar os pólos a malha fechada. Este método explora ainda as propriedades do regulador de potência mínima e a equação de Riccati é usada para determinar as matrizes de ponderação apropriadas.
Figura 4.1 - Método de Bryson
Figura 4.2 - Controle modal
Figura 4.3 - Algoritmo do regulador em condições de estabilidade
5. Projeto de Regulador Linear Quadrático no MATLAB Exemplo 1: Considerando uma equação multivariável de espaço de estado determinada por
Selecionando a matriz diagonal Q = diag(10, 8, 2, 0) e a matriz identidade R = I, podemos obter a matriz de realimentação de estados através de
A matriz K de realimentação de estados e a solução P para a equação de Ricatti pode ser obtida por
E os polos em malha fechada são −6.3396,−12.7427,−23.5384 e −27.8096.
Exemplo 2: Regulador Linear Quadrático para um motor DC A representação dos estados do motor de corrente contínua é dado abaixo:
Onde y é a velocidade angular da carga e u a tensão de alimentação de tal forma que o sistema em malha fechada 1. Seja estável e acompanhe um degrau unitário com erro nulo em regime permanente. 2. Não apresente sobre-elevação no sinal de saída, em relação ao degrau de entrada, no domínio do tempo. Considere o modelo do motor de corrente contínua. Resolvemos o problema linear quadrático para:
A = 0 1.0000 -0.1429 -1.0714 B= 0 1
C= 0.0714
0
D= 0 Q= 1 0
0 1
R= 25 Logo, para [k,P] = lqr(A,B,Q,R) são: k= 0.1029 0.1092 P= 3.4271 2.5726 2.5726 2.7289 E 1 ≤ρ ≤ 25. Obtemos o Gráfico a seguir:
REGULADORLINEAR QUADRATICO PARA MOTORDC 0.5 SemRegulação ComRegulação
0.45 0.4 0.35 0.3 e d u t i l 0.25 p m A
0.2 0.15 0.1 0.05 0
0
5
10
15
20 Time (sec)
Figura 5.1
25
30
35
40
6. Conclusão Neste trabalho apresentamos de forma breve o Regulador Linear Quadrático, muito usado em sistemas de Controle Ótimo. Onde o LQR pode proporcionar ganhos de controle ótimo desde que seja feita uma escolha adequada das matrizes Q e R da função desejada para minimização de custo. Podemos concluir também que o LQR garante excelentes margens de estabilidade e boa rejeição de distúrbios, porém o projetista é obrigado a testar, de forma intuitiva, índices de desempenhos até se chegar o qual ele desejar. No caso do Regulador Linear Quadrático, o índice de desempenho é um mapeamento dos espaços dos vetores de estados e de controle ponderados pelas matrizes constantes Q e R, respectivamente. Aponta-se também como vantagem do LQR a margem de estabilidade garantida. Foi discutido a problemática relacionada com a solução da Equação de Ricatti, a escolha das matrizes de ponderação e suas relações com métodos de busca ótima.
7. Bibliografia OGATA, Katsuhiko. Engenharia de Controle Moderno. Prentice Hall do Brasil. 2ª ed. Rio de Janeiro. 1982. BURNS, Roland. Advanced Control Engineering. ButterwothHeinemann. 1ª ed. Oxford. 2001. KIRK, Donald. Optimal Control Theory. Dover Publications, 1970.