CENTRO FEDERAL DE EDUCAÇÃO TECNOLÓGICA DE SANTA CATARINA Departamento de Eletrônica
Apostila de SISTEMAS DE CONTROLE Sétima Edição (revisada) – Nov/2007
Autor: Marco Valério Miorim Villaça (
[email protected])
ii
Copyright © 2007 para Departamento de Eletrônica Centro Federal de Educação Tecnológica de Santa Catarina Av. Mauro Ramos, 950 88020-300 Florianópolis, SC Todos os direitos reservados. É proibida a duplicação ou reprodução deste volume, no todo ou em parte, sob quaisquer formas ou por quaisquer meios, sem permissão expressa do Departamento de Eletrônica MATLAB é uma marca registrada de MathWorks, Inc. 24 Prime Park Way, MA 01760-1520 Fone: (508)653-1415, Fax: (508)653-2997 Email:
[email protected]
Sistemas de Controle
iii
PREFÁCIO A SEGUNDA EDIÇÃO
Este texto foi escrito para promover um primeiro contato entre os alunos do Curso Superior de Tecnologia em Sistemas Digitais e o Controle Clássico. Com esse objetivo, o texto, contém informações e certos passos de demonstrações matemáticas que normalmente são omitidos nos livros de controle voltados para cursos de graduação em engenharia; por outro lado, ele omite algumas demonstrações facilmente encontradas na extensa literatura da área, literatura que deve ser consultada pelo aluno que deseja se aprofundar na disciplina de controle. O texto inclui informações básicas para o uso de uma ferramenta de projeto assistida por computador, o MATLAB da MathWorks Inc. Será utilizado, também, o Simulink, uma ferramenta do MATLAB, que se constitui numa maneira eficiente de modelar, simular e analisar sistemas de controle realimentado. Ao longo do texto, procura-se expor de maneira clara os métodos clássicos da engenharia de controle: transformada de Laplace e funções de transferência, aproximações de sistemas de segunda ordem, erro de regime permanente para sinais típicos de teste, critério de Routh-Hurwitz, método de Bode e lugar das raízes. O capítulo inicial contém uma pequena matéria introdutória sobre a análise de sistemas pelo método de espaço de estados, que se constitui na única referência do texto ao Controle Moderno. Para cumprir seus objetivos, o texto é organizado em cinco capítulos. No primeiro capítulo, familiariza-se o leitor com a linguagem, definições e recursos utilizados em controle e se oferece a base matemática necessária para a compreensão do texto. Não obstante, seria conveniente a leitura de livros específicos da área de matemática. Ciente de que o melhor meio para compreender qualquer área do conhecimento humano é examinar a sua evolução e as razões para a sua existência, o Capítulo I inclui, ainda, uma curta história da teoria do controle automático e oferece uma breve discussão das filosofias das teorias de controle clássico e moderno. O Capítulo II trata da modelagem de sistemas eletrônicos e eletromecânicos, desenvolvendo modelos de funções de transferência destes sistemas. O Capítulo III apresenta a análise da resposta transitória e análise de erro em regime permanente dos sistemas. No Capítulo IV o enfoque é a estabilidade dos sistemas de controle lineares. Para responder as questões que naturalmente se apresentam - “Em que condições um sistema se torna instável?” e “Caso ele seja instável, como torná-lo estável?” – estuda-se o critério de
iv
Routh-Hurwitz, o método do lugar das raízes ou root locus e o método de Bode. O Último capítulo apresenta procedimentos para o projeto e compensação de sistemas de controle invariantes no tempo empregando a técnica do lugar das raízes e o método de Bode. A compensação consiste na modificação dinâmica do sistema visando atender certas especificações. Visando a integração de disciplinas do curso de Superior de Tecnologia em Sistemas Digitais, para o qual o texto foi escrito, o Capítulo V apresenta a compensação de um conversor CC-CC abaixador (buck), previamente modelado no Capítulo II. Para mostrar a eficiência do modelo obtido e da técnica de compensação desenvolvida, apresenta-se uma simulação do conversor compensado utilizando a ferramenta de simulação eletrônica Pspice da MicroSim. Recomenda-se fortemente que o aluno implemente um conversor abaixador no final da leitura deste texto.
Prof. Marco Valério Miorim Villaça Florianópolis, outubro de 2004
Sistemas de Controle
v
SUMÁRIO PREFÁCIO A SEGUNDA EDIÇÃO ................................................................................................ III SUMÁRIO ..................................................................................................................................V 1. INTRODUÇÃO AOS SISTEMAS DE CONTROLE ............................................................. 9 1.1 CONCEITOS GERAIS ............................................................................................................ 9 1.2 PROJETO DE SISTEMAS DE CONTROLE............................................................................... 16 1.3 UMA BREVE HISTÓRIA DO CONTROLE AUTOMÁTICO ........................................................ 18 1.3.1 RELÓGIOS DE ÁGUA DOS GREGOS E DOS ÁRABES ...................................................... 20 1.3.2 A REVOLUÇÃO INDUSTRIAL...................................................................................... 22 1.3.3 OS CONSTRUTORES DE MOINHOS............................................................................... 24 1.3.4 REGULADORES DE TEMPERATURA ............................................................................ 25 1.3.5 REGULADORES DE FLUTUAÇÃO................................................................................. 25 1.3.6 REGULADORES DE PRESSÃO ..................................................................................... 26 1.3.7 REGULADORES CENTRÍFUGOS ................................................................................... 26 1.3.8 O PÊNDULO SIMPÁTICO............................................................................................. 28 1.3.9 O NASCIMENTO DA TEORIA MATEMÁTICA DO CONTROLE ........................................ 28 1.3.10 EQUAÇÕES DIFERENCIAIS........................................................................................ 29 1.3.11 TEORIA DA ESTABILIDADE ...................................................................................... 30 1.3.12 TEORIA DE SISTEMA ................................................................................................ 30 1.3.13 COMUNICAÇÃO DE MASSA E O SISTEMA DE TELEFONE DE BELL .............................. 31 1.3.14 ANÁLISE NO DOMÍNIO-FREQÜÊNCIA........................................................................ 31 1.3.15 AS GUERRAS MUNDIAIS E O CONTROLE CLÁSSICO .................................................. 32 1.3.16 CONTROLE DE NAVIO .............................................................................................. 32 1.3.17 DESENVOLVIMENTO DE ARMAS E DIRECIONAMENTO DE CANHÕES ......................... 33 1.3.18 LABORATÓRIO DE RADIAÇÃO DO M.I.T.................................................................. 33 1.3.19 ANÁLISE ESTOCÁSTICA ........................................................................................... 35 1.3.20 O PERÍODO CLÁSSICO DE TEORIA DE CONTROLE ...................................................... 35 1.3.21 A ERA ESPACIAL/DO COMPUTADOR E O CONTROLE MODERNO ............................... 36 1.3.22 PROJETO NO DOMÍNIO DO TEMPO PARA SISTEMAS NÃO LINEARES ........................... 36 1.3.23 SPUTNIK - 1957....................................................................................................... 37 1.3.24 NAVEGAÇÃO ........................................................................................................... 37 1.3.25 OTIMALIDADE EM SISTEMAS NATURAIS ................................................................. 37 1.3.26 CONTROLE ÓTIMO E TEORIA DA ESTIMAÇÃO ......................................................... 38 1.3.27 TEORIA DE CONTROLE NÃO-LINEAR ........................................................................ 40 1.3.28 COMPUTADORES NO PROJETO DE CONTROLES E IMPLEMENTAÇÃO .......................... 40 1.3.29 O DESENVOLVIMENTO DOS COMPUTADORES DIGITAIS ........................................... 40 1.3.30 CONTROLE DIGITAL E TEORIA DA FILTRAGEM ......................................................... 41 1.3.31 O COMPUTADOR PESSOAL ...................................................................................... 42 1.3.32 A UNIÃO DO CONTROLE MODERNO E DO CLÁSSICO ................................................. 42 1.4 A FILOSOFIA DO CONTROLE CLÁSSICO ............................................................................. 43 1.5 A FILOSOFIA DE CONTROLE MODERNO ............................................................................. 45 1.6 FUNDAMENTOS MATEMÁTICOS ........................................................................................ 49 1.6.1 –REPRESENTAÇÃO DE SISTEMAS FÍSICOS ATRAVÉS DE EQUAÇÕES DIFERENCIAIS: ..... 49 1.6.1 –VARIÁVEL COMPLEXA E FUNÇÃO COMPLEXA:......................................................... 52 1.6.2 TEOREMA DE EULER ................................................................................................. 54 1.6.3 TRANSFORMADA DE LAPLACE: ................................................................................. 55 1.6.4 TRANSFORMADA INVERSA DE LAPLACE: .................................................................. 57
vi
1.6.5 APLICAÇÃO DA TRANSFORMADA DE LAPLACE NA SOLUÇÃO DE EQUAÇÕES DIFERENCIAIS ORDINÁRIAS LINEARES ................................................................................ 67 1.7 FUNÇÃO DE TRANSFERÊNCIA ........................................................................................... 68 1.8 DIAGRAMAS DE BLOCO .................................................................................................... 70 1.9 DIAGRAMAS DE FLUXO DE SINAL ..................................................................................... 78 1.10 MÉTODO DO ESPAÇO DE ESTADOS PARA ANÁLISE DE SISTEMAS DE CONTROLE .............. 84 2. MODELAGEM DE SISTEMAS ELÉTRICOS E ELETROMECÂNICOS ................................................ 91 2.1 SISTEMAS ELÉTRICOS ...................................................................................................... 91 2.2 SISTEMAS ELETROMECÂNICOS......................................................................................... 99 3. ANÁLISE DE RESPOSTA TRANSITÓRIA E ANÁLISE DE ERROS EM REGIME PERMANENTE......... 105 3.1 INTRODUÇÃO ................................................................................................................. 105 3.2 SISTEMA DE 1A ORDEM .................................................................................................. 106 3.2.1 RESPOSTA A DEGRAU UNITÁRIO DE SISTEMAS DE 1A ORDEM .................................. 106 3.2.2 RESPOSTA À RAMPA UNITÁRIA DE SISTEMAS DE 1A ORDEM .................................... 110 3.2.3 RESPOSTA A IMPULSO UNITÁRIO DE SISTEMAS DE 1A ORDEM .................................. 111 3.3 SISTEMA DE 2A ORDEM .................................................................................................. 111 3.3.1 RESPOSTA A DEGRAU UNITÁRIO DE SISTEMAS DE 2A ORDEM .................................. 112 3.3.2 RESPOSTA À IMPULSO UNITÁRIO DE SISTEMAS DE 2A ORDEM .................................. 119 3.3.3 RESPOSTA A RAMPA UNITÁRIA DE SISTEMAS DE 2A ORDEM .................................... 121 3.3.4 EFEITO DE UM TERCEIRO PÓLO E UM ZERO NA RESPOSTA DE SISTEMAS DE 2A ORDEM ........................................................................................................................................ 123 3.4 ANÁLISE DE ERRO EM REGIME PERMANENTE OU ESTACIONÁRIO .................................... 124 3.4.1 COEFICIENTE DE ERRO DE POSIÇÃO ESTÁTICO KP ................................................... 126 3.4.2 COEFICIENTE DE ERRO DE VELOCIDADE ESTÁTICO KV ........................................... 128 3.4.3 COEFICIENTE DE ERRO DE ACELERAÇÃO ESTÁTICO KA ........................................... 130 3.4.4 RESUMO DA SEÇÃO ................................................................................................. 132 4. ESTABILIDADE DE SISTEMAS DE CONTROLE ......................................................... 137 4.1 INTRODUÇÃO ................................................................................................................. 137 4.2 ESTABILIDADE ASSINTÓTICA ......................................................................................... 138 4.3 BIBO ESTABILIDADE ..................................................................................................... 139 4.4 CRITÉRIO DE ROUTH-HURWITZ ..................................................................................... 140 4.3 O LUGAR DAS RAÍZES OU ROOT LOCUS ........................................................................... 146 4.3.1 – INTRODUÇÃO ....................................................................................................... 146 4.3.2 – O CONCEITO DE LUGAR DAS RAÍZES ..................................................................... 146 4.3.3– PROCEDIMENTO PARA CONSTRUÇÃO DO LUGAR DAS RAÍZES................................. 149 4.3.4– OS DEZ PASSOS DO PROCEDIMENTO DO LUGAR DAS RAÍZES .................................. 158 4.3.5– ASPECTOS IMPORTANTES DA CONSTRUÇÃO DO LUGAR DAS RAÍZES ...................... 159 4.4 ANÁLISE DA RESPOSTA EM FREQÜÊNCIA ........................................................................ 162 4.4.1 FUNÇÃO DE TRANSFERÊNCIA SENOIDAL.................................................................. 162 4.4.2 GRÁFICOS DE BODE ................................................................................................ 163 4.4.3 ESTABILIDADE RELATIVA E RESPOSTA EM FREQÜÊNCIA.......................................... 174 4.4.4 MARGENS DE ESTABILIDADE .................................................................................. 175 4.4.5 RELAÇÃO ENTRE MARGEM DE FASE E AMORTECIMENTO ......................................... 178
Sistemas de Controle
vii
5. PROJETO DE SISTEMAS DE CONTROLE UTILIZANDO O LUGAR DAS RAÍZES E OS DIAGRAMAS DE BODE.................................................................................................................................. 185 5.1 INTRODUÇÃO ................................................................................................................. 185 5.2 COMPENSADOR EM AVANÇO DE FASE ............................................................................ 185 5.2.1 PROJETO COM O LUGAR DAS RAÍZES........................................................................ 187 5.2.2 PROJETO COM O DIAGRAMA DE BODE .................................................................... 191 5.3 COMPENSADOR EM ATRASO DE FASE ............................................................................. 197 5.3.1 PROJETO COM O LUGAR DAS RAÍZES........................................................................ 197 5.3.2 PROJETO COM O DIAGRAMA DE BODE .................................................................... 199 5.4 CONTROLADOR PROPORCIONAL-INTEGRAL-DERIVATIVO (PID) ..................................... 203 5.4.1 PROJETO COM ROOT LOCUS: ................................................................................... 204 5.4.2 PROJETO COM DIAGRAMA DE BODE: ...................................................................... 205 5.5 COMPENSAÇÃO DE UM COMPENSADOR ABAIXADOR (BUCK) .......................................... 211 REFERÊNCIAS BIBLIOGRÁFICAS ................................................................................... 218
Introdução aos Sistemas de Controle
9
1. INTRODUÇÃO AOS SISTEMAS DE CONTROLE
1.1 Conceitos gerais Sistema de Controle: Uma interconexão de componentes físicos que tem como finalidade controlar (regular/dirigir/comandar) um determinado processo para fornecer uma resposta desejada. Em um sistema de controle uma saída c(t) (variável controlada) é controlada de alguma maneira pré-determinada por uma entrada u(t) (sinal atuante) e dos elementos do sistema. A Fig. 1.1 apresenta, na forma de diagrama de blocos, a relação causaefeito entre esses elementos. Planta: Qualquer dispositivo ou complexo físico a ser controlado, tais como um forno, um reator, uma caldeira. Processo: Na física, definimos processo coma a seqüência de estados de um sistema que se transforma. Em sistemas de controle designamos qualquer operação a ser controlada como um processo. Uma fusão nuclear e uma reação química são exemplos de processos. Perturbações: Uma perturbação ou distúrbio é um sinal de entrada que tende a afetar desfavoravelmente o valor da saída do sistema. Uma perturbação é dita interna quando gerada dentro do sistema e externa quando é gerada fora do sistema, constituindo-se em uma entrada. saída
entrada Sistema de Controle
Fig. 1.1 – Relação entrada e saída em um sistema de controle
Sistemas de Controle
10
Sistemas de controle em malha aberta: O controle em malha aberta fornece ao processo uma entrada tal que a saída se comporta conforme o desejado. Neste caso a ação de controle é independente da saída apresentada pelo processo que se deseja controlar. Um exemplo prático de um sistema de controle em malha aberta é a máquina de lavar roupas que executa uma programação em uma determinada base de tempo. A Fig. 1.2 apresenta um sistema de controle em malha aberta. Observe que uma perturbação externa alterará o valor da saída desejado. O sistema em malha aberto apresenta as seguintes características: (a) Sua precisão é determinada pela calibração dos componentes, bem como da qualidade destes (calibrar significa estabelecer e restabelecer a relação entrada/saída do controlador para obter a resposta desejada para o processo); (b) Geralmente não são perturbados por problemas de instabilidade, o que facilita grandemente a fase de projeto. Sistemas de controle em malha fechada: sistemas onde a variável de saída do processo a controlar tem efeito direto na ação de controle. Os sistemas em malha fechada são comumente chamados de sistemas de controle realimentados pelo fato da variável de saída ser realimentada ao processo via controlador. Neste caso a ação de controle toma como base a comparação entre o valor de referência e o valor atual da variável de saída. Um exemplo intuitivo de sistema de controle em malha fechada é o piloto automático. A realimentação pode ser manual ou automática. A realimentação manual é realizada por um operador, o que a torna lenta e imprecisa. A realimentação automática é realizada por um transdutor, o que possibilita rapidez e precisão. A Fig. 1.3 mostra um sistema de controle em malha fechada e seus principais componentes. Definimos, a seguir, os componentes que ainda não foram apresentados. •
Referência: valor desejado da variável a ser controlada;
•
Comparador: elemento que gera o sinal de erro como a diferença entre a referência e o valor atual; Perturbação saída
entrada Sistema de Controle
Fig. 1.2 – Sistema de controle em malha aberta.
Introdução aos Sistemas de Controle
11
Perturbação Referência r(t)
Sinal de erro e(t) Comparador
Sinal de controle u(t)
Controlador
Atuador + Processo ou Planta
Variável controlada c(t)
Transdutor
Ruído de medição
Fig. 1.3 – Sistema de controle em malha fechada. •
Controlador: elemento que manipula o sinal de erro e gera o sinal de controle que visa corrigir o valor da variável controlada;
•
Atuador: dispositivo de potência que recebe o sinal de controle e produz a entrada para o processo/planta. São exemplos de atuadores o motor elétrico e a válvula pneumática.
•
Transdutor: elemento responsável pela medição e conversão da variável a ser controlada em uma outra variável adequada, que pode ser comparada com a referência. O tacogerador, um pequeno gerador normalmente acoplado ao eixo de um motor e que é usado como sensor de velocidade angular, é um exemplo de transdutor.
O sistema em malha fechada apresenta as seguintes características: a. A sensibilidade a parâmetros do sistema é reduzida; b. Grande precisão; c. Tendência a oscilação e instabilidade. Dorf (2001, p. 9-18) apresenta uma série de exemplos de sistemas de controle que muito bem ilustram a importância fundamental do controle realimentado na sociedade moderna. Sistemas de controle em malha aberta x malha fechada: uma vantagem do sistema de controle em malha fechada é que a realimentação torna a resposta do sistema relativamente insensível a distúrbios externos e variações dos parâmetros do sistema. É possível, portanto, o uso de componentes mais baratos sem muita precisão para obter um controle preciso (auto-regulagem). Por sua vez o controle em malha aberta. por não levar em conta o sinal de saída do sistema é totalmente vulnerável a perturbações externas. Desta forma
Sistemas de Controle
12
os controladores em malha aberta são aconselhados apenas para sistemas onde as entradas são previamente conhecidas e que não estão sujeitos perturbações externas. As Fig. 1.4 e Fig. 1.5 apresentam, respectivamente, o efeito de uma perturbação em um sistema de controle em malha aberta e em um sistema em malha fechada. TP
ωR
α
ωC
Controlador
ω
Motor
ω (rpm)
Aplicação da Perturbação
ω1 =ωC ω2
t
Fig. 1.4 – (a) Sistema de controle em malha aberta sujeito a uma perturbação e (b) seu comportamento diante da aplicação da perturbação. TP
ωr
+ ωe
α Controlador
-
ωb
+
ωC Motor
ω
+
Transdutor
ω (rpm) ω1 = ωC
Aplicação da Perturbação
t Fig. 1.5 – (a) Sistema de controle em malha fechada sujeito a uma perturbação e (b) sua resposta a uma perturbação.
Introdução aos Sistemas de Controle
13
Do ponto de vista da estabilidade, é mais fácil construir um sistema de controle em malha aberta, uma vez que este fator não significa problema. Por sua vez a estabilidade é sempre um problema fundamental em sistemas de controle em malha fechada e, portanto, deve ser analisado com cuidado extremo. Servomecanismos: São sistemas de controle realimentados nos quais a saída é
uma posição ou grandezas derivadas (velocidade, aceleração, etc). O sistema de controle de velocidade de um motor CC é um exemplo de servomecanismo. Reguladores: São sistemas de controle realimentados nos quais a saída desejada é
constante ou varia lentamente com o tempo e onde a finalidade principal é manter a saída em um valor fixo na presença de distúrbios. Exemplo: Reguladores integrados de tensão 78XX. Representação de Sistemas: A maioria dos sistemas dinâmicos, independente de
serem mecânicos, elétricos, térmicos, etc, podem ser representados por meio de equações diferenciais obtidas utilizando-se das leis físicas que governam um sistema particular. A resposta de um sistema particular a uma dada entrada pode ser obtida se estas equações forem resolvidas. Modelo Matemático: É a descrição matemática das características dinâmicas de
um sistema e constitui-se no primeiro passo na análise de um sistema. Ele permite a utilização de várias ferramentas analíticas ou computacionais para fins de análise e/ou síntese. Deve-se estabelecer um compromisso entre a simplicidade do modelo e a precisão dos resultados da análise (os resultados da análise somente na extensão da qual o modelo se aproxima do sistema físico que representa). Sistemas de controle adaptativo: As características dinâmicas da maioria dos
sistemas de controle não são constantes por uma série de motivos, tais como a deterioração de componentes e variação dos parâmetros e do ambiente. Se estas variações forem significativas, o sistema deve possuir a habilidade de adaptação. O sistema que possui esta habilidade, isto é, o sistema que está provido de meios para detectar as variações dos parâmetros da planta e ajustar os parâmetros do controlador para manter um desempenho desejado, é chamado de sistema de controle adaptativo. A Fig. 1.6 apresenta o diagrama de blocos de um sistema adaptativo. O identificador, através de medições, identifica a variação dos parâmetros da planta ou do controlador e atua no ajustador que modifica os parâmetros do controlador.
Sistemas de Controle
14
Ajustador
Identificador Variável controlada
Referência
+
-
Controlador
Planta
Fig. 1.6 – Sistema de controle adaptativo. Sistema lineares: Sistemas lineares são aqueles em que as equações do modelo
matemático são lineares. Uma equação diferencial linear apresenta coeficientes constantes ou que são apenas função da variável independente. Nestes sistemas, aplicando o princípio da superposição, pode-se obter a resposta para várias entradas, considerando uma única entrada de cada vez e adicionando os resultados parciais. Sistemas não-lineares: São aqueles representados por equações diferenciais não-
lineares. Uma equação diferencial não-linear apresenta potências ou funções transcendentais da variável independente, tais como as funções trigonométricas e a exponencial. Normalmente estão ligadas a fenômenos como saturação e zona morta. Estritamente falando, na prática não existem sistemas lineares, já que todos os sistemas físicos apresentam alguma não linearidade. Os modelos lineares são modelos idealizados pelo projetista para simplicidade de análise e projeto. Geralmente quando limitados a uma certa faixa na qual os componentes exibem características lineares, dizemos que o sistema é linear por partes e seu modelo matemático para aquela faixa é também linear. Para sistemas lineares existe uma fartura de técnicas analíticas e gráficas para a análise e projeto. Os sistemas não-lineares, por sua vez, são muito difíceis de serem tratados matematicamente. Sistemas lineares invariantes no tempo: Sistema linear composto de
componentes com parâmetros concentrados que permanecem constantes com o tempo (descritos por equações diferenciais com coeficientes constantes). Na prática a maioria dos sistemas físicos contém elementos que derivam ou variam com o tempo. Por exemplo, a resistência do enrolamento de um motor varia devido ao aquecimento. Sistemas lineares variantes no tempo: São sistemas lineares representados por
equações diferenciais cujos coeficientes são funções do tempo. Por exemplo, o sistema de controle de uma nave espacial sofre influência de uma massa variável em função do consumo de combustível e de uma força gravitacional variável.
Introdução aos Sistemas de Controle
15
Sistemas a dados contínuos: As várias partes do sistema são funções contínuas
do tempo. São também denominados sistemas de controle analógico. Neste tipo de sistema os sinais podem ou não se apresentarem modulados. Componentes típicos de sistemas contínuos são os potenciômetros, comparadores, amplificadores, tacômetros, motores, etc. O sistema de controle de um servomotor CC mostrado na Fig. 1.5(a) é um exemplo de sistema a dados contínuos. Sistemas a dados amostrados: Os sinais em mais de um ponto do sistema se
apresentam como um trem de pulsos ou como um código digital. São também denominados sistemas de controle discretos. Geralmente estão associados a um controle microprocessado onde o papel de controle é desempenhado por um computador digital com um software associado. Os componentes típicos de sistemas amostrados são os codificadores de posição, conversores A/D e D/A, microprocessadores, etc. Um diagrama de blocos de um sistema a dados amostrados é apresentado na Fig. 1.7, onde os sinais que apresentam a notação * estão na forma discreta. Sistemas multivariáveis: São aqueles onde múltiplas entradas e múltiplas saídas
devem ser levadas em conta no esquema de controle. O diagrama de blocos de um sistema multivariável é apresentado na Fig. 1.8. Sistemas de controle de parâmetros concentrados x distribuídos: Nos sistemas
de controle de parâmetros concentrados, o comprimento dos componentes é considerado nulo. Quando a consideração do comprimento é necessária, ou seja, quando o modelo matemático do sistema precisa levar em consideração as variações espaciais dos parâmetros, o sistema é chamado de sistema de controle de parâmetros distribuídos. Esses sistemas são descritos por meio de equações diferenciais em derivadas parciais. Linhas de transmissão longas e vibrações mecânicas em cordas são exemplos de situações onde pode ser necessário considerar o comprimento.
r(t) +
-
e(t)
e* Conversor A/D
u* Computador
u(t) Conversor D/A
c(t) Planta
Transdutor
Fig. 1.7 – Sistema a dados amostrados. A notação * indica parâmetros discretos.
Sistemas de Controle
16
vC1
vr1 Controlador
Processo
vC n
vr n
Transdutor
Fig 1.8 – Sistema multivariável. Sistemas de controle determinísticos x estocásticos: Um sistema de controle é
determinístico se a resposta à entrada é previsível e repetível. Caso contrário, ele é dito estocástico. Nesses sistemas os sinais são descritos por certas características estatísticas. 1.2 Projeto de sistemas de controle
Como todo projeto da área tecnológica, o objetivo do projeto em controle é identificar os parâmetros chave e gerar a configuração de um sistema que enfrente uma necessidade real. O primeiro passo no processo de projeto consiste em estabelecer as metas do sistema. Um exemplo de meta é o controle preciso da velocidade de rotação de um CD player. O segundo passo é identificar as variáveis que se deseja controlar; por exemplo, a velocidade de rotação do CD. O terceiro passo, é escrever as especificações em termos da precisão que se procura alcançar. A precisão conduzirá a identificação do sensor a ser empregado na medição da variável de controle. O quarto passo é estabelecer a configuração do sistema que, normalmente, consiste de um sensor, o processo sob controle, o atuador e o controlador. Por exemplo, se desejamos controlar a velocidade de um CD player, nós selecionaremos um motor CC como atuador; cada elemento selecionado de acordo com as especificações desejadas. O quinto passo é obter um modelo para cada um dos elementos do sistema. O sexto passo é a seleção do controlador, via de regra um amplificador subtrator que compara a resposta desejada com a resposta obtida, gerando um sinal de erro que precisará ser amplificado. O último passo do processo de projeto é o ajuste dos parâmentros do sistema visando atingir a performance desejada. Caso a performance desejada seja alcançada, o projeto é finalizado coma a produção da documentação; em caso contrário, será necessário melhorar a configuração do sistema, atuando, talvez na seleção do atuador e/ou sensor. Dever-se então repetir os passos do projeto até atingir-se as especificações desejadas ou,
Introdução aos Sistemas de Controle
17
ainda, decidir que elas devem ser relaxadas. O processo de projeto de um sistema de controle é apresentado na Fig. 1.9. PROJETO DE UM SISTEMA DE CONTROLE
Estabelecer as metas do controle
Identificação das variáveis de controle
Escrever as especificações para as variáveis
Estabelecer a configuração do sistema Obter o modelo dos componentes do sistema
Seleção do controlador
Ajuste dos parâmetros e análise da performance
Não As especificações foram alcançadas? Sim
Projeto finalizado
Fig. 1.9 – Etapas do projeto de um sistema de controle.
Sistemas de Controle
18
1.3 Uma breve história do controle automático1
O controle realimentado é o mecanismo básico pelo qual os sistemas, sejam mecânicos, elétricos ou biológicos, mantém seu equilíbrio ou homeostase. Nas formas mais elevadas de vida, as condições sob as quais a vida pode prosseguir são bem limitadas. Uma mudança na temperatura de meio grau é geralmente um sinal de doença. A homeostase do corpo é mantida através do uso do controle realimentado (WIENER, 1948). Uma contribuição fundamental de C. R. Darwin no século XIX foi a teoria que a realimentação durante longos períodos de tempo é responsável pela evolução das espécies. Em 1931, V. Volterra explicou o balanço entre duas populações de peixes em um pequeno lago fechado usando a teoria da realimentação. O controle realimentado pode ser definido como o uso da diferença entre sinais, determinados pela comparação dos valores atuais das variáveis do sistema com seus valores desejados, como um meio de controlar um sistema. Um exemplo diário de um sistema de controle realimentado é um controle de velocidade de automóvel, o qual usa a diferença entre a velocidade atual e a desejada para variar a taxa do fluxo do combustível. Já que o sistema de saída é usado para regular sua entrada, tal dispositivo é chamado de sistema de controle em malha fechada.
Nesse livro nós mostraremos como usar a teoria de controle moderno para projetar sistemas de controle realimentados. Assim, nós não nos ocuparemos com sistemas de controle naturais, como aqueles que ocorrem nos organismos vivos ou na sociedade, mas com sistemas de controle feitos pelo homem tais como os usados para controlar aviões, automóveis, satélites, robôs e processos industriais. Percebendo que o melhor meio para compreender uma área é examinar a sua evolução e as razões para a sua existência, nós primeiro apresentaremos uma curta história da teoria do controle automático. Em seguida, nós oferecemos uma breve discussão das filosofias das teorias de controle clássico e moderno. Recentemente, ocorreram vários progressos na teoria do controle automático. É difícil oferecer uma análise imparcial na área enquanto ela ainda se desenvolve; entretanto
1
O texto desta seção e das seções 1.4 e 1.5 são uma tradução do Capítulo I – Introduction to modern control theory, de LEWIS, F.L. Applied optimal control e estimation. Prentice Hall, 1992. Achei importante completar o texto original com ilustrações disponíveis em páginas da Internet. Neste capítulo, Lewis, após uma breve discussão sobre o controle realimentado, apresenta uma breve história do controle automático, a filosofia do controle clássico e a filosofia do controle moderno.
Introdução aos Sistemas de Controle
19
revendo o progresso da teoria de controle realimentado é, agora, possível distinguir algumas tendências principais e apontar alguns avanços chave. O controle realimentado é uma disciplina da engenharia. Como tal, seu progresso está intimamente ligada aos problemas práticos que precisam ser solucionados durante alguma fase da história humana. Os progressos chave na história da espécie humana que afetaram o progresso do controle realimentado foram: •
A preocupação dos gregos e árabes com o registro preciso do tempo. Isto representa um período de aproximadamente 300 aC a 1200 dC.
•
A revolução industrial na Europa. A revolução industrial teve início no terceiro quarto do século XVIII; entretanto, suas raízes podem ser encontradas no século XVII.
•
O início da comunicação em massa e a primeira e a segunda guerras mundiais. Isto representa um período entre 1910 e 1945.
•
O início da era espacial/computacional em 1957.
Pode-se considerar estas como fases no progresso do homem, onde ele primeiro preocupou-se com seu lugar no tempo e no espaço, depois em domesticar seu ambiente e tornar a sua existência mais confortável, depois em estabelecer o seu lugar em uma comunidade global e, finalmente, com seu lugar no cosmos. Em um ponto entre a Revolução Industrial e as Guerras Mundiais, houve um progresso extremamente importante. A saber, a teoria de controle começou a adquirir sua linguagem escrita – a linguagem da matemática. J. C. Maxwell ofereceu a primeira análise matemática rigorosa de um sistema de controle realimentado em 1868. Então, relativo a sua linguagem escrita, nós poderíamos chamar o período anterior a 1868 de pré-história do controle automático. Seguindo Friedland (1986), nós podemos chamar o período a partir de 1868 e anterior ao século XX de período primitivo do controle automático. É padrão chamar o período a partir de então até 1960 de período clássico e o período de 1960 até o tempo presente de período moderno. Deixe-nos, agora, progredir rapidamente através da história do controle automático. Uma referência para o período entre 300 aC e a Revolução Industrial é apresentada por (MAYR, 1970), ao qual nós recorremos e por vezes citamos. Veja também
Sistemas de Controle
20
(FULLER, 1976). Outra referência importante utilizada na preparação desta seção inclui (M. BOKHARAIE, 1973) e discussões pessoais com J. D. Aplevich da Universidade de Waterloo. K. M. Przyluski da Academia Polonesa de Ciência e W. Askew, um antigo colega na Corporação de Mísseis e Espaço LTV e vice-presidente da E-Systems.
1.3.1 Relógios de água dos gregos e dos árabes
A motivação primária para o controle realimentado na antiguidade era a necessidade da determinação exata do tempo. Então, por volta de 270 aC, o Grego Ktesibios inventou um regulador de flutuação para um relógio de água. A função deste regulador era manter o nível d’água em um tanque em uma profundidade constante. Esta profundidade constante produzia um fluxo constante de água através de um tubo no fundo do tanque o qual enchia um segundo tanque com uma taxa constante. O nível de água no segundo tanque dependia, assim, do tempo transcorrido. O regulador de Ktesibios usava um flutuador para controlar a afluência de água de água por uma válvula; quando o nível de água baixava a válvula abria e reabastecia o reservatório. Este regulador de flutuação cumpria a mesma função que a bóia e a válvula em uma descarga moderna. Um regulador de flutuação foi usado por Philon de Bizâncio em 250 aC para manter um nível constante de óleo em uma lâmpada. Durante o primeiro século dC , Heron deAlexandria desenvolveu reguladores de flutuação para relógios de água. Os gregos usavam reguladores de flutuação e dispositivos similares, tais como o preparador automático de vinho, o projeto de sifões para manter constante a diferença de nível de água entre dois tanques, a abertura de portas de templos (Fig. 1.10), etc. Estes dispositivos poderiam ser chamados “aparelhos” já que eles estavam entre os mais precoces exemplos de uma idéia visando uma aplicação. Entre os anos 800 e 1200 vários engenheiros árabes tais como os três irmãos Musa, Al-Jazari e Ibn al-Sa'ati usaram reguladores de flutuação para relógios de água e outras aplicações (Fig. 1.11). Durante este período o importante princípio de realimentação de controle "on/off" foi usado, o qual surge novamente nos anos 50 em conexão com os problemas de tempo mínimo. Quando Bagdá caiu para os Mongóis em 1258, todo o pensamento criativo neste ramo vinha para este fim. Entretanto, a invenção do relógio mecânico no século XIV tornou o relógio de água e seu sistema de controle realimentado obsoleto (o relógio mecânico não é um
Introdução aos Sistemas de Controle
21
sistema de controle realimentado). O regulador de flutuação não aparece novamente até seu uso na Revolução Industrial.
Fig. 1.10 – Dispositivo de Hero para abrir as portas de um templo. Fonte: D’AZZO, John. Análise e projeto de sistemas de controle lineares. Rio de Janeiro: Guanabara Dois, 1984.
Fig. 1.11 – Modelo da bomba de ação dupla com tubos de sucção projetada por Al-Jazari. Fonte: http://www.muslimheritage.com/day_life/default.cfm?ArticleID=188&Oldpage=1.
Junto com uma preocupação por seu lugar no tempo, o homem sempre teve um interesse por seu lugar no espaço. Vale mencionar que um sistema de controle pseudorealimentado foi desenvolvido na China no século XII para propósitos de navegação2. Havia uma carruagem que tinha uma estátua a qual era virada por um mecanismo de engrenagens preso às rodas da carruagem de forma que ela continuamente apontava o sul. Usando a
2
Outras fontes, como http://www.drgears.com/gearterms/terms/southpointingchariot.htm, contam que este dispositivo, conhecido como The South Pointing Chariot, foi desenvolvido por volta de 2600 aC para o imperador Amarelo, Huang Di. Considerando que os chineses desenvolveram a bússola no séc XI, não haveria razão para o desenvolvimento de um mecanismo tão complexo cerca de 100 anos mais tarde (N. do T.).
Sistemas de Controle
22
informação direcional fornecida pela estátua, o cocheiro podia seguir um curso direto. A Fig. 1.12 ilustra este mecanismo. Nós chamamos isto de sistema de controle “pseudorealimentado” já que ele, tecnicamente, não envolve realimentação, a não ser que as ações do cocheiro forem consideradas como partes do sistema. Assim, ele não é um sistema de controle automático.
Fig. 1.12 – Dispositivo conhecido como The South Pointing Chariot Fonte: http://www.drgears.com/gearterms/terms/southpointingchariot.htm.
1.3.2 A Revolução Industrial
A Revolução Industrial na Europa resultou na introdução de atuadores principais, ou máquinas automotoras. Ela foi marcada pela invenção de avançados moinhos de grão, fornos, caldeiras e da máquina a vapor. Estes dispositivos não podiam ser regulados adequadamente pela mão e, assim, surgiu uma nova exigência por sistemas de controle automáticos. Uma variedade de dispositivos de controle foi inventada, incluindo reguladores de flutuação, reguladores de temperatura, reguladores de pressão e dispositivos de controle de velocidade. J. Watt inventou a sua máquina a vapor em 1769 (Fig. 1.13) e esta data marca o início aceito da Revolução Industrial. Porém, as raízes da Revolução Industrial podem ser encontradas antes do século XVII ou anteriormente com o desenvolvimento de moinhos de grão e o forno. Deve-se estar informado que outros, principalmente T. Newcomen em 1712 (Fig. 1.14), construíram as primeiras máquinas a vapor. Porém, as máquinas a vapor antigas eram
Introdução aos Sistemas de Controle
23
ineficientes e reguladas à mão, fazendo-as pouco adaptadas para o uso industrial. É extremamente importante perceber que a Revolução Industrial não começou até a invenção de máquinas melhoradas e de sistemas de controle automáticos para regulá-las.
(a)
(b)
Fig. 1.13 – Esta máquina a vapor de James Watt, construída após 1769, foi uma melhoria da de T. Newcomen, pois tinha um condensador separado e permitia que o vapor fosse admitido, alternadamente, em ambos os lados do pistão. Fontes: (a) http://inventors.about.com/library/inventors/blwatt2.htm e (b) http://leblon.mec.pucrio.br/~wbraga/fentran/termo/hist4.htm.
Fig. 1.14 – Máquina a vapor inventada por Thomas Newcomen em 1712. Fonte http://www.tiscali.co.uk/reference/encyclopaedia/hutchinson/m0026134.html.
Sistemas de Controle
24
1.3.3 Os construtores de moinhos
Os construtores de moinhos da Inglaterra desenvolveram uma variedade de dispositivos de controle realimentado. A cauda de leque, inventada em 1745 pelo ferreiro britânico E. Lee, consistia de um pequeno leque montado em ângulos convenientes na roda principal de um moinho de vento. Sua função era direcionar o moinho de vento continuamente para o vento. O moinho de tremonha era um dispositivo que regulava o fluxo de grãos em um moinho dependendo da velocidade de rotação da mó. Estava em uso em uma forma bastante refinada em torno de 1588. Para construir um controlador realimentado, é importante ter dispositivos de medição adequados. Os construtores de moinhos desenvolveram vários dispositivos para
sensorar velocidade de rotação. Usando estes sensores foram inventados vários dispositivos de regulação de velocidade, incluindo velas de moinho de vento auto-reguladas. Mais tarde, muito da tecnologia dos construtores de moinhos foi desenvolvido para uso na regulação de máquinas a vapor.
(a)
(b)
Fig. 1.15 – (a) Parte inferior e (b) superior de um moinho de rodízio, onde podemos visualizar a mó (11) e a tremonha (14). Fonte: http://www.naya.org.ar/congreso2000/ponencias/Jose_Augusto_Maia_Marques.htm.
Introdução aos Sistemas de Controle
25
1.3.4 Reguladores de Temperatura
Cornelis Drebbel da Holanda passou algum tempo na Inglaterra e um período breve com o Imperador romano Santo Rudolfo II em Praga, junto com o seu contemporâneo J. Kepler. Em torno de 1624, ele desenvolveu um sistema de controle automático de temperatura para um forno, motivado por sua fé que metais básicos poderiam virar ouro mantendo-os a uma temperatura constante exata por longos períodos de tempo. Ele também usou este regulador de temperatura em uma incubadora para chocar galinhas. Reguladores de temperatura foram estudados por J. J. Becher em 1680 e usados novamente em uma incubadora pelo Príncipe de Conti e R. A. F. de Réaumur em 1754. O “registrador sentinela” foi desenvolvido na América por W. Henry perto de 1771, que sugeriu seu uso em fornos químicos, na manufatura de aço e porcelana e no controle de temperatura de um hospital. Não era ainda 1777, entretanto, quando um regulador de temperatura satisfatório para uso industrial foi desenvolvido por Bonnemain, que o usou para uma incubadora. Seu dispositivo foi instalado, mais tarde, no forno de uma planta de aquecimento de água.
1.3.5 Reguladores de flutuação
A regulação do nível de um líquido foi necessária em duas áreas principais nos meados do século XVIII: na caldeira de uma máquina a vapor e em sistemas domésticos de distribuição de água. Então, o regulador de flutuação recebeu novo interesse, especialmente na Inglaterra. Em seu livro de 1746, W. Salmon citou preços para reguladores de flutuação de bóia e torneira usados para manter o nível de reservatórios de água residenciais. Este regulador foi usado nas primeiras patentes para descargas de banheiro ao redor de 1775. A descarga de banheiro foi, mais adiante, refinada por Thomas Crapper, um encanador de Londres que foi condecorado pela Rainha Victoria por suas invenções. O primeiro uso conhecido de um regulador de flutuação de válvula em uma caldeira a vapor é descrito em uma patente emitida a J. Brindley em 1758. Ele usou o regulador em uma máquina a vapor para bombear água. S. T. Wood usou um regulador de flutuação para uma máquina a vapor na sua cervejaria em 1784. Na Sibéria russa, o mineiro
Sistemas de Controle
26
de carvão I.I Polzunov desenvolveu em 1765 um regulador de flutuação para uma máquina a vapor que acionava ventiladores para alto fornos. Por volta de 1791, quando foi adotado pela empresa de Boulton e Watt, o regulador de flutuação era de uso comum em máquinas a vapor.
1.3.6 Reguladores de Pressão
Outro problema associado com a máquina a vapor é o da regulação de pressão de vapor na caldeira, pois o vapor que aciona a máquina deve estar a uma pressão constante. Em 1681, D. Papin inventou uma válvula de segurança para uma panela de pressão, e em 1707 ele usou-a como um dispositivo regulador na sua máquina a vapor. Depois, isso foi uma característica padrão em máquinas a vapor. O regulador de pressão foi, posteriormente, refinado em 1799 por R. Delap e, também, por M. Murray. Em 1803, um regulador de pressão foi combinado com um regulador de flutuação por Boulton e Watt para uso nas suas máquinas a vapor.
1.3.7 Reguladores centrífugos
As primeiras máquinas a vapor proviam um movimento de produção alternativo que era regulado usando um dispositivo conhecido como uma catarata, semelhante a uma válvula de flutuação. A catarata surgiu nas máquinas de bombeamento das minas de carvão Cornwall. A máquina de vapor de J. Watt com movimento de produção rotativo alcançou a maturidade por volta de 1783, quando a primeira foi vendida. O incentivo principal para seu desenvolvimento era, evidentemente, a esperança de introduzir um motor principal na moagem. Usando a máquina de produção rotativa, o moinho a vapor Albion começou a operar no inicio de 1786. Um problema associado com a máquina a vapor rotativa é o de regulação da sua velocidade de revolução. Parte da tecnologia de regulação de velocidade dos construtores de moinho foi desenvolvido e estendeu-se para este propósito.
Introdução aos Sistemas de Controle
27
Em 1788, Watt completou o projeto do regulador centrífugo de esferas suspensas (Fig. 1.16) para regular a velocidade da máquina a vapor rotativa. Este dispositivo empregava duas esferas suspensas que giravam sobre um eixo e que eram arremessados para fora pela força centrífuga. Quando a velocidade de rotação aumentava, os pesos suspensos oscilavam mais para fora e para cima, operando uma válvula de estrangulamento do fluxo de vapor a qual reduzia a velocidade da máquina. Assim, uma velocidade constante era alcançada automaticamente. Os dispositivos de realimentação previamente mencionados permaneceram obscuros ou fizeram um papel imperceptível como uma parte da maquinaria que eles controlavam. Por outro lado, a operação do regulador de esferas suspensas era claramente visível até mesmo para o olho destreinado e seu princípio tinha um sabor exótico que parecia para muitos encarnar a natureza da nova era industrial. Então, o regulador chegou ao conhecimento do mundo de engenharia e se tornou uma sensação por toda a Europa. Este foi o primeiro uso de controle de realimentação que era do conhecimento popular.
(a)
(b)
Fig. 1.16 – A máquina a vapor de Watt e o regulador de esferas suspensas. Fontes: (a) http://www.history.rochester.edu/steam/thurston/1878/f27p104.gif e (b) http://oldenginehouse.users.btopenworld.com/watt.htm.
Sistemas de Controle
28
Vale lembrar que a palavra grega para regulador é kubernaw. Em 1947, Norbert Wiener no MIT estava procurando um nome para a sua nova disciplina de teoria de autômatos - controle e comunicação entre homem e máquina. Ao investigar o regulador de esferas suspensas de Watt, ele também investigou a etimologia da palavra kubernaw e se deparou com a palavra grega para piloto, kubenhthz. Assim, ele selecionou o nome cibernética para o seu campo incipiente. Por volta 1790 na França, os irmãos Périer desenvolveram um regulador de flutuação para controlar a velocidade de uma máquina a vapor, mas a técnica deles não se equiparava ao regulador centrífugo e foi logo suplantada.
1.3.8 O Pêndulo simpático
Tendo começado nossa história do controle automático com os relógios de água da Grécia antiga, nós voltamos a esta porção da história com um retorno para a preocupação do gênero humano com tempo. O relógio mecânico inventado no século XIV não era um sistema de controle realimentado em malha fechada, mas um dispositivo oscilatório de precisão em malha aberta cuja exatidão era assegurada através de proteção contra perturbações externas. Em 1793, o franco-suíço A. L. Breguet, o relojoeiro mais famoso de seu tempo, inventou um sistema realimentado em malha fechada para sincronizar relógios de bolso. O pêndulo simpático de Breguet (Fig. 1.17) usou um caso especial de regulação de velocidade. Consistiu em um cronômetro de precisão grande e exato com um engaste para um relógio de bolso. O relógio de bolso a ser sincronizado é colocado no engaste ligeiramente antes das 12 horas, tempo em que um pino emerge do cronômetro, insere-se no relógio e começa um processo de ajustar automaticamente o braço regulador da mola de equilíbrio do relógio. Depois de algumas colocações do relógio no pêndulo simpático, está automaticamente ajustado o braço regulador. De certo modo, este dispositivo era usado para transmitir a exatidão do cronômetro grande ao relógio de bolso portátil pequeno.
1.3.9 O nascimento da Teoria Matemática do Controle
Introdução aos Sistemas de Controle
29
Os projetos de sistemas de controle realimentados através da Revolução Industrial eram de tentativa e erro, junto com muita intuição de engenharia. Assim, eram mais uma arte do que uma ciência. Em meados do século XIX, a matemática foi pela primeira vez usada para analisar a estabilidade de sistemas de controle realimentados. Considerando que a matemática é o idioma formal de teoria de controle automática, nós poderíamos chamar o período anterior a este de pré-história da teoria de controle.
Fig. 1.17 – Réplica do pêndulo simpático de Breguet. Fonte: http://www.thepurists.com/watch/features/interviews/journejan03/.
1.3.10 Equações diferenciais
Em 1840, o astrônomo real britânico em Greenwich, G. B. Airy desenvolveu um dispositivo realimentado para direcionar um telescópio. O seu dispositivo era um sistema de controle de velocidade que virava automaticamente o telescópio para compensar a rotação da terra, provendo a capacidade para estudar uma determinada estrela durante um tempo longo. Infelizmente, Airy descobriu que devido ao projeto impróprio do laço de controle realimentado, foram introduzidas fortes oscilações no sistema. Ele foi o primeiro a discutir as equações diferenciais de estabilidade na sua análise (AIRY, 1840). A teoria de equações diferenciais estava, até então, bem desenvolvida devido à descoberta do cálculo infinitesimal por I. Newton (1642-1727) e G. W. Leibniz (1646-1716) e ao trabalho dos irmãos Bernoulli (final do século XVII e início do século XVIII), J. F. Riccati (1676-1754) e outros. O uso de
Sistemas de Controle
30
equações diferencial para a análise do movimento de sistemas dinâmico foi estabelecido por J. L. Lagrange (1736-1813) e W. R. Hamilton (1805-1865). 1.3.11 Teoria da estabilidade
O primeiro trabalho de análise matemática de sistemas de controle estava em termos de equações diferenciais. J. C. Maxwell analisou a estabilidade do regulador de esferas suspensas de Watt (MAXWELL, 1868). A sua técnica foi linearizar as equações diferenciais do movimento para encontrar a equação característica do sistema. Ele estudou o efeito dos parâmetros do sistema sobre a estabilidade e mostrou que o sistema é estável se as raízes da equação característica têm partes reais negativas. Com o trabalho de Maxwell nós podemos dizer que a teoria de sistemas de controle estava firmemente estabelecida. E. J. Routh forneceu uma técnica numérica para determinar quando uma equação característica tem raízes estáveis (ROUTH, 1877). Independentemente de Maxwell, o russo I. I. Vishnegradsky [1877] analisou a estabilidade de reguladores usando equações diferenciais. Em 1893, A.B. Stodola estudou a regulação de uma turbina de água usando as técnicas de Vishnegradsky. Ele modelou a dinâmica do atuador e incluiu o atraso do mecanismo atuador na sua análise. Ele foi o primeiro a mencionar a noção da constante de tempo do sistema. Desinformado do trabalho de Maxwell e Routh, ele colocou o problema de determinar a estabilidade da equação característica para A. Hurwitz (1895), que o resolveu independentemente. O trabalho de A. M. Lyapunov foi fértil na teoria de controle. Em 1892, ele estudou a estabilidade de equações diferenciais não lineares usando uma noção generalizada de energia (LYAPUNOV, 1893). Infelizmente, embora o seu trabalho fosse aplicado e continuou na Rússia, o tempo não estava maduro no Oeste para a sua elegante teoria e ela permaneceu desconhecida lá até aproximadamente 1960, quando sua importância foi finalmente percebida. O engenheiro britânico O. Heaviside inventou o cálculo operacional entre 1892 e 1898. Ele estudou o comportamento transitório de sistemas apresentando uma noção equivalente àquela de função de transferência.
1.3.12 Teoria de sistema
Introdução aos Sistemas de Controle
31
É dentro do estudo de sistemas que a teoria de controle realimentado tem o seu lugar na organização do conhecimento humano. Assim, o conceito de um sistema como uma entidade dinâmica com “entradas” e “saídas” definidas que se associam a outros sistemas e ao ambiente foi uma condição chave para o desenvolvimento posterior da teoria de controle automático. A história da teoria de sistema requer um estudo completo isolado, mas segue um breve esboço. Durante os séculos dezoito e dezenove, o trabalho de A. Smith em economia (A Riqueza de Nações, 1776), as descobertas de C. R. Darwin (Sobre a Origem das Espécies por meio da Seleção Natural, 1859) e outros progressos em política, sociologia, dentre outros,
estavam tendo um grande impacto na consciência humana. O estudo de Filosofia Natural era uma conseqüência do trabalho dos filósofos gregos e árabes e contribuições foram feitas por Nicholas de Cusa (1463), Leibniz e outros. Os progressos do século XIX, condimentados pela Revolução Industrial e uma apreciação em expansão do conhecimento em geopolítica global e em astronomia teve uma profunda influência nesta Filosofia Natural, motivando-a a mudar sua personalidade. No início do século XX, A. N. Whitehead (1925), com a sua filosofia ds “mecanismo orgânico”, L. von Bertalanffy (1938) com seus princípios hierárquicos de organização e outros começaram a falar de uma “teoria geral do sistema”. Neste contexto, prosseguia a evolução de teoria de controle.
1.3.13 Comunicação de massa e o sistema de telefone de Bell
No começo do século XX ocorreram dois acontecimentos importantes do ponto de vista de teoria de controle: o desenvolvimento do telefone e das comunicações de massa e as guerras mundiais.
1.3.14 Análise no domínio-freqüência
A análise matemática de sistemas de controle tinha, até aqui, sido executada usando equações diferenciais no domínio de tempo. Nos Laboratórios de Telefonia de Bell durante o período entre 1920 e 1930, as abordagens no domínio da freqüência desenvolvidas por P. S. de Laplace (1749-1827), J. Fourier (1768-1830), A. L. Cauchy (1789-1857) e outros, foram exploradas e utilizadas em sistemas de comunicação.
Sistemas de Controle
32
Um problema fundamental com o desenvolvimento de um sistema de comunicação de massa que se estendesse a longas distâncias é a necessidade de amplificar periodicamente o sinal de voz ao longo das linhas de telefônicas. Infelizmente, a menos que o cuidado seja exercido, não só a informação, mas também os ruídos são amplificados. Assim, o projeto de amplificadores repetidores satisfatórios é de fundamental importância. Para reduzir a distorção em amplificadores repetidores, H. S. Black demonstrou, em 1927, a utilidade da realimentação negativa (BLACK, 1934). O problema de projeto era introduzir um deslocamento de fase no sistema em freqüências corretas. A Teoria da regeneração para o projeto de amplificadores estáveis foi desenvolvida por H. Nyquist (1932). Ele derivou o seu critério de estabilidade de Nyquist baseado no gráfico polar de uma função complexa. Em 1938, H.W. Bode usou a resposta em freqüência da magnitude e da fase de uma função complexa (BODE, 1940). Ele investigou a estabilidade em malha fechada usando as noções de margem de ganho e de fase.
1.3.15 As guerras mundiais e o Controle Clássico
Quando a comunicações de massa e os modos mais rápidos de viagem tornaram o mundo menor, houve muita tensão quando os homens examinaram seus lugares em uma sociedade global. O resultado foi as guerras mundiais, durante as quais o desenvolvimento de sistemas de controle realimentados se tornaram uma questão de sobrevivência.
1.3.16 Controle de navio
Um problema militar importante durante este período foi o controle e a navegação de navios, os quais estavam se tornando mais avançados nos seus projetos. Entre os primeiros progressos estava o projeto de sensores para a finalidade de controle em malha fechada. Em 1910, E. A. Sperry inventou o giroscópio (Fig. 1.18), o qual ele usou na estabilização e pilotagem de navios e depois em controle de aeronaves. N. Minorsky [1922] apresentou o seu controlador de três termos para a pilotagem de navios, tornando-se, assim, o primeiro a usar o controlador proporcional-integralderivativo (PID). Ele considerou efeitos não lineares no sistema de malha fechada.
Introdução aos Sistemas de Controle
33
1.3.17 Desenvolvimento de armas e direcionamento de canhões
Um problema fundamental durante o período das guerras mundiais foi o direcionamento exato das armas a bordo de navios e aeronaves. Com a publicação de “Teoria dos Servomecanismos” por H. L. Házen (1934), iniciou-se o uso de teoria de controle matemática em tais problemas. No seu artigo, Házen cunhou a palavra servomecanismos que implica em uma relação mestre-escravo em sistemas.
Fig. 1.18 – Giroscópio de Sperry. Fonte: http://www.sperry-marine.com/company-information_sperry-history.asp.
A mira de bomba Norden (Fig. 1.19), desenvolvida durante Segunda Guerra Mundial, usou repetidores síncronos para retransmitir informação sobre altitude e velocidade da aeronave e perturbações de vento para a mira, assegurando a distribuição precisa das armas.
1.3.18 Laboratório de Radiação do M.I.T.
Para estudar os problemas de controle e de processamento de informação associados ao recém inventado radar, o Laboratório de Radiação foi fundado no Instituto de
Sistemas de Controle
34
Tecnologia Massachussetts em 1940. Muito do trabalho de teoria de controle durante os anos 40 saiu deste laboratório. Enquanto trabalhava em um projeto em comum do M.I.T. e da Corporação de Sperry em 1941, A.C. Hall reconheceu os efeitos danosos de ignorar os ruídos em projetos de sistemas de controle. Ele percebeu que a tecnologia do domínio em freqüência desenvolvida nos laboratórios Bell poderia ser empregada para enfrentar os efeitos dos ruídos e usou esta abordagem para projetar um sistema de controle para um radar aerotransportado. Este sucesso demonstrou, conclusivamente, a importância das técnicas no domínio da freqüência para o projeto de sistemas de controle (HALL, 1946).
(a)
(b) Fig. 1.19 - A mira de bomba Norden.
Fontes: (a) http://www.airpowermuseum.org/trnorden.html. e (b) http://www.twinbeech.com/norden_bombsight.htm.
Usando abordagens de projeto baseadas na função de transferência, diagrama de bloco e métodos no domínio da freqüência, houve um grande sucesso no projeto de controles no Laboratório de Radiação. Em 1947, N. B. Nichols desenvolveu o seu diagrama de Nichols para o projeto de sistemas realimentados. Com o trabalho no M.I.T., a teoria de
Introdução aos Sistemas de Controle
35
servomecanismos lineares foi firmemente estabelecida. Um resumo do trabalho no Laboratório de Radiação do M.I.T. é fornecido em Teoria dos Servomecanismos (NICHOLS e PHILLIPS, 1947). Trabalhando na aviação norte-americana, W. R. Evans (1948) apresentou a sua técnica do lugar das raízes que forneceu um modo direto para determinar os locais dos pólos de malha fechada no plano s. Subseqüentemente, durante os anos 50, muitos trabalhos de controles estavam focalizados no plano s e em obter características desejáveis de resposta a degrau em sistemas de malha fechada em termos de tempo de subida, sobre-sinal percentual e assim por diante.
1.3.19 Análise estocástica
Durante este período, foram introduzidas, também, técnicas estocásticas no controle e na teoria de comunicação. No M.I.T em 1942, N. Wiener (1949) analisou sistemas de processamento de informação usando modelos de processos estocásticos. Trabalhando no domínio da freqüência, ele desenvolveu um filtro estatisticamente ótimo para sinais estacionários contínuos no tempo que melhoraram a relação sinal/ruído em sistemas de comunicação. O russo A. N. Kolmogorov (1941) forneceu uma teoria para processos estocásticos estacionários discretos no tempo.
1.3.20 O período clássico de teoria de controle
Até agora, a teoria de controle automática usando técnicas no domínio da freqüência tinha vindo da era, se estabelecendo como um paradigma (no senso de KUHN, 1962). Por um lado, tinha sido estabelecida uma teoria matemática firme para servomecanismos, e por outro, foram fornecidas técnicas de projeto em engenharia. O período após a Segunda Guerra Mundial pode ser chamado de período clássico de teoria de controle. Ele foi caracterizado pelo aparecimento dos primeiros livros de ensino (MACCOLL, 1945; LAUER; LESNICK e MATDON, 1947; BROWN e CAMPBELL, 1948; CHESTNUT e MAYER, 1951; TRUXALL, 1955) e por ferramentas de projetos diretas que proveram grande intuição e soluções garantidas para problemas de projeto. Estas ferramentas foram aplicadas usando calculadoras de mão, ou no máximo regras de cálculo, junto com técnicas gráficas.
Sistemas de Controle
36
1.3.21 A era espacial/do computador e o Controle Moderno
Com o advento da era espacial, os projetos de controle nos Estados Unidos rejeitaram as técnicas no domínio da freqüência da teoria de controle clássica e voltaram para as técnicas de equação diferencial do final do século XIX, as quais eram expressas no domínio do tempo. As razões para este desenvolvimento são as que seguem. 1.3.22 Projeto no domínio do tempo para sistemas não lineares
O paradigma de teoria de controle clássica era muito satisfatório para problemas de projeto de controle durante e imediatamente após as guerras mundiais. A abordagem no domínio da freqüência era apropriada para sistemas lineares invariantes no tempo. Era a melhor para lidar com sistemas de única-entrada/única saída, pois era inconveniente aplicar técnicas gráficas a múltiplas entradas e saídas. Projetos de controle clássico tiveram algum sucesso com sistemas não lineares. Usando as propriedades de rejeição de ruído das técnicas no domínio da freqüência, um sistema de controle pode ser projetado como robusto as variações nos parâmetros do sistema e para erros de medida e perturbações externas. Assim, podem ser usadas técnicas clássicas em uma versão linearizada de um sistema não-linear, dando bons resultados no ponto de equilíbrio sobre o qual o comportamento de sistema é aproximadamente linear. Também podem ser aplicadas técnicas no domínio da freqüência a sistemas com tipos simples de não linearidades usando a abordagem da função de descrição que conta com o critério de Nyquist. Esta técnica foi usada pela primeira vez pelo polonês J. Groszkowski no projeto de um transmissor de rádio antes da Segunda Guerra Mundial e formalizada em 1964 por J. Kudrewicz. Infelizmente, não é possível projetar sistemas de controle para sistemas não lineares avançados multivariáveis, como os que surgiram em aplicações aeroespaciais, usando a suposição de linearidade e tratando os pares de transmissão única-entrada/única-saída um a cada vez. Na União Soviética, havia muita atividade no projeto de controles não-lineares. Seguindo os passos de Lyapunov, a atenção foi focada nas técnicas no domínio do tempo. Em 1948, Ivachenko investigou o princípio de controle a relé onde o sinal de controle é comutado descontinuamente entre valores discretos. Tsypkin usou o plano de fase no projeto
Introdução aos Sistemas de Controle
37
de controles não lineares em 1955. V. M. Popov [1961] proveu o seu o critério de círculo para análise de estabilidade não linear.
1.3.23 Sputnik - 1957
Dado a história de teoria de controle na União Soviética, só é natural que o primeiro satélite, o Sputnik, fosse lançado lá em 1957. A primeira conferência da recém formada Federação Internacional de Controle Automático (IFAC) foi apropriadamente realizada em Moscou em 1960. O lançamento do Sputnik engendrou uma tremenda atividade nos Estados Unidos no projeto de controles automáticos. No fracasso de qualquer paradigma, requer-se um retorno histórico e natural para os primeiros princípios. Assim, ficou claro que era necessário um retorno às técnicas no domínio do tempo do período “primitivo” da teoria de controle que era baseado em equações diferenciais. Seria percebido que o trabalho de Lagrange e Hamilton fez isto ao escrever equações não-lineares simples de movimento para muitos sistemas dinâmicos. Assim era necessária uma teoria de controle que poderia lidar com tais equações diferenciais não lineares. É bastante extraordinário que quase exatamente em 1960, os progressos fundamentais aconteceram independentemente em várias frentes na teoria da comunicação e controle.
1.3.24 Navegação
Em 1960, C. S. Draper inventou o seu sistema de navegação inercial que usava giroscópios usados para fornecer informação precisa sobre a posição de um corpo que se movia espaço, como um navio, aeronave ou astronave. Assim, foram desenvolvidos os sensores apropriados para navegação e projeto de controles.
1.3.25 Otimalidade em Sistemas Naturais
Johann Bernoulli mencionou o Princípio da Otimalidade primeiro com relação ao Problema de Brachistochrone em 1696. Este problema foi resolvido pelos irmãos Bernoulli e
Sistemas de Controle
38
por I. Newton, e ficou claro que a busca por otimalidade é uma propriedade fundamental do movimento em sistemas naturais. Vários princípios de otimalidade foram investigados, inclusive o princípio to tempo mínimo na ótica de P. Fermat (século XVII), o trabalho de L. Euler em 1744 e os resultados de Hamilton que um sistema move-se de tal modo a minimizar a integral no tempo da diferença entre as energias cinética e potencial. Estes princípios de otimalidade são todos princípios de mínimo. De forma bastante interessante, no começo do século XX, A. Einstein mostrou que, relativo ao sistemas de coordenadas espaço-tempo 4D, o movimento dos sistemas ocorre de tal modo a maximizar o tempo.
1.3.26 Controle Ótimo e Teoria da Estimação
Considerando que sistemas naturais exibem otimalidade nos seus movimentos, faz sentido projetar sistemas de controle artificiais de um jeito ótimo. Uma vantagem principal é que este projeto pode ser realizado no domínio do tempo. No contexto dos projetos de controle moderno, é habitual minimizar o tempo de trânsito, ou um funcional de energia quadrática generalizada ou índice de desempenho, possivelmente com algumas restrições nos controles permitidos. Ao aplicar programação dinâmica ao controle ótimo de sistemas de tempo discreto, R. Bellman [1957] demonstrou que a direção natural para resolver problemas de controle ótimo é ir para trás no tempo. O seu procedimento resultou em esquemas de realimentação em malha fechada geralmente não-lineares. Antes de 1958, L. S. Pontryagin desenvolveu o seu princípio de máximo que resolveu problemas de controle ótimo contando com o cálculo de variações desenvolvido por L. Euler (1707-1783). Ele resolveu o problema de tempo mínimo, derivando uma lei de controle a relé on/off como o controle ótimo (PONTRYAGIN, BOLTYANSKY, GAMKRELIDZE e MISHCHENKO, 1962). Nos EUA, durante os anos 50, aplicou-se o cálculo de variações a problemas gerais de controle ótimo na Universidade de Chicago e em outros lugares. Em 1960, três importantes artigos foram publicados por R. Kalman e colaboradores, trabalhando nos EUA Um destes (KALMAN e BERTRAM, 1960), deu publicidade ao trabalho vital de Lyapunov no controle de sistemas não-lineares no domínio do
Introdução aos Sistemas de Controle
39
tempo. O segundo (KALMAN, 1960a), discutiu o controle ótimo de sistemas, provendo as equações de projeto para o regulador linear quadrático (LQR). O terceiro artigo (KALMAN, 1960b), discutiu filtragem ótima e teoria de estimação, provendo as equações de projeto para o filtro de Kalman discreto. O filtro de Kalman contínuo foi desenvolvido por Kalman e Bucy (1961). No período de um ano, foram superadas as principais limitações de teoria de controle clássica, foram introduzidas novas ferramentas teóricas importantes e uma nova era na teoria de controle tinha iniciado; nós a chamamos de era do controle moderno. Os pontos fundamentais do trabalho de Kalman são os que seguem. É uma abordagem no domínio do tempo, fazendo-a mais aplicável em sistemas lineares variantes no tempo como também em sistemas não-lineares. Ele introduziu a álgebra linear e matrizes, de forma que sistemas com múltiplas entradas e saídas poderiam ser facilmente tratados. Ele empregou o conceito do estado interno do sistema; assim, a abordagem é tal que está preocupada com a dinâmica interna do sistema e não só com o seu comportamento de entrada/saída. Na teoria de controle, Kalman formalizou a noção de otimalidade na teoria de controle minimizando uma mais geral função de energia quadrática generalizada. Na teoria da
estimação, ele introduziu noções estocásticas que, aplicadas a sistemas variantes no tempo não estacionários, provêem uma solução recursiva, o filtro de Kalman, para abordagem dos mínimos quadrados usada primeiro por C.F. Gauss (1777-1855) na estimação da órbita planetária. O filtro de Kalman é a extensão natural do filtro de Wiener para sistemas estocásticos não estacionários. Técnicas clássicas no domínio da freqüência provêem ferramentas formais para o projeto de sistemas de controle, contudo a fase de projeto em si permaneceu mais uma arte e resultou em sistemas de realimentação não-únicos. Por contraste, a teoria de Kalman proveu soluções ótimas que renderam sistemas de controle com desempenho garantido. Estes
controles foram diretamente encontrados resolvendo equações de projeto matriciais formais que geralmente têm soluções únicas. Não é nenhum acidente que deste ponto floresceu o programa espacial norteamericano, com um filtro de Kalman provendo dados navegacionais para a primeira aterrissagem lunar.
Sistemas de Controle
40
1.3.27 Teoria de controle não-linear
Durante os anos 1960 nos EUA, G. Zames (1966), I. W. Sandberg (1964), K. S. Narendra (NARENDRA e GOLDWYN, 1964), C. A. Desoer (1965) e outros estenderam o trabalho de Popov e Lyapunov em estabilidade não-linear. Havia uma aplicação extensa destes resultados no estudo de distorção não-linear em laços de realimentação com banda limitada, controle de processos não-linear, projeto de controles de aeronaves e, eventualmente, em robótica.
1.3.28 Computadores no projeto de controles e implementação
Técnicas de projeto clássicas podiam ser empregadas à mão usando abordagens gráficas. Por outro lado, o projeto de controle moderno requer a solução de complicadas equações matriciais não-lineares. Afortunadamente, em 1960 ocorreram os principais progressos em outra área – a tecnologia do computador digital.
Sem computadores, o
controle moderno teria aplicações limitadas.
1.3.29 O Desenvolvimento dos computadores digitais
Em aproximadamente 1830, C. Babbage introduziu os princípios dos computadores modernos, inclusive memória, controle de programa e desvio de processamento. Em 1948, J. von Neumann dirigiu a construção, em Princeton, do computador de programa armazenado IAS. A IBM construiu sua máquina de programa armazenado SSEC Em 1950, Sperry Rand construiu a primeira máquina de processamento de dados comercial, o UNIVAC I. Em seguida, a IBM comercializou o computador 701. Em 1960 aconteceu um avanço fundamental - foi introduzida a segunda geração de computadores que usava tecnologia de estado sólido. Por volta de 1965, A Corporação de Equipamentos Digitais estava construindo o PDP-8 e a indústria do minicomputador começou. Finalmente, em 1969, W. Hoff inventou o microprocessador.
Introdução aos Sistemas de Controle
41
1.3.30 Controle digital e teoria da filtragem
Computadores digitais são necessários para dois propósitos em controle moderno. Primeiro, eles são necessários para resolver as equações de projeto matriciais que produzem a lei de controle. Isto é realizado off-line durante o processo de projeto. Segundo, já que as leis de controle ótimo e filtros são geralmente variantes no tempo, eles são necessários para implementar o controle moderno e esquemas de filtragem nos sistemas atuais.
Com o advento do microprocessador em 1969, uma área nova se desenvolveu. Sistemas de controle que são implementados em computadores digitais devem ser formulados em tempo discreto. Então, o crescimento de teoria de controle digital era natural neste momento. Durante os anos 50, a teoria de sistemas de dados amostrados estava sendo desenvolvida na Columbia por J. R. Ragazzini, G. Franklin e L. A. Zadeh (RAGAZZINI e ZADEH, 1952; RAGAZZINI e FRANKLIN, 1958); bem como por E. I. Júri (1960), A. C. Kuo (1963) e outros. A idéia de usar computadores digitais para controle de processos industriais emergiu durante este período (ÅSTRÖM e WITTENMARK, 1984). Um trabalho
sério, iniciado em 1956 com o projeto de colaboração entre TRW e Texaco, resultou em um sistema controlado por computador sendo instalado na refinaria de óleo Porto Arthur no Texas em 1959. O desenvolvimento de reatores nucleares durante os anos 50 era uma motivação fundamental para explorar o controle de processos industriais e instrumentação. Este trabalho tem suas raízes no controle de plantas químicas durante os anos 40. Antes dos anos 70, com o trabalho de K. Åström (1970) e outros, a importância dos controles digitais na aplicação de processos estava firmemente estabelecida. O trabalho de C. E. Shannon nos anos 50 nos Laboratórios Bell tinha revelado a importância das técnicas de dados amostrados no processamento de sinais. Foram investigadas as aplicações da teoria filtragem digital na Corporação de Ciências Analítica (GELB, 1974) e em outros lugares.
Sistemas de Controle
42
1.3.31 O Computador pessoal
Com a introdução do PC em 1983, o projeto de sistemas de controle moderno tornou-se possível para engenheiros free-lancers. Depois disso, uma abundância softwares para projeto de sistemas de controle foram desenvolvidos, incluindo ORACLS, CC Program, Control-C, PC-Matlab, MATRIXx, Easy5, SIMNON e outros.
1.3.32 A união do controle moderno e do clássico
Com a publicação dos primeiros livros de ensino nos anos 60, a teoria de controle moderno se estabeleceu como um paradigma para projetos de controles automáticos nos EUA. Seguiu-se uma intensa atividade em pesquisa e implementação, com o I.R.E. e o A.I.E.E. fundindo-se, em grande parte pelos esforços de P. Haggerty na Texas Instruments, para formar o Instituto de Engenheiro Eletricistas e Eletrônicos (I.E.E.E) nos início dos anos 60. Com todo o seu poder e vantagens, o controle moderno falhou em alguns aspectos. O desempenho garantido obtido pela solução de equações de projeto matriciais significa que é freqüentemente possível projetar um sistema de controle que funciona teoricamente sem ganhar qualquer intuição de engenharia sobre o problema. Por outro lado, as técnicas no domínio da freqüência da teoria de controle clássico fornecem muita intuição. Outro problema é que um sistema de controle moderno com qualquer compensador dinâmico pode não ser robusto a perturbações, dinâmicas não modeladas e ruídos de medição. Por outro lado, a robustez está embutida na abordagem do domínio da freqüência que usa noções como a margem ganho e de fase. Então, nos anos 70, especialmente na Grã Bretanha, havia muita atividade por parte de H. H. Rosenbrock (1974), A. G. J. MacFarlane e I. Postlethwaite (1977) e outros para estender as técnicas clássicas no domínio da freqüência e o lugar das raízes a sistemas multivariáveis. Sucessos foram obtidos usando noções como o lugar característico, a dominância diagonal e o arranjo inverso de Nyquist. Um proponente importante de técnicas clássicas para sistemas multivariáveis foi I. Horowitz, cuja teoria quantitativa da realimentação desenvolvida no início dos anos 70 realiza projeto robusto usando o gráfico de Nichols.
Introdução aos Sistemas de Controle
43
Em 1981, artigos férteis foram publicados por J. Doyle e G. Stein (1981), M. G. Safonov, A. J. Laub e G. L. Hartmann [1981]. Estendendo o trabalho criativo de MacFarlane e Postlethwaite [1977], eles mostraram a importância dos gráficos de valores singulares versus freqüência no projeto de sistemas multivariáveis robustos. Usando estes gráficos, muitas das técnicas clássicas no domínio da freqüência podem ser incorporados em projetos modernos. Este trabalho prosseguiu em aeronaves e controle de processos por M. Athans (1986) e outros.
O resultado é uma nova teoria de controle que mistura as melhores
características de técnicas clássicas e modernas. Uma inspeção desta teoria de controle moderno robusto é provida por P. Dorato (1987).
1.4 A filosofia do controle clássico
Compreendendo um pouco da história da teoria de controle automático, nós podemos discutir brevemente, agora, as filosofias da teoria de controle clássico e moderno. Desenvolvendo-se, como o fez, para o projeto de amplificadores realimentados, a teoria de controle clássico foi naturalmente formulada no domínio da freqüência e no plano s. Contando com métodos de transformadas, ela é principalmente aplicável a sistemas lineares invariantes no tempo, entretanto algumas extensões foram feitas para sistemas não lineares usando, por exemplo, a função de descrição. A descrição necessária para o projeto de controles do sistema usando os métodos de Nyquist e Bode é a magnitude e fase da resposta em freqüência. Isto é vantajoso desde que a resposta em freqüência possa ser medida experimentalmente. A função de transferência pode então ser computada. Para o projeto com lugar das raízes, a função de transferência é necessária. O diagrama de blocos é largamente usado para determinar funções de transferência de sistemas compostos. Não é necessária uma descrição exata da dinâmica interna do sistema para o projeto clássico; isto é, é importante apenas o comportamento entrada/saída do sistema. O projeto pode ser realizado à mão usando técnicas gráficas. Estes métodos fornecem muita intuição e provêem o projetista de controles com uma gama de possibilidades de projeto, de forma que os sistemas de controle resultantes não são únicos. O processo de projeto é uma arte de engenharia.
Sistemas de Controle
44
Um sistema real tem perturbações e ruídos de medição, e pode não ser descrito exatamente pelo modelo matemático que o engenheiro está usando para projeto. A teoria clássica é natural para projetar sistemas de controle que são robustos a tais desordens, rendendo bom desempenho de malha fechada apesar destas. O projeto robusto é realizado usando noções como margem de ganho e de fase. Compensadores simples como o proporcional-integral-derivado (PID), atraso-
avanço ou circuitos de incidência negativa são geralmente usados na estrutura de controle. Os efeitos de tais circuitos nos gráficos de Nyquist, Bode e lugar das raízes são de fácil compreensão, de forma que uma estrutura satisfatória de compensador pode ser selecionada. Uma vez projetado, o compensador pode ser facilmente regulado on-line. Um conceito fundamental em controle clássico é a habilidade para descrever propriedades de malha fechada em termos de propriedades de malha aberta que são
conhecidas ou fáceis medir. Por exemplo, os gráficos de Nyquist, Bode e lugar das raízes estão em termos da função de transferência de malha aberta. Novamente, as propriedades de rejeição a perturbações em malha fechada e o erro de regime permanente podem ser descritos em termos de diferença de retorno e sensibilidade. A Teoria de controle clássica é difícil de aplicar a múltiplas-entradas / múltiplassaídas (MIMO), ou sistemas de laços múltiplos. Devido à interação dos laços de controle em um sistema multivariáveis, cada função de transferência de entrada-única / saída-única (SISO) pode ter propriedades aceitáveis em termos de resposta ao degrau e robustez, mas o controle coordenado de movimento do sistema pode não ser aceitável. Assim, o MIMO clássico ou projeto de múltiplos laços requer um esforço esmerado ao usar a abordagem de um laço fechado a cada vez através de técnicas gráficas. Por exemplo, um lugar das raízes deveria ser traçado para cada elemento de ganho, levando em conta os ganhos previamente selecionados. Este é um procedimento de tentativa-e-erro que pode requerer múltiplas repetições e não garante bons resultados, ou mesmo estabilidade em malha fechada.
As abordagens multivariáveis no domínio da freqüência desenvolvidas pela escola britânica durante os anos 70, bem como a teoria quantitativa de realimentação, superaram muitas destas limitações, fornecendo uma abordagem efetiva para o projeto de muitos sistemas MIMO.
Introdução aos Sistemas de Controle
45
1.5 A filosofia de controle moderno
O Projeto de controles moderno é, fundamentalmente, uma técnica no domínio do tempo. É requerido um modelo exato de espaço de estados do sistema a ser controlado, ou planta. Esta é uma equação diferencial vetor de primeira-ordem da forma dx = Ax + Bu dt
(1.1) y = Cx onde x(t) é um vetor de variáveis internas ou estados do sistema, u(t) é um vetor de entradas de controle e y(t) é um vetor de saídas medidas. É possível somar termos de ruído para representar o processo e ruídos de medição. Nota que a planta é descrita no domínio do tempo. A força do controle moderno tem suas raízes no fato que o modelo de espaço de estados pode representar bem um sistema MIMO como um sistema SISO. Quer dizer, u(t) e y(t) geralmente são vetores cujas entradas são entradas e saídas individuais escalares. Assim, A, B, C são matrizes cujos elementos descrevem as interconexões dinâmicas do sistema. As técnicas de controle moderno foram primeiro firmemente estabelecidas para sistemas lineares. Extensões para sistemas não-lineares podem ser feitas usando a abordagem de Lyapunov, que se estende facilmente a sistemas MIMO, programação dinâmica e outras técnicas. Projetos de controle ótimo em malha aberta podem ser determinados para sistemas de lineares resolvendo problemas não-lineares com dois pontos de contorno. Exatamente como no caso clássico, algumas questões fundamentais no desempenho do sistema de malha fechada podem ser atacadas investigando propriedades de malha aberta. Por exemplo, as propriedades de malha aberta de controlabilidade e observabilidade de (1.1) dão a idéia do que é possível alcançar usando controle realimentado. A diferença é que, para lidar com o modelo de espaço de estados, é necessário um bom conhecimento de matrizes e álgebra linear.
Para alcançar propriedades satisfatórias de malha fechada, um controle de realimentação da forma, u = -Kx
(1.2)
pode ser usado. O ganho de realimentação que K é uma matriz cujos elementos são os ganhos individuais do controle sistema. Considerando que todos os estados são usados para
Sistemas de Controle
46
realimentação, isto é chamado realimentação de variáveis de estado. Note que múltiplos ganhos de realimentação e sistemas grandes são facilmente controlados neste sistema. Assim, se há n componentes de estado (onde n pode ser muito grande dentro um sistema aeroespacial ou de distribuição de potência) e m controles escalares, de forma que u(t) é um vetor m dimensional, então K é uma matriz m x n com mn entradas, correspondendo a mn laços de controle. No regulador linear quadrático padrão (LQR), o ganho de realimentação K é escolhido para minimizar um índice de desempenho (PI) quadrático no domínio do tempo como ∞
J = ∫ (x T Qx + u T Ru) dt
(1.3)
0
O mínimo é buscado em cima de todas as trajetórias de estado. Esta é uma extensão para sistemas MIMO dos tipos de PIs (ITSE, ITAE, etc.) que foram usados no controle clássico. Q e R são matrizes de ponderação que servem como parâmetros de projeto. Os seus elementos podem ser selecionados para prover desempenho satisfatório. A chave para o projeto do LQR é o fato que, se a matriz de ganho realimentação K pode ser escolhido com sucesso para fazer J finito, então a integral (1.3) que envolve as normas de u(t) e x(t) é limitada. Se Q e R são corretamente escolhidas, os famosos princípios matemáticos asseguram, então, que x(t) e u(t) vão zerar com tempo. Isto garante a estabilidade de malha fechada como também os sinais de controle limitados no sistema malha fechada. Pode ser mostrado que o valor de K que minimiza o PI é dado por K = R-1BTS
(1.4)
onde S é uma matriz n x m satisfazendo a equação de Riccati 0 = ATS + SA - SBR-1BTS + Q
(1.5)
Dentro deste quadro LQ, diversas observações podem ser feitos. Primeiro, contanto que o sistema (1.1) é controlável e Q e R são apropriadamente escolhidos, o K dado por estas equações garante a estabilidade do sistema em malha fechada dx/dt = (A-BK)x + Bu
(1.6)
Segundo, esta técnica é fácil de aplicar mesmo para plantas de entradas múltiplas, já que u(t) pode ser um vetor com muitos componentes.
Introdução aos Sistemas de Controle
47
Terceiro, a solução do LQR conta com a solução da equação matricial de projeto (1.5), sendo assim, inadequada para cálculos a mão. Felizmente, muitos pacotes de projeto estão agora disponíveis em computadores digitais para resolver a equação de projeto de Riccati para S e, conseqüentemente, para obter K. Então, o projeto assistido por computador é uma característica essencial do controle moderno. A solução do LQR é uma solução formal que dá uma única resposta para o problema de controle realimentado uma vez que o parâmetro de projeto Q tenha sido selecionado. Na realidade, a arte de engenharia no projeto moderno conta com a seleção do PI das matrizes de ponderação Q e R. Um corpo de teoria neste processo de seleção
desenvolveu-se. Uma vez que Q é corretamente selecionado, a equação de projeto matricial é resolvida formalmente para o único K que garante estabilidade. Observe que K é computado em termos das quantidades de malha aberta A, B, Q, de forma que os projetos moderno e clássico têm em comum esta característica de determinar propriedades de malha fechada em termos de quantidades de malha aberta. Porém, no controle moderno, todas as entradas de K são determinadas ao mesmo tempo usando as equações de projeto matriciais. Isto corresponde a fechar todo os laços do controle realimentado simultaneamente, o que está em completo contraste ao procedimento de um laço a cada vez
do projeto de controles clássico Infelizmente, o projeto formal do LQR dá uma intuição muito pequena sobre a natureza ou propriedades do sistema de malha fechada. Recentemente, esta deficiência foi
enfocada a partir de uma variedade de pontos de vista Embora o projeto do LQR usando realimentação de estado garanta a estabilidade de malha fechada, todos os componentes de estado raramente estão disponíveis para propósitos de realimentação em um problema prático de projeto. Então, a realimentação da saída da forma u = -Ky
(1.7)
é mais útil. Equações de projeto LQR para realimentação da saída são mais complicadas que (1.3), mas são facilmente derivadas. O projeto de realimentação da saída moderno permite projetar controladores para sistemas complicados com múltiplas entradas e saídas resolvendo formalmente equações de
projeto matriciais em um computador digital.
Sistemas de Controle
48
Outro fator importante é o seguinte. Enquanto a realimentação de estados (1.2) envolve a realimentação de todos os estados para todas as entradas, não oferecendo nenhuma estrutura no sistema de controle, a lei de controle realimentação da saída (1.7) pode ser usada para projetar um compensador com uma estrutura dinâmica desejada, recuperando muito da intuição de projeto de controles clássico. Leis de realimentação como (1.2) e (1.7) são chamadas estáticas, já que os ganhos de controle são constantes, ou no máximo variantes no tempo. Uma alternativa para realimentação de saída estática é usar um compensador dinâmico da forma dz/dt = Fz + Gy + Eu (1.8) u = Hz + Dy As entradas deste compensador são as entradas e saídas do sistema. Isto rende uma malha fechada que é chamada realimentação de saída dinâmica. O problema de projeto é selecionar as matrizes F, G, E, H, D para bom desempenho de malha fechada. Um resultado importante do controle moderno é que a estabilidade de malha fechada pode ser garantida selecionando F = A – LC para alguma matriz L que é computada usando uma equação de projeto de Riccati semelhante a (1.5). As outras matrizes em (1.8) são, então, determinadas facilmente. Este projeto está baseado no vital princípio da separação. Uma desvantagem com o projeto que usa F = A – LC é, então, que o compensador dinâmico tem o mesmo número de estados internos que a planta. Em complicadas aplicações aeroespaciais modernas e de instalações de potência, esta dimensão pode ser muito grande. Assim, foram desenvolvidas várias técnicas para redução do controlador e projeto de ordem reduzida. No controle moderno padrão, assume-se que o sistema é descrito exatamente pelo modelo matemático (1.1). Na realidade, porém, este modelo pode ser só uma descrição aproximada da planta real. Além disso, na prática pode haver perturbações que agem na planta, como também ruídos de medição em determinado y(t). O LQR que usa realimentação de estado plena tem algumas propriedades de robustez importantes a tais desordens, tais como uma margem de ganho infinita, 60° de margem de fase e robustez para alguma não-linearidade no laço de controle. Por outro lado, o LQR que usa realimentação de saída estática ou dinâmica não tem nenhuma propriedade de robustez garantida. Com o trabalho em controle moderno robusto no início dos anos 80, há,
Introdução aos Sistemas de Controle
49
agora, uma nova técnica (LQG/LTR)3 para projetar sistemas de controle robusto multivariáveis. Projetos LQG/LTR incorporam tratamentos rigorosos dos efeitos de incertezas de modelagem na estabilidade de malha fechada e de efeitos de perturbação no desempenho de malha fechada. Com o trabalho sobre projeto robusto moderno, muito da intuição das técnicas de controle clássico podem ser agora incorporadas no projeto moderno multivariáveis. Com os progressos modernos na teoria de controle digital e sistemas de tempo discreto, o controle moderno é muito satisfatório para o projeto de sistemas de controle que podem ser implementados em microprocessadores. Isto permite a implementação de controladores dinâmicos que são mais complicados como também mais efetivos que as estruturas simples PID e atraso- avanço do controle clássico. Com o trabalho recente em descrição tipo fração de matrizes e de projeto com equações polinomiais, uma planta MIMO pode ser descrita não em uma forma de espaço de
estados, mas na forma entrada/saída. Isto é uma extensão direta da clássica descrição por função de transferência e, para algumas aplicações, é mais apropriada que a descrição interna (1.1 ).
1.6 Fundamentos matemáticos
O estudo da teoria de controle clássico exige um conhecimento matemático que inclui assuntos tais como teoria de variáveis complexas, equações diferenciais e transformação de Laplace, os quais são abordados nesse capítulo de forma sucinta. O leitor que desejar se aprofundar no estudo de qualquer um destes assuntos deve recorrer a livros especializados.
1.6.1 – Representação de sistemas físicos através de equações diferenciais:
As equações diferenciais que descrevem o desempenho dinâmico de um sistema físico podem ser obtidas utilizando-se as leis físicas do processo. Esse enfoque vale para sistemas mecânicos, elétricos, fluídos ou termodinâmicos. Considere o circuito RLC mostrado na Fig.1.20. Podemos descrevê-lo utilizando a lei das tensões de Kirchhoff por 3
LQG – linear-quadrático-gaussiano e LTR – recuperação da transferência de malha (N. do T.).
Sistemas de Controle
50
− ei (t) + i (t) ⋅ R + L
di (t) + v C (t) = 0 dt
(1.9)
sendo que
i =C
dvC (t) dt
(1.10)
Substituindo a equação (1.10) na equação (1.9) obtém-se a equação diferencial que representa o circuito: LC
d 2 vC (t) dt
2
+ RC
dvC (t) + vC (t) = ei (t) dt
(1.11)
que é uma equação diferencial linear ordinária de segunda ordem com coeficientes constantes ou invariantes no tempo. L
R ei(t)
C
+ VC(t)
i
Fig. 1.20 – Circuito RLC série.
A grande maioria dos sistemas físicos são lineares dentro de uma faixa das variáveis. Por exemplo,o sistema massa-amortecedor-mola da Fig. 1.21 que é representado pela equação diferencial m
d 2 y (t) dt
2
+b
dy (t) + ky (t) = f (t) dt
onde m designa a massa, b designa o coeficiente de atrito viscoso e k a constante da mola, é linear enquanto a massa esta sujeita a pequenas deflexões y(t). Entretanto, se y(t) for continuamente incrementada, a mola será sobre-estendida e quebrará. Logo, a questão da linearidade e a faixa de aplicabilidade devem ser consideradas para cada sistema. Um sistema é definido como linear em termos da excitação e da resposta. No caso do circuito RLC a excitação é a tensão ei(t) e a resposta é a tensão vC(t). Em geral, uma condição necessária para um sistema ser linear pode ser determinada em termos de uma excitação x(t) e uma resposta y(t). Quando o sistema esta sujeito a uma excitação x1(t), ele fornece uma resposta y1(t); quando esta sujeito a uma excitação x2(t), ele fornece uma resposta y2(t). Para um sistema ser linear, é necessário que uma excitação x3(t) = a1x1(t) + a2x2(t) resulte em uma resposta y3(t) = a1y1(t) + a2y2(t). Ou seja, para um sistema linear as respostas às várias excitações diferentes
Introdução aos Sistemas de Controle
51
podem ser encontradas separadamente e depois combinadas linearmente para se determinar a resposta do sistema ao conjunto das várias excitações. Este princípio é conhecido como princípio da superposição.
No campo do controle a operação normal de um sistema pode ser em torno de um ponto de equilíbrio e os sinais podem ser considerados pequenos sinais em torno do equilíbrio. Por exemplo, considere o pêndulo da Fig. 1.22. O torque sobre a massa é:
T = mglsenθ onde g é a constante de gravidade. Se for do interesse o comportamento do sistema para pequenos ângulos, o sistema pode ser linearizado em torno do ponto de equilíbrio θ = 0o para obter a equação linearizada do torque
T = mglθ Assim, se o sistema opera em torno do ponto de equilíbrio e se os sinais envolvidos são pequenos, é possível a aproximação de um sistema não-linear por um sistema linear. Uma técnica de linearização de um sistema não linear é apresentada em Ogata (1990, p. 113-114) e Dorf (2001, p. 39-40).
by
ky
k Atrito na parede, b Massa m
y(t) deformação
Massa m
y
f f(t) força (a)
(b)
Fig. 1.21 – (a) Sistema massa-mola-amortecimento . (b) diagrama de corpo livre.
Sistemas de Controle
52
Comprimento l
` Massa m
Fig. 1.22 – Oscilador a pêndulo 1.6.1 –Variável complexa e função complexa:
Uma variável complexa s é uma variável que possui duas componentes; uma componente real σ, e uma componente imaginária ω. Graficamente, a variável complexa é representada por um ponto no plano complexo s, com a componente real representada por um eixo na direção horizontal e a componente imaginária ao longo do eixo vertical. A Fig. 1.23 mostra o plano complexo s, no qual um ponto s = s1 é definido pelas coordenadas σ = σ1 e ω = ω1, ou s1 = σ1 + jω1. jω
Plano s
ω1
s1 = σ1+jω1
σ σ1
Fig. 1.23 - Plano complexo s. Uma função G(s) é chamada uma função da variável complexa s se para todo s existir pelo menos um valor correspondente de G(s). Como s possui parte real e imaginária, a função G(s) também as possui. Assim, G(s) = ReG +jImG, onde ReG representa a parte real de G(s) e jImG a parte imaginária. A Fig.1.24 representa uma função G(s) univocamente definida, ou seja, para cada valor de s existe apenas um valor de G(s) que lhe corresponde. Se o inverso também for verdadeiro, ou seja, se para todo ponto de G(s) existe apenas um valor de s que lhe corresponde, dizemos que a correspondência de pontos do plano s para pontos no plano
Introdução aos Sistemas de Controle
53
G(s) é descrita por uma correspondência biunívoca. Há funções, entretanto, que a correspondência não é biunívoca. É o caso da função G(s)= 1 s ( s + 1) , onde para cada valor de s há um único valor correspondente de G(s). Porém, o inverso não é verdadeiro, já que o ponto G(s) = ∞ corresponde a dois pontos no plano s, s = 0 e s = -1. Uma função G(s) da variável complexa s é dita analítica em uma região do plano s se a função e todas as suas derivadas existirem nessa região. Por exemplo, a função citada anteriormente é analítica em todo o ponto do plano s, exceto nos pontos s = 0 e s = -1, onde G(s) = ∞. Uma função como G(s) = s+1 é analítica em todo ponto do plano s finito. jω
ω1
s1 = σ1+jω1 jImG
σ1
Plano G(s)
G(s1)
σ
Plano s
ReG
Fig. 1.24 – Do plano complexo s para o plano G(s) Os pontos s = 0 e s = -1 representa singularidades da função G(s) = 1
s ( s + 1)
.
Singularidades de uma função são os pontos do plano s nos quais a função ou as suas derivadas não existem. Seja uma função complexa definida por:
G ( s) =
p( s) q( s)
Os valores de s que anulam o denominador q(s) são conhecidos como pólos de G(s); por sua vez, os valores de s que anulam o numerador p(s) são conhecidos como zeros de G(s). Como um exemplo, a função complexa G(s) =
5( s + 3) s ( s + 1)( s + 2) 2
apresenta pólos simples em s = 0 e s = -1, um pólo de ordem 2 em s = -2, um zero em s = -3 e três zeros no infinito, pois
Sistemas de Controle
54
5 =0 s →∞ s 3
lim G ( s ) = lim
s →∞
Observação: Toda a função racional de s (função que é um quociente de dois polinômios em s) possui um número total de pólos igual ao número de zeros.
1.6.2 Teorema de Euler
Desenvolvendo cosθ e senθ em série de potências obtemos: cosθ = 1 −
senθ = θ −
θ2
+
2!
θ3 3!
+
θ4 4!
θ5 5!
−
θ6
−
6!
θ7 7!
+K
+K
Destas equações resulta: cosθ + jsenθ = 1 + jθ +
( jθ )2 + ( jθ )3 + ( jθ )4 2!
3!
4!
+K
Como ex = 1+ x +
x2 x3 x4 + + +K 2! 3! 4!
Resulta cosθ + jsenθ = e jθ expressão conhecida como teorema de Euler. Usando o teorema de Euler, podemos exprimir as funções seno e cosseno em termos de uma função exponencial. Como e jθ = cosθ + jsenθ
(1.12)
e − jθ = cos(- θ ) + jsen (- θ ) = cosθ − jsenθ
(1.13)
Resulta que:
Somando (1.12) e (1.13) obtém-se: e jθ + e − jθ cosθ = 2 Por sua vez, subtraindo (1.13) de (1.12) obtém-se:
(1.14)
Introdução aos Sistemas de Controle
55
senθ =
e jθ − e − jθ 2j
(1.15)
1.6.3 Transformada de Laplace:
A Transformada de Laplace transforma a equação diferencial que representa um sistema em uma equação algébrica em s de solução mais simples. A resposta no domínio do tempo é obtida tomando-se a transformada inversa de Laplace da solução em s. Definição da transformada de Laplace:
Dada a função f(t) que satisfaz a condição ∞
∫0
f (t )e −σt dt < ∞
(1.16)
para algum σ real finito, a transformada de Laplace f(t) é definida como ∞
F ( s ) = ∫ f (t )e − st dt
(1.17)
F(s) = L[ f(t) ]
(1.18)
0
ou A variável s = σ + jω é o operador de Laplace. A transformada de Laplace definida pela equação (1.17) é conhecida por transformada de Laplace unilateral, uma vez que a integração ocorre de 0 a ∞. A transformada unilateral ignora toda a informação contida em f(t) antes de t = 0, o que não comprometerá o nosso estudo (restrito a sistemas lineares) onde a referência de tempo é escolhida no instante t = 0. Interpretação da transformada de Laplace:
Pela definição de transformada de Laplace, ∞
∞
∞
0
0
0
F ( s ) | s =σ + jω = ∫ f (t )e − st dt = ∫ f (t )e −(σ + jω )t dt = ∫ f (t )e −σt e − jωt dt ∞
F ( s ) | s =σ + jω = ∫ f (t )e −σt (cos ωt − j sen ωt )dt 0
F ( s ) | s =σ + jω
∞
∫0
∞
f (t )e −σt cos ωtdt − j ∫ f (t )e −σt sen ωtdt 0
(1.19)
Conseqüentemente, a parte real de F(s) em s = σ + jω é uma medida do “comprimento” da componente e −σt cos ωt em f(t), enquanto a parte imaginária de F(s) mede
Sistemas de Controle
56
o “comprimento” da componente e −σt sen ωt em f(t). Dependendo de como σ e ω são escolhidos como as partes real e imaginária de s, então F(s) mede o comprimento de vários sinais oscilantes com envoltórias exponenciais. A Fig. 1.25 ilustra a relação entre a escolha de s e a correspondente componente do sinal e-st. Este diagrama combinado com (1.19) torna claro que a partir da escolha de diferentes valores de s, a quantidade F(s) provê uma decomposição de f(t) em componentes fundamentais que são oscilantes com envoltórias exponenciais. 2π ϖ
eσtcosωt
e-σtcosωt
jϖ
σ
e-σt
σt
e
1
Fig. 1.25 – A relação entre a escolha de s e o sinal e-st (somente a parte real é mostrada). Exemplo 1.1 - Considere a função exponencial f (t ) = e − at
para t ≥ 0
onde a é uma constante. A transformada de Laplace de f(t) é escrita como ∞ − at − st
F (s) = ∫ e 0
e
∞ −( s + a )t
dt = ∫ e 0
∞
⎡ e −( s + a )t ⎤ 1 dt = ⎢− ⎥ = ⎣ (s + a) ⎦ 0 s + a
É claro que a transformada de Laplace dada pela equação acima é válida se ∞
∫0
∞
e −at e −σt dt = ∫ e 0
−(σ + a ) t
dt < ∞
Introdução aos Sistemas de Controle
57
o que significa que (σ + a) > 0 ou σ > -a. Na prática, nos referimos a transformada de Laplace da função exponencial como F(s) = 1/(s+a), válida ao longo de todo o plano s onde F(s) for analítica. Assim, nas linhas que seguem, não nos preocuparemos com a região em que a integral da transformada converge absolutamente. Exemplo 1.2 – Considere a função degrau uS(t) ≡
1 ;t≥0 0 ;t<0
A transformada de Laplace de f(t) = uS(t) é F ( s ) = L[u S (t )] = ∫ u S (t )e dt = ∫ ∞
− st
0
∞
0
∞
⎡ e − st ⎤ 1 e dt = ⎢− ⎥ = ⎣ s ⎦0 s − st
Conforme ilustraram os exemplos acima, a transformada de Laplace de qualquer função transformável f(t) pode ser achada multiplicando-se f(t) por e-st e depois se integrando o produto de t = 0 a t = ∞. Não obstante a importância de conhecer este método, nem sempre é necessário deduzir a transformada de Laplace de uma f(t). Podemos achar a transformada de Laplace de uma função utilizando tabelas de transformada de Laplace, como a Tabela 1.1, que reúne pares importantes da transformada de Laplace. Por sua vez, a Tabela 1.2 sintetiza os teoremas da transformada de Laplace mais relevantes para a análise sistemas de controle de lineares.
1.6.4 Transformada inversa de Laplace: O procedimento matemático de obtenção da expressão no tempo a partir da expressão complexa é chamado de transformação inversa de Laplace.. A notação para a transformada inversa de Laplace é L -1, de modo que: L -1 [F ( s )] = f (t ) Matematicamente, f(t) é achada a partir de F(s) pela seguinte integral: f (t ) =
1 σ + j∞ F ( s )e + st ds ∫ σ − j ∞ 2πj
(1.20)
A transformada inversa de Laplace é freqüentemente obtida usando tabelas de pares de transformada de Laplace como a Tabela 1.1 e a técnica de expansão em frações parciais, que será descrita a seguir.
Sistemas de Controle
58
TABELA 1.1
PARES DE TRANSFORMADAS DE LAPLACE f(t) Função degrau unitário, u(t)
F(s) 1 s 1 1 s+a
Função impulso unitário, δ(t) e − at senωt
ω
s +ω2 s 2 s +ω2 n! s n +1 1 2
cosωt tn 1 T (n − 1)! n
t n −1e −t T
(1 + sT ) n
ω
e − at .senωt
(s + a )2 + ω 2 s+a
e -at .cosωt 1
(s + a )2 + ω 2
(α − a )2 + ω 2 e −at .sen(ωt + φ ),
ω
φ = arctg
ωn 1− ζ 2
ω
1 1 + e −at .sen(ωt − φ ), 2 2 2 a +ω ω a +ω 2
1+
e
ω −a
−ζwn t
1− ζ 2
φ = arctg
α
+
(
)
.sen ω n 1 − ζ 2 t − φ ,
ω n2 s 2 + 2ζω n s + ω n2
[
1
s (s + a ) + ω 2 2
]
ω n2 s( s 2 + 2ζwn s + ω n2 )
1− ζ 2 ,ζ < 1 −ζ
1
(α − a )2 + ω 2 e −at .sen(ωt + φ ),
ω a2 + ω 2 ω ω φ = arctg − arctg α −a −a a2 + ω 2
(s + a )2 + ω 2
α −a
e −ζωnt .sen(ω n 1 − ζ 2 t ) , ζ < 1
φ = arctg
s +α
[
s +α
s (s + a ) + ω 2 2
]
Introdução aos Sistemas de Controle
59
TABELA 1.2 PROPRIEDADES DA TRANSFORMADA DE LAPLACE 1. Multiplicação por uma constante:
Exemplo:
L[kf (t )] = kF ( s )
L[5t ] = 5L[t ] =
2. Soma e diferença:
Exemplo:
L[ f1 (t ) ± f 2 (t )] = F1 ( s ) + F2 ( s )
[
5 s2
]
[ ]
L t + e −t = L[t ] + L e −t =
1 1 + 2 s s +1
Exemplo:
3. Derivação:
L[cos(ωt )] = ?
⎡ df (t ) ⎤ L⎢ = sF ( s ) − f (0) ⎣ dt ⎥⎦
ω s +ω2 ⎡ d ⎛ sen(ωt ) ⎞⎤ L[cos(ωt )] = L ⎢ ⎜ ⎟⎥ ⎣ dt ⎝ ω ⎠⎦ L[sen(ωt )] = F ( s ) =
⎡ d n f (t ) ⎤ n n −1 n−2 1 L⎢ ⎥ = s F ( s ) − s f ( 0) − s f ( 0) − n dt ⎦ ⎣ n −1 − ... − f (0)
L[cos(ωt )] = L[cos(ωt )] =
1
ω
2
[sF ( s) − f (0)]
1 ⎡ sω s ⎤ − 0⎥ = 2 2 2 2 ⎢ ω ⎣s +ω ⎦ s +ω
4. Integração:
Exemplo:
t F ( s) L ⎡ ∫ f (τ )dτ ⎤ = ⎢⎣ 0 ⎥⎦ s
⎡1 t ⎤ I ( s) L ⎢ ∫ i (τ )dτ ⎥ = 0 ⎣C ⎦ sC Exemplo:
5. Translação no tempo
L[ f (t − t 0 )u s (t − t 0 )] = e −t0 s F ( s)
L[u s (t )] =
f(t).u(t)
f(t+t0).u(t+t0) t
t
1 s
L[u s (t − t 0 )] =
e −t0 s s
t0
6. Teorema do valor inicial:
Exemplo:
lim f (t ) = lim sF ( s )
f (t ) = e − at − e at ∴ f (0) = 0 1 1 − 2a L[ f (t )] = − = 2 s + a s − a s − a2 − 2as − 2as lim sF ( s) = lim 2 = lim 2 2 s →∞ s →∞ s − a s →∞ s − 2a lim sF ( s) = lim =0 s →∞ s →∞ s
t →0
s →∞
Sistemas de Controle
6. Teorema do valor final:
60
Exemplo:
Se a TL de f(t) é F(s) e a sF(s) é analítica sobre o f (t ) = e − at ∴ f (∞) = 0 eixo imaginário e na metade direita do plano s: 1 L[ f (t )] = F ( s) = ( polo : s = −a) s + a lim f (t ) = lim sF ( s ) t →∞ s →0 s lim sF ( s) = lim =0 s →0 s →0 s + a Exemplo: 7. Translação Complexa:
[
Le
m at
]
f (t ) = F ( s ± a)
8. Convolução Real: ⎡t ⎤ F1 ( s ) ⋅ F2 ( s ) = L ⎢ ∫ f1 (τ ) f 2 (t − τ )dτ ⎥ ⎣0 ⎦ ⎡t ⎤ F1 ( s ) ⋅ F2 ( s ) = L ⎢ ∫ f1 (t − τ ) f 2 (τ )dτ ⎥ ⎣0 ⎦ F1 ( s ) ⋅ F2 ( s ) = L[ f 1 (t ) ∗ f 2 (t )]
[ ]
L e m3t t = ? 1 1 L[t ] = 2 ∴ L e m3t t = s (s ± 3)2 Exemplo
[ ]
1 1 F1 ( s ) = ∴ F2 ( s ) = s s f1 (t ) = f 2 (t ) = u S (t ) 1 ⎡1⎤ ∴ L -1 ⎢ 2 ⎥ = t 2 s ⎣s ⎦ Aplicando a convolução real: F1 ( s ) ⋅ F2 ( s ) =
t
F1 ( s ) ⋅ F2 ( s ) = ∫ u S (τ )u S (t − τ )dτ 0 t
F1 ( s ) ⋅ F2 ( s ) = ∫ dτ = τ |t0 = t 0
us(τ)
1 t
τ us(-τ)
1
t
τ us(t-τ) = us[-(τ-t)] τ
t us(τ)us(t-τ) t
τ
Introdução aos Sistemas de Controle
61
Em sistemas de controle, freqüentemente uma função com de variável complexa F(s) aparece na forma F (s) =
B( s ) A( s )
sendo A(s) e B(s) polinômios em s, com o grau de B(s) menor que o graus de A(s). Se F(s) for decomposta em componentes, F(s) = F1(s) + F2(s) + … + Fn(s) onde a transformada de Laplace de cada componente está disponível em uma tabela, então L -1[F(s)] = L -1[F1(s)] + L- 1[F2(s)] + … + L -1[Fn(s)] = f1(t) + f2(t) + … + fn(t) onde f1(t),f2(t), …, fn(t) são as transformadas inversas de Laplace de = F1(s), F2(s), …, Fn(s). A seguir, apresentam-se 3 variações do método de expansão em frações parciais.
Expansão em frações parciais quando F(s) envolve apenas pólos simples Deseja-se calcular a transformada de Laplace de X ( s) =
5s + 3 ( s + 1)( s + 2)( s + 3)
que possui como pólos reais –1, -2 e –3. Como todos os pólos são distintos temos a seguinte expansão em frações parciais: X ( s) =
a b c 5s + 3 = + + ( s + 1)( s + 2)( s + 3) s + 1 s + 2 s + 3
Multiplicando-se ambos os lados por (s+1) resulta (5s + 3)( s + 1) a ( s + 1) b( s + 1) c( s + 1) = + + ( s + 1)( s + 2)( s + 3) s +1 s+2 s+3 ou (5s + 3) b( s + 1) c( s + 1) =a+ + ( s + 2)( s + 3) s+2 s+3 Quando s = -1, resulta: −2 = a ⇒ a = −1 1⋅ 2 O procedimento acima sugere que
(i)
Sistemas de Controle
62
⎡ 5s + 3 ⎤ a = [( s + 1) X ( s )]s =−1 = ⎢ = −1 ⎥ ⎣ ( s + 2)( s + 3) ⎦ s =−1 Para calcular as outras constantes adota-se o mesmo procedimento. Assim: ⎡ 5s + 3 ⎤ =7 b = [( s + 2) X ( s )]s =−2 = ⎢ ⎥ ⎣ ( s + 1)( s + 3) ⎦ s =−2 ⎡ 5s + 3 ⎤ c = [( s + 3) X ( s )]s =−3 = ⎢ = −6 ⎥ ⎣ ( s + 1)( s + 1) ⎦ s =−3 Substituindo os valores das constantes em (i), resulta: X (s) = −
1 7 6 + − s +1 s + 2 s + 3
Aplicando-se a transformação inversa de Laplace na expressão acima L -1[X(s)] = x(t) = − e −t + 7e −2t − 6e −3t
Expansão em frações parciais quando F(s) envolve pólos de ordem múltiplos
Deseja-se calcular a transformada de Laplace de X ( s) =
1 s ( s + 2)( s + 1) 3
que possui como pólos simples 0 e -2 e um pólo de ordem e em s = -1. Para esse caso, temos a seguinte expansão em frações parciais: X (s) =
a b c d e 1 = + + + + 3 2 s s + 2 s + 1 ( s + 1) s ( s + 2)( s + 1) ( s + 1) 3
Os coeficientes dos pólos simples são ⎡ ⎤ 1 1 = a = [sX ( s )]s =0 = ⎢ 3⎥ ⎣ ( s + 2)( s + 1) ⎦ s =0 2 ⎡ ⎤ 1 1 = b = [( s + 2) X ( s )]s =−2 = ⎢ 3⎥ ⎣ s ( s + 1) ⎦ s = −2 2 Para o pólo múltiplo temos:
[
]
⎡ 1 ⎤ = −1 e = ( s + 1) 3 X ( s ) s =−1 = ⎢ ⎥ ⎣ s ( s + 2) ⎦ s =−1
(i)
Introdução aos Sistemas de Controle
d=
d=
c=
63
[
d ( s + 1) 3 X ( s )
]
s = −1
ds
[
d ( s 2 + 2 s ) −1
]
ds
[
d ⎡ 1 ⎤ d ⎡ 1 ⎤ = ⎢ 2 ⎢ ⎥ ds ⎣ s ( s + 2) ⎦ s =−1 ds ⎣ s + 2 s ⎥⎦ s =−1
= −(2 s + 2)( s 2 + 2 s ) − 2 | s = −1 = −
s = −1
2 3 1 d ( s + 1) X ( s ) 2! ds 2
=
]
s = −1
=
2s + 2 | s = −1 = 0 ( s 2 + 2s) 2
1 d2 ⎡ 1 ⎤ d ⎡ 2s + 2 ⎤ = ⎢− 2 ⎥ ⎥ 2 ⎢ 2 ds ⎣ s ( s + 2) ⎦ s = −1 ds ⎣ ( s + 2s ) 2 ⎦ s = −1
⎡ 1 ⎡ ( s 2 + 2s) 2 ⋅ 2 − (2s + 2) ⋅ 2( s 2 + 2s)(2s + 2) ⎤ 1 4 ⋅ ( s + 1) 2 ⎤ = −1 c=− ⎢ = + ⎥ ⎢ 2 ⎥ 2 2⎣ ( s 2 + 2s) 4 ( s 2 + 2s) 3 ⎦ ⎦ s = −1 ⎣ ( s + 2s) s = −1 Assim, a partir de (i) resulta X ( s) =
1 1 1 1 + − − 2 s 2( s + 2) ( s + 1) ( s + 1) 3
Aplicando-se a transformação inversa de Laplace na expressão acima L -1[X(s)] = x(t) =
x(t ) =
u S (t ) 1 −2t 1 + e − e −t − t 2 e −t 2 2 2
u S (t ) 1 −2t ⎛ 1 ⎞ + e − e − t ⎜1 + t 2 ⎟ 2 2 ⎝ 2 ⎠
Expansão em frações parciais quando F(s) envolve apenas pólos complexos conjugados
Deseja-se calcular a transformada de Laplace de
X ( s) =
ω n2 a b c = + + s( s 2 + 2ζω n s + ω n2 ) s s + α − jω s + α + jω
onde α = ζωn
ω = ωn 1− ζ 2 Os coeficientes do pólo simples s é ⎤ ⎡ ω n2 a = [sX ( s )]s =0 = ⎢ 2 =1 2⎥ ⎢⎣ s + 2ζω n s + ω n ⎥⎦ s =0
Para os pólos complexos teremos
Sistemas de Controle
64
b = [( s + α −
⎤ ω n2 ω n2 = ⎥ ⎢⎣ s ( s + α + jω ) ⎥⎦ s = −α + jω (−α + jω )2 jω ⎡
jω ) X ( s )]s =0 = ⎢
⎡ ⎤ ⎡ ω n2 b=⎢ ⎥=⎢ 0 2 2 ⎣⎢ 2ω∠90 α + ω ∠θ ⎦⎥ ⎢⎣ 2ω∠90 0
(ζω n )
2
+ ωn
2
⎤ ω ⎥ = n ∠ − 90 0 − θ 2 − (ζω n ) ∠θ ⎥⎦ 2ω
(
ω n − j (θ +900 ) e 2ω
b=
onde θ = arctg −
ω n2
ω α
⎡ ⎤ ω n2 ω n2 c = [( s + α + jω ) X ( s )]s =0 = ⎢ = ⎥ ⎢⎣ s ( s + α − jω ) ⎥⎦ s = −α − jω (−α − jω )(−2 jω )
⎡ ⎤ ωn ω n2 c=⎢ ∠ 90 0 + θ ⎥= 0 2 2 ⎢⎣ 2ω∠ − 90 α + ω ∠ − θ ⎥⎦ 2ω
(
c=
)
ω n j (θ +90 ) e 2ω 0
Assim: 1 ω X ( s) = + n s 2ω
0 ⎡ e − j (θ +900 ) e j (θ +90 ) ⎤ + ⎥ ⎢ ⎢⎣ s + α − jω s + α + jω ⎥⎦
Aplicando-se a transformação inversa de Laplace na expressão acima L -1[X(s)] = x(t) = 1 +
x(t) = 1 +
x(t) = 1 +
[
0 ω n − j (θ +900 ) −(α − jω )t e e + e j (θ + 90 )e −(α + jω )t 2ω
[ (
0 ω n −αt j (ωt −θ −900 ) e e + e − j (ωt −θ −90 ) 2ω
]
)]
ω n −αt ⎡ ω ⎤ ⎡ ⎤ e ⎢ 2 cos⎛⎜⎝ωt − θ − 90 0 ⎞⎟⎠ ⎥ = 1 + n e −αt ⎢cos⎛⎜⎝ωt − θ − 90 0 ⎞⎟⎠ ⎥ ⎣ ⎦ ⎣ ⎦ ω 2ω x(t) = 1 +
ω n −αt e sen (ωt − θ ) ω
ou x(t) = 1 +
1 1−ζ 2
e
−ζω nt
⎛
⎞
⎝
⎠
sen ⎜⎜ω n 1 − ζ 2 t − θ ⎟⎟
)
Introdução aos Sistemas de Controle
onde θ = arctg −
65
ω . α
) Usando o MATLAB
4
para realizar a expansão em frações parciais
Podemos obter a expansão em frações parciais de uma dada função complexa utilizando a função residue do MATLAB. Por exemplo, seja a função F ( s) =
( s + 3) ( s + 1)( s + 2)
Para calcular a expansão em frações parciais com o MATLAB devemos executar os seguintes comandos: >> num=[1 3]; den=poly([-1 -2]); >> [r,p,k]=residue(num,den) r = -1 2
p = -2 -1
k = []
A função residue, para uma dada função complexa F(s) = num/den, retorna os coeficientes ou resíduos da expansão r, o que nos permiti expandir F(s), como segue: F ( s) =
2 1 − ( s + 1) ( s + 2)
Observe, ainda, que o denominador foi inserido em sua forma fatorada através do emprego da função poly. A função residue permite, também, converter uma expansão em frações parciais em um polinômio num/den. Observe os seguintes comandos: >> r=[2 -1]; p=[-1 -2]; k=0; >> [num,den]=residue(r,p,k); >> printsys(num,den) num/den =
4
O MATLAB é um programa iterativo para cálculos científicos e de engenharia produzido pela MathWorks Inc.
Sistemas de Controle
66
s + 3 ------------s^2 + 3 s + 2
Observe que a função printsys apresenta na tela a função de transferência num/den na forma adequada. O MATLAB pode, ainda, computar simbolicamente a transformada laplace e a transformada inversa de Laplace. Para calcular a transformada inversa de Laplace de F(s) procede-se conforme segue: >> Fs=sym('(s+3)/((s+1)*(s+2))'); >> ilaplace(Fs) ans = 2*exp(-t)-exp(-2*t)
Na primeira linha a função sym cria a função simbólica F(s). Por sua vez, na segunda linha a função ilaplace avalia simbolicamente a transformada inversa de Laplace de F(s). Para obter a F(s) a partir da f(t), utilizamos a seguinte seqüência de comandos: >> ft=sym('2*exp(-t)-exp(-2*t)'); >> laplace(ft) ans = 2/(s+1)-1/(s+2)
A resposta obtida, conforme podemos observar é a expansão em frações parciais de F(s).
)Funções do MATLAB que aprendemos a utilizar: 9 residue; 9 polyval; 9 printsys; 9 sym;
9 laplace / ilaplace.
Exercícios 1. Verifique o resultado obtido acima empregando o método algébrico adequado. 2. Obtenha a expansão em frações parciais de F (s) =
2s + 1 s ( s + 2) 2
Introdução aos Sistemas de Controle
67
e confira o resultado utilizando o MATLAB. 3. Obtenha a transformada inversa de Laplace da F(s) acima e confira o resulta utilizando o MATLAB.
1.6.5 Aplicação da transformada de Laplace na solução de equações diferenciais ordinárias lineares A transformada de Laplace pode ser empregada para resolver equações diferenciais ordinárias lineares com as seguintes vantagens: •
Utilizando-se uma tabela de transformadas os passos envolvidos são todos algébricos;
•
As soluções homogênea e a particular são obtidas simultaneamente.
Exemplo 1.3 – Seja a equação diferencial d 2 x(t ) dt 2
+3
dx(t ) + 2 x(t ) = 5u S (t ) dt
(i)
que possui como condições iniciais x(0) = -1 e x’(0) = 2. Inicialmente, tomamos a transformada de Laplace de ambos os lados de (i), obtendo: s 2 X ( s ) − sx(0) − x' (0) + 3sX ( s ) − 3x(0) + 2 X ( s ) =
5 s
Substituindo-se as condições iniciais em (ii), após algumas manipulações algébricas e resolvendo para X(s), obtém-se: ( s 2 + 3s + 2) X ( s ) + s − 2 + 3 = ( s 2 + 3s + 2) X ( s ) = ( s 2 + 3s + 2) X ( s ) = X ( s) =
5 s
5 − s −1 s
5 − s2 − s s
− s2 − s + 5 s ( s 2 + 3s + 2)
(iii)
Sistemas de Controle
68
Expandindo (iii) em frações parciais, resulta (verifique): X ( s) =
5 5 3 − + 2 s ( s + 1) 2( s + 2)
(iv)
Finalmente, tomando a transformada inversa de Laplace de (iv), obtém-se a solução completa x(t ) =
5 3 − 5e −t + e − 2t 2 2
t≥0
O primeiro termo da equação é a solução em regime permanente e os dois últimos termos compõem a solução transitória. A solução de regime permanente pode ser obtida aplicando-se o teorema do valor como segue: l im x(t ) = l im sX ( s ) = l im t →∞
s →0
s →0
− s2 − s + 5 2
( s + 3s + 2)
=
5 2
1.7 Função de Transferência A função de transferência (FT) de um sistema de equações diferenciais lineares invariantes no tempo é definida como a relação entre as transformadas de Laplace da saída e da entrada, considerando todas as condições iniciais nulas. Seja o sistema linear invariante no tempo definido pela seguinte equação diferencial: n
n −1
.
m
m −1
.
a 0 y + a1 y + ... + a n −1 y + a n y = b0 u + b1 u + ... + bm −1 u + bm u
(1.21)
onde: y é a saída, u é a entrada do sistema e n ≥ m. A função de transferência do sistema é obtida tomando-se a transformada de Laplace de ambos os lados da equação (1.21), considerando todas as condições iniciais nulas, conforme segue: FT = G(s) =
b s m + b s m −1 + ... + bm −1 s + bm K ( s − z1 )(s − z 2 )...(s − z m ) Y (s) = 0 n 1 n −1 = U (s) ( s − p1 )(s − p 2 )...(s − p n ) a 0 s + a1 s + ... + a n −1 s + a n
(1.22)
Vale lembrar que a FT é um conceito aplicado exclusivamente a sistemas lineares invariantes no tempo, sendo largamente utilizada na análise e projeto de tais sistemas. Se a FT de um sistema for conhecida, a saída ou resposta pode ser avaliada para diversos tipos de entrada. Caso ela seja desconhecida, ela pode ser obtida experimentalmente introduzindo-se no sistema entradas conhecidas e estudando-se a sua saída.
Introdução aos Sistemas de Controle
69
Considere o circuito RC da Fig. 1.26. Aplicando ao circuito a LTK, resulta: − ei + i ⋅ R + e o = 0
(1.23)
Como:
i=C
de0 dt
(1.24)
Substituindo (1.24) em (1.23), obtemos a equação diferencial que representa o circuito:
C
e
de0 ⋅ R + e o = ei dt R
i
(1.25)
+ C e
i
0
-
Fig. 1.26 – Circuito RC. Tomando a transformada de Laplace de (1.25) considerando condições iniciais nulas, resulta: RCsE 0 ( s ) + E 0 ( s ) = Ei ( s ) ( RCs + 1) E 0 ( s ) = Ei ( s ) Assim, a FT do circuito é:
E0 ( s) 1 = Ei ( s) RCs + 1 Do procedimento acima, percebemos que são três os passos necessários para obter a FT de um sistema: 1. Obter a equação diferencial do sistema. 2. Tomar a transformada de Laplace da equação diferencial considerando condições iniciais nulas. 3. Tomar a razão entre a saída e a entrada.
Exercício: Encontre a função de transferência de um circuito RLC série submetido a uma excitação e(t).
Sistemas de Controle
70
1.8 Diagramas de bloco O diagrama de blocos de um sistema é a representação que mostra as funções desempenhadas por cada um dos componentes do sistema. Esta técnica é útil para representar graficamente a dinâmica dos sistemas de controle e é usada extensivamente na análise e projeto de sistemas de controle A Fig. 1.27 apresenta o diagrama de blocos de um sistema de malha fechada onde destacamos: •
Bloco funcional ou bloco: é o símbolo da operação matemática aplicada ao sinal de entrada do bloco que produz a saída. Os blocos são conectados por setas que indicam o fluxo de sinal.
•
Ponto de soma: Seu símbolo é um círculo com uma cruz. O sinal mais ou menos em cada segmento orientado indica se o sinal deve somado ou subtraído;
•
Ponto de junção: é o ponto a partir do qual o sinal o sinal vindo de um bloco vai para outros blocos ou pontos de soma. Bloco Ponto de soma
Ponto de junção
E(s)
R(s)
+
C(s) G(s)
-
B(s)
Fig. 1.27 – Diagrama de blocos de um sistema em malha fechada. No sistema em malha fechada da Fig. 1.27, a saída C(s) é realimentada para o ponto de soma onde ela é comparada ao sinal de entrada de referência R(s), gerando-se o sinal de erro atuante E(s). Este é multiplicado pela função de transferência G(s) para se obter a saída C(s). Quando é necessário converter a forma do sinal de saída para a forma do sinal de entrada, introduzimos um elemento de realimentação cuja função de transferência é H(s), conforme ilustra a Fig. 1.28. Por exemplo, em um sistema de controle de velocidade de um motor CC, um tacogerador converte o sinal de saída, a velocidade angular, em um sinal de tensão para que esse possa ser comparado com o sinal de entrada. Na Fig. 1.28, o sinal de realimentação que entra no ponto de soma é B(s) = H(s)C(s). Nesta figura, a razão entre o
Introdução aos Sistemas de Controle
71
sinal de realimentação e o sinal de erro atuante é chama função de transferência em malha aberta. Esta razão é expressa por: Função de transferência de malha aberta =
B( s) = G( s) H ( s) E ( s)
Já a razão entre o sinal de saída C(s) e o erro atuante E(s) é chamada função de transferência de alimentação direta, que é expressa por: Função de transferência de alimentação direta =
C ( s) = G ( s) E ( s)
Se H(s) for unitária, as funções de transferência de malha aberta e de alimentação direta são expressas pela mesma equação. Vamos agora obter a função de transferência de malha fechada C ( s) R( s) do sistema da Fig. 1.28. Sejam as seguintes relações: C(s) = G(s)E(s)
(1.26)
E(s) = R(s) – B(s) = R(s) – H(s)C(s) E(s)
R(s)
+
(1.27)
C(s) G(s)
-
B(s) H(s)
Fig. 1.28 – Diagrama de blocos de um sistema em malha fechada com elemento de realimentação. Substituindo (1.27) em (1.26), resulta: C(s) = G(s)[ R(s) – H(s)C(s)]
(1.28)
Rearranjando (1.28), obtém-se C(s) + G(s)H(s)C(s) = G(s)R(s) C(s) [1 + G(s)H(s)] = G(s)R(s) E, finalmente, obtém-se a função de transferência de malha fechada: C ( s) G ( s) = R( s) 1 + G ( s) H ( s)
(1.29)
Sistemas de Controle
72
A expressão (1.29) nos mostra que a função de transferência de malha fechada depende dos elementos de alimentação direta e de realimentação. Vamos agora analisar o que acontece quando incluímos uma perturbação ou distúrbio ao sistema de malha fechada da Fig. 1.28. Na Fig. 1.29 mostra-se o sistema de malha fechada sujeito a uma perturbação. Quando uma entrada de referência e uma entrada de perturbação estão presentes em um sistema linear, pelo princípio da superposição dos efeitos, cada entrada pode ser tratada independentemente da outra, o que faz com a saída do sistema seja o resultado da soma das saídas devidas a cada entrada. N(s) - Perturbação R(s)
+
+ +
G1(s)
C(s) G2(s)
H(s)
Fig. 1.29 – Diagrama de blocos de um sistema em malha fechada sujeito a uma perturbação.
Por inspeção da Fig. 1.28 e aplicando a relação (1.29), obtém-se a resposta do sistema à perturbação, CN, e a resposta à entrada de referência, CR:
C N (s) G2 ( s) = N ( s) 1 + G1 ( s )G2 ( s ) H ( s)
(1.30)
C R ( s) G1 ( s )G2 ( s ) = R( s ) 1 + G1 ( s )G2 ( s) H ( s)
(1.31)
A resposta devido à aplicação simultânea da perturbação e da referência é obtida somando-se as respostas individuais, ou C(s) = CN(s) + CR(s)
C (s) =
(1.32)
G2 ( s) G1 ( s)G2 ( s ) N (s) + R( s ) 1 + G1 ( s )G2 ( s) H ( s ) 1 + G1 ( s)G2 ( s) H ( s)
(1.33)
G2 ( s ) [ N ( s) + G1 ( s) R( s)] 1 + G1 ( s )G2 ( s) H ( s)
(1.34)
C ( s) =
Observe que se |G1(s)G2(s)H(s)| >> 1, obtém-se a partir de (1.30):
C N ( s) G2 ( s ) 1 = = N ( s ) G1 ( s)G2 ( s ) H ( s ) G1 ( s ) H ( s )
(1.35)
Introdução aos Sistemas de Controle
73
Caso |G1(s) H(s)| >> 1, o efeito da perturbação é suprimido, pois
C N (s) ≅ 0 . Isto N ( s)
se constitui em uma grande vantagem do sistema em malha fechada. Por sua vez, C R (s) R( s)
inspecionando (1.31) percebemos que
tende para
1 H ( s)
quando o ganho
G1(s)G2(s)H(s) for muito grande. Isto significa que para |G1(s)G2(s)H(s)| >> 1,
C R (s) tornaR( s)
se independente de G1(s) e G2(s), de modo que variações destes não afetam a função de transferência de malha fechada. Esta é outra vantagem do sistema em malha fechada. Retornemos, agora ao circuito RC da Fig. 1.26. Para construir um diagrama de blocos deste circuito reunimos, primeiramente, as equações que o descrevem:
i=
ei − e 0 R
(1.36)
de0 dt
(1.37)
i=C
Tomando a transformada de Laplace de (1.36) e (1.37) sob condições iniciais nulas, resulta:
I ( s) =
Ei ( s ) − E 0 ( s ) R
I ( s ) = CsE 0 ( s ) ⇒ E 0 ( s ) =
(1.38) I (s) Cs
(1.39)
A Fig. 1.30 ilustra a construção do diagrama de blocos a partir das expressões (1.38) e (1.39). I(s)
Ei(s)
+
1/R
-
E0(s)
I(s) 1/Cs
E0(s)
I(s)
Ei(s)
+
1/R
1/Cs
-
E0(s)
Fig. 1.30 – Diagrama de blocos do circuito da Fig. 1.26 e a sua construção.
Exercício: Obtenha o diagrama de blocos de um circuito RLC série submetido a uma
excitação e(t).
Sistemas de Controle
74
)Usando o MATLAB para realizar a redução de diagramas de blocos Conforme já estudamos, os blocos podem ser interconectados de muitos modos. Quando conectados em série, eles podem ser combinados em um único bloco cuja Função de Transferência é o produto das transmitâncias individuais. Considere as duas funções de transferência mostradas abaixo, cada uma representando um bloco:
G1 ( s ) =
s +1 s + 2s 2 + 2s + 1
G2 ( s ) =
s+3 ( s + 1)( s + 2)
3
A Função de Transferência G(s) resultante da conexão em série dos dois blocos, é obtida com os seguintes comandos: >> sys1 = tf([1 1],[1 2 2 1]); >> sys2 = zpk([-3],[-1, -2],[1]); >> sys = series(sys1,sys2)
Zero/pole/gain: (s+3) (s+1) ---------------------------(s+1)^2 (s+2) (s^2
+ s + 1)
A primeira linha de comando introduz G1(s) na forma de Função de Transferência, ou seja, G1 ( s ) =
N ( s) . O segundo comando introduz a G2(s) na forma na forma D( s)
zero/pólo/ganho, ou seja, G2 ( s ) = K
( s + z1 )(s + z 2 )...(s + z m ) . A terceira linha calcula G(s) ( s + p1 )(s + p 2 )...(s + p n )
.
=G1(s) G2(s) e apresenta-a na forma zero/pólo/ganho. Quando os blocos são conectados em paralelo, eles podem ser combinados em um único bloco cuja Função de Transferência é a soma das transmitâncias individuais. Considere as duas funções de transferência G1(s) e G2(s) apresentadas acima, cada uma representando um bloco. A Função de Transferência G(s) resultante da conexão em paralelo dos dois blocos é obtida no MATLAB utilizando-se os seguintes comandos:
Introdução aos Sistemas de Controle
75
>> sys1 = tf([1 1],[1 2 2 1]); >> sys2 = zpk([-3],[-1, -2],[1]); >> sys = parallel(sys1,sys2)
Zero/pole/gain: (s+3.359) (s+1) (s^2
+ 1.641s + 1.488)
--------------------------------------(s+1)^2 (s+2) (s^2
+ s + 1)
Nesse caso, a terceira linha calcula G(s) =G1(s)+G2(s) e apresenta-a na forma zero/pólo/ganho. Podemos conectar os blocos, ainda, de forma que a saída pode ser realimentada para a entrada através de uma transmitância, conforme ilustra a Fig. 1.28. Conforme
estudamos, a Função de Transferência do sistema da Fig. 1.28 é calculado pela equação (1.29). No MATLAB esta Função de Transferência é obtida por meio da função feedback, Considere o sistema da Fig. 1.28 com
G(s) =
s +1 s + 2s 2 + 2s + 1 3
H ( s) = 1 + 2s Os comandos necessários para se obter a Função de Transferência são: >> sys1 = tf([1 1],[1 2 2 1]); >> sys2 = tf([2 1],[1]); >> sys
= feedback(sys1,sys2,-1)
Transfer function: s + 1 --------------------s^3 + 4 s^2 + 5 s + 2
A forma geral da função feedback é feedback(sys1,sys2,sinal). No caso da realimentação negativa o sinal pode ser omitido.
Sistemas de Controle
76
A redução de diagramas de blocos mais complexos é muito entediante. As funções blkbuild e connect do MATLAB foram concebidas para facilitar o trabalho de redução. O primeiro passo é numerar sequencialmente os blocos do diagrama, conforme a Fig. 1.31. 4 1 R
1
2
2
+
-
+ + +
1/2
+
C 1/s
3
1/(s+1)
5
1/2
6 7
Fig. 1.31 – (a) Diagrama de blocos exemplo.
O segundo passo é entrar com o numerador e o denominador de cada bloco. No
exemplo, deve-se proceder como segue: >> n1=1;d1=1; >> n2=1;d2=2; >> n3=1;d3=[1 0]; >> n4=2;d4=1; >> n5=1;d5=[1 1]; >> n6=1;d6=2; >> n7=1;d7=1;
O terceiro passo é especificar o número de blocos através do comando nblocks
e, na seqüência, entrar com o comando blkbuild para construir uma estrutura de espaço de estados a partir do diagrama de bloco. >> nblocks=7; blkbuild; State model [a,b,c,d] of the block diagram has 7 inputs and 7 outputs.
O quarto passo é escrever uma matriz que indicará a configuração do diagrama
de blocos. Para o nosso exemplo, a matriz é escrita como segue.
Introdução aos Sistemas de Controle
77
>> q=[1 0 0 0 2 1 6 -7 3 2 -4 0 4 5 0 0 5 3 0 0 6 3 0 0 7 5 0 0]
q =
1
0
0
0
2
1
6
-7
3
2
-4
0
4
5
0
0
5
3
0
0
6
3
0
0
7
5
0
0
>>
O quinto passo é especificar a entrada e a saída do sistema. No exemplo, a
entrada é conectada ao primeiro bloco e a saída ao quinto bloco. >> iu = [1]; iy = [5];
A seguir (sexto passo), digite o seguinte comando: >> [A,B,C,D]=connect(a,b,c,d,q,iu,iy);
O sétimo passo é criar um objeto de espaço de estados. >> sys=ss(A,B,C,D);
Por fim (oitavo passo), utiliza-se a função tf para converter a representação em espaço de estados para função de transferência.
Sistemas de Controle
78
>> sys=tf(sys)
Transfer function: 0.5 ------------------s^2 + 0.75 s + 2.25
)Funções do MATLAB que aprendemos a utilizar: 9 series; 9 tf; 9 zpk; 9 parallel;
9 feedback; 9 blkbuild; 9 connect 9 ss.
1.9 Diagramas de fluxo de sinal
Uma representação alternativa para representar graficamente a dinâmica dos sistemas de controle é o diagrama de fluxo de sinal, criado por S. J. Mason. Ele é um diagrama que representa um sistema de equações algébricas em s e consiste em uma rede de nós interligados por ramos orientados. A seguir, listamos algumas definições relativas aos
diagramas de fluxo de sinal. •
Nó – um nó é um ponto que representa uma variável ou um sinal. Há três
tipos de nós: ¾ Nó fonte ou de entrada – possuem apenas ramos saindo, o que representa
uma variável independente; ¾ Nó sumidouro ou de saída- possuem apenas ramos chegando, o que
representa uma variável dependente;
Introdução aos Sistemas de Controle
79
¾ Nó misto - possuem ramos saindo e chegando, o que representa uma
variável independente; •
Transmitância – A transmitância é um ganho real ou complexo entre dois
nós; •
Ramo – um ramo é um segmento de reta orientado ligando dois nós. Seu
ganho é uma transmitância; •
Percurso – um percurso é qualquer trajetória de ramos conectados e cujas
setas estão na mesma direção. O percurso é dito direto quando sua trajetória de um nó fonte até um nó sumidouro não cruza quaisquer nós mais de uma vez. Seu ganho é o produto das transmitâncias dos seus ramos. •
Laço – um laço é um percurso fechado. Seu ganho é o produto das
transmitâncias de seus ramos. nó fonte x4
Nós mistos
d a
x2
x1 nó fonte
1
b x3 -c
x3 nó sumidouro
Fig. 1.32 – Gráfico de fluxo de sinal.
Um nó faz a adição de todos os sinais que chegam até ele e transmite esta soma a todos os ramos que saem dele. Já um nó misto pode ser tratado como um nó sumidouro se adicionarmos um ramo de transmitância unitária. Essas propriedades são ilustradas pelo diagrama da Fig. 1.32, que representa as seguintes equações x3 = bx2 + dx4
(1.40)
x2 = ax1 - cx3
(1.41)
Substituindo (1.41) em (1.40), obtemos: x3 = abx1 - bcx3+ dx4
(1.42)
A seguir apresentamos regras úteis na simplificação de diagramas de fluxo de sinal:
Sistemas de Controle
80
•
Percursos em série: podem ser combinados em um percurso único
multiplicando-se as transmitâncias, conforme ilustra a Fig. 1.33a. •
Percursos em paralelo: podem ser combinados somando-se as
transmitâncias, conforme ilustra a Fig. 1.33b; •
Eliminação de um nó: um nó misto pode ser eliminado, conforme mostra a
Fig. 1.33c; •
Supressão de um laço de realimentação: um laço pode ser eliminado,
conforme ilustra a Fig. 1.33d. As equações para um laço de realimentação são: x3 = bx2
(1.43)
x2 = ax1 - cx3
(1.44)
Substituindo (1.44) em (1.43) resulta: x3 = abx1 - bcx3
(1.45)
Isolando-se x3 e, (1.45), obtém-se: x3 =
ab x1 1 + bc a
a x1
b x2
a+b
ab x3
=
x1
x1
x3
x2 b
(a) a b
ac
x3
x4
= bc
b
ab x3
=
ab 1 +bc
x3
=
x1
-c
x4
x2
(c)
x1
(b)
c
x2 x2
x1
x1
x1
a
=
x1
bc
(d) Fig. 1.33 – Simplificações em diagramas de fluxo de sinal.
x3
x2
Introdução aos Sistemas de Controle
81
Exemplo 1.3 - Construção de um diagrama de fluxo de sinal. Considere o circuito RLC série mostrado na Fig. 1.34, onde consideraremos a corrente i e a tensão de saída ec variáveis dependentes da rede. As equações diferenciais que representam o circuito são: − ei + i ⋅ R + L
i=C
di + eo = 0 dt
(1.46)
de0 dt
(1.47)
Como não podemos construir um diagrama de fluxo de sinais com equações diferenciais, transformamos as equações (1.46) e (1.47) em equações algébricas pela aplicação da transformada de Laplace: − Ei ( s ) + I ( s ) ⋅ R + LsI ( s ) − Li (o) + E o ( s ) = 0 I ( s ) = CsE 0 ( s ) − Ce0 (0)
(1.48) (1.49)
onde i(0) é corrente inicial no indutor e e0(0) é a tensão inicial no capacitor em t = 0. Nessas equações temos como variáveis de entrada i(0), e0(0) e Ei(s) Isolando-se I(s) em (1.48) e E0(s) em (1.49), obtém-se:
I ( s) =
Ei ( s ) + Li (o) − Eo ( s) Ei ( s) Eo ( s) i (0) = + − Ls + R L( s + R L) s + R L L( s + R L) E0 ( s) =
I ( s) + Ce0 (0) I ( s) e0 (0) = + Cs Cs s
(1.50)
(1.51)
O diagrama de fluxo de sinais construído a partir das equações (1.50) e (1.51) é mostrado na Fig.1.35.
e
i
+
L
R i
C
e0
Fig. 1.34 – Circuito RLC série.
Sistemas de Controle
82
e0(0)
i0(0) 1/(s+R/L)
1 L(s+R/L) Ei(s)
1/s 1
1/Cs E0(s)
I(s)
E0(s)
-1 L(s+R/L) Fig. 1.35 – Representação em diagrama de fluxo de sinais do circuito RLC série da Fig. 1.33.
Em diagramas de fluxo de sinais simples, como é o caso do diagrama da Fig. 1.35, a função de transferência de malha fechada pode ser facilmente obtida por inspeção. Para diagramas mais complexos, existe uma ferramenta chamada fórmula de Mason. A fórmula de Mason, que é aplicável ao ganho global, ou seja, a transmitância entre um nó de entrada e um nó de saída, é dada por: T=
1 = ∑ Tk Δ k Δ k
(1.52)
onde Tk é o ganho ou transmitância do k-ésimo percurso direto e Δ é o determinante do diagrama, dado por:
Δ = 1 − ∑ La + ∑ Lb Lc − ∑ Ld Le L f + K Nesta equação
∑L
a
é soma de todos os ganhos de todos os laços,
(1.53)
∑L L b
c
produtos de ganhos de todas as combinações possíveis de dois laços disjuntos e
é a soma de
∑L
d
Le L f é
a soma de produtos de ganhos de todas as combinações possíveis de três laços disjuntos. Dois laços são disjuntos se não possuem nós comuns. Na equação (1.52) Δk é o cofator obtido de Δ removendo os laços que tocam o percurso Tk A seguir, ilustra-se o uso da fórmula de Mason. Exemplo 1.4 – Considere o diagrama de bloco da Fig. 1.36a e seu diagrama de fluxo de sinal correspondente (Fig. 1.36b). Empregando a fórmula de Mason, vamos obter a função de transferência
C ( s) R( s) . O diagrama possui apenas um percurso direto cujo ganho é T1 = G1G2G3. Ele possui três laços, cujos ganhos são L1 = G1G2H1, L2 = - G2G3H2 e L3 = - G1G2G3.
Introdução aos Sistemas de Controle
83
H2
-
R
+
G1
+ + +
-
C G3
G2
+ H1
(a) -H2 R(s)
1
1
G1
G2
G3
1
C(s)
H1 -1
(b) Fig. 1.36 – (a) Diagrama de blocos de um sistema de múltiplos laços e (b) diagrama de fluxo de sinal equivalente. Como não há laços disjuntos, o determinante obtido a partir de (1.53) é:
Δ = 1 − ∑ La = 1 − ( L1 + L2 + L3 ) = 1 − G1G2 H 1 + G2 G3 H 2 + G1G2 G3 O cofator Δ1 é obtido de Δ removendo os laços que tocam o percurso T1. Como o percurso T1 toca todos os laços, resulta em Δ1 = 1. Finalmente, a função de transferência é dada por:
G1G 2 G3 C ( s) T1 ⋅ Δ1 = = R( s ) Δ 1 − G1G 2 H 1 + G 2 G3 H 2 + G1G2 G3 A título de exercício, tente chegar a função de transferência acima reduzindo o diagrama de blocos da Fig. 1.36a. Exemplo 1.5 – Obter a função de transferência do sistema representado pelo diagrama mostrado na Fig. 1.37. Neste sistema há três caminhos diretos entre a entrada R(s) e a saída C(s), com ganhos T1 = G1G2G3G4G5, T2 = G1G6G4G5 e T3 = G1G2G7. Ele possui quatro laços , cujos ganhos são L1 = -G2G7H2, L2 = - G6G4G5H2, L3 = - G4H1 e L4 = - G2G3G4G5H2. Os laços L1 e L3 são disjuntos. Assim, o determinante obtido a partir de (1.53) é:
Sistemas de Controle
84
Δ = 1 − ∑ La + ∑ Lb Lc = 1 − ( L1 + L2 + L3 + L4 ) + L1 L3 = 1 + G 2 G 7 H 2 + G 4 G 5 G 6 H 2 + G 4 H1 + G 2 G 3 G 4 G 5 H 2 + G 2 G 4 G 7 H1H 2 Os cofatores Δk são obtidos de Δ removendo os laços que tocam os percursos Tk. Como todos os laços tocam T1 e T2, resulta em Δ1 = Δ2 = 1. O percurso T3, por sua vez, não é tocado apenas por L3, de modo que Δ3 = 1 – L3 = 1 + G4H1. Finalmente, a função de transferência é dada por: T ⋅Δ T Δ + T2 Δ 2 + T3 Δ 3 C(s) =∑ k k = 1 1 R( s ) Δ Δ
=
G 1G 2 G 3 G 4 G 5 + G 1G 4 G 5 G 6 + G 1G 2 G 7 (1 + G 4 H1 ) 1 + G 2 G 7 H 2 + G 4 G 5 G 6 H 2 + G 4 H1 + G 2 G 3 G 4 G 5 H 2 + G 2 G 4 G 7 H1 H 2 G7
G6 G1
R(s)
G2
G3
G4
G5
C(s)
-H1 -H2
Fig. 1.37 –Diagrama de fluxo de sinal de um sistema.
1.10 Método do espaço de estados para análise de sistemas de controle Definições:
•
Estado: o estado de um sistema dinâmico é o menor conjunto de n variáveis x1(t), x2(t), ..., xi(t), ..., xn(t) chamadas variáveis de estado, tal que o conhecimento destas variáveis em t = t0, junto com o conhecimento das entradas u(t) para t ≥ t0, sejam suficientes para descrever univocamente o comportamento do sistema para t ≥ t0. Geralmente, o instante inicial t0 é considerado igual a zero.
•
Variáveis de estado: as variáveis de estado de um sistema dinâmico são as variáveis que constituem o menor conjunto de variáveis que determinam o estado do sistema dinâmico. As variáveis de estado não precisam ser necessariamente grandezas observáveis e mensuráveis, podem ser grandezas puramente matemáticas.
Introdução aos Sistemas de Controle
•
85
Vetor de estado: se n variáveis de estado são necessárias para descrever completamente o comportamento de um sistema, então estas n variáveis de estado podem ser consideradas as n componentes de um vetor x, chamado vetor de estado.
⎡ x1 (t ) ⎤ ⎡ x1 ⎤ ⎢ x (t )⎥ ⎢ x ⎥ x(t ) ≡ ⎢ 2 ⎥ = ⎢ 2 ⎥ = x ⎢ M ⎥ ⎢M⎥ ⎢ ⎥ ⎢ ⎥ ⎣ x n ( t )⎦ ⎣ x n ⎦ Um vetor de estado é portanto um vetor que determina univocamente o estado
x(t) do sistema para qualquer instante t ≥ t0, uma vez que o estado em t = t0 é dado e a entrada u(t) para t ≥ t0 está especificada.
•
Espaço de estados: o espaço n-dimensional cujos eixos coordenados consistem no eixo x1, x2, ... , xn é chamado espaço de estados.
•
Equações do espaço de estados: na análise por espaço de estados, três tipos de variáveis são levadas em consideração, a saber, variáveis de entrada, saída e de estado.
O primeiro passo para a aplicação desses conceitos a um sistema dinâmico é a seleção das variáveis que devem representá-lo, sendo que não existe uma maneira única de fazer essa seleção. Uma maneira comumente usada para expressar o estado do sistema é o método das variáveis de estado com significado físico, no qual a seleção das variáveis se baseia nos elementos armazenadores de energia do sistema. A Tabela 1.3 apresenta alguns elementos armazenadores de energia que aparecem em sistemas físicos. A seguir ilustra-se o método de espaço de estados. Seja o circuito RLC série da Fig. 1.34, que contém dois elementos armazenadores de energia, um indutor e um capacitor. Escolhendo a tensão no capacitor e a corrente no indutor como variáveis de estado, temos:
x1 = vC
(1.54)
x2 = i
(1.55)
Fazendo ei = u e aplicando as equações (1.54) e (1.55) nas expressões (1.46) e (1.47) obtém se:
Sistemas de Controle
86
TABELA 1.3 ELEMENTOS ARMAZENADORES DE ENERGIA
Elemento
Energia
Capacitância C
1 2 Cv 2 Indutância L 1 2 Li 2 Massa M 1 Mv 2 2 Momento de inércia J 1 Jω 2 2 Elastância K 1 Kx 2 2 Compressibilidade fluída 1 VPL 2 V 2 KB KB Capacitância fluída C = ρA 1 ρAh 2 2 Capacitância térmica C 1 Cθ 2 2
Variável física Tensão v Corrente i Velocidade de translação v Velocidade angular ω Deslocamento x Pressão PL
Altura h Temperatura θ
. Rx2 + L x 2 + x1 = u . x 2 = C x1 Rearranjando (1.56) e (1.57), obtém as seguintes equações de estado: . 1 x1 = x 2 C . 1 1 R x 2 = − x1 + x 2 + u L L L
(1.56) (1.57)
(1.58) (1.59)
As equações de estado de um sistema são um conjunto de n equações diferenciais de primeira-ordem, onde n é o número de variáveis de estado independentes. Expressando as equações (1.58) e (1.59) em notação matricial, obtém-se:
⎡. ⎤ 1 C ⎤ ⎡ x1 ⎤ ⎡ 0 ⎤ ⎢ x1 ⎥ = ⎡ 0 + u ⎢ ⎢. ⎥ − 1 L − R L ⎥⎦ ⎢⎣ x2 ⎥⎦ ⎢⎣1 L ⎥⎦ ⎣ ⎢⎣ x 2 ⎥⎦
(1.60)
ou: . x = Ax + bu
Se y(t) = vC = x1, a equação matricial de resposta do sistema será:
(1.61)
Introdução aos Sistemas de Controle
87
[ y ] = [1 0] ou:
⎡ x1 ⎤ ⎢x ⎥ ⎣ 2⎦
(1.62)
y = Cx
(1.63)
As expressões (1.62) e (1.63) se referem ao circuito RLC série, um sistema de uma entrada e uma saída. Para sistemas com m entradas e l saídas, estas equações tornam-se: . x = Ax + bu
(1.64)
y = Cx + Du
(1.65)
onde:
. x é um vetor coluna n x 1; A é a matriz de evolução do processo ou de estado, uma matriz de coeficientes n x
n; x é o vetor de estado, de dimensão n x 1; B é a matriz de controle ou de entrada, de dimensão n x m; u é o vetor de controle ou de entrada, de dimensão m x 1; y é o vetor resposta ou de saída, de dimensão l x 1; C é a matriz resposta ou de saída l x n; D é a matriz de transmissão direta l x m (que no exemplo era igual a zero).
O diagrama de blocos que representa as equações de estado do circuito da Fig. 1.34 é apresentado na Fig. 1.38. . x2
u 1/L
+ +
. x1
x2
∫
1/C
∫
- +
+
R/L 1/L
Fig. 1.38 – Diagrama de blocos do circuito da Fig. 1.33
x1 = y
Sistemas de Controle
88
EXERCÍCIOS
1.
Achar os pólos e zeros das seguintes funções complexas: a. G ( s ) = c. G ( s ) =
2.
s 2 + 6s + 8 3
b. G ( s ) =
2
s + 12 s + 35s
s +1 2
s + 2s + 5
K ( s + 2) s ( s 2 + s + 1)
Quais das equações diferenciais apresentadas abaixo são lineares? a. xy'+ x 2 y = sen x
b. y '−(cos x) y = 1
d. y ' '+(1 + x 2 ) ln y ' = 2
e. y ' '+(1 + x 2 ) y ' = 2
3. Dada F ( s ) =
c. x( y ' ) 2 − x 2 y = sen x
1 aplicando o teorema do valor final encontre o lim f (t ) . Verifique o t →∞ s ( s + 1)
resultado encontrando f(t). 4. Determinar a Transformada de Laplace da integral de convolução t
t
0
0
f 1 (t ) * f 2 (t ) = ∫ τ (1 − e −(t −τ ) )dτ = ∫ (t − τ )(1 − e −t )dτ onde f1(t) = f2(t) = 0 para t < 0 f1(t) = t para t ≥ 0 f2(t) = 1- e-t para t ≥ 0 5. Utilizando uma tabela de Transformada de Laplace, encontre f(t). a. F ( s ) =
1 ( s + 1)( s + 2)
b. F ( s ) =
1
c. F ( s ) =
( 1 + s) 3 5
1 s (2 + s ) 2
6. Determine a transformada inversa de Laplace das funções que seguem aplicando a expansão em frações parciais: a. F ( s ) =
1 ( s + 2)( s + 3)
b. F ( s ) =
1 2
( s + 1) ( s + 4)
c. F ( s ) =
10 2
s ( s + 4)( s + 1)
7. Obtenha as equações de estado para o circuito abaixo.
L2
i(t)
L1
C2
C1
L3
Introdução aos Sistemas de Controle
89
8. O que é um sistema de controle adaptativo? Quais blocos o caracterizam? 9. Seja o sistema de controle de posição de antena abaixo. Identifique nele os seguintes elementos, justificando a sua resposta: a. Transdutor b. Atuador c. Variável de saída Posição da Antena c(t)
Potenciômetro de Referência r(t)
Comparador Vr(t)
Vc(t)
Potenciômetro de Transdução
Ve(t) Amplificador de Potência
Engrenagem
Ea(t)
Motor DC
10. Aplicando a transformada de Laplace, achar a solução x(t) das equações diferenciais. ..
.
..
.
a. x + 3 x + 2 x = 0 , com x(0) = 1 e x’(0) = 2 b. x + 2 x + 5 x = 3 , com x(0) = 0 e x’(0) = 0 11. Podemos dividir a história do controle automático em quatro fases. Quais são essas fases? Dê a(s) características marcantes de cada fase. 12. Construa uma tabela comparando as filosofias do controle clássico e moderno.
Respostas selecionadas
1. (a) zeros em s = {-2, -4, ∞}; polos em s = {0, -5, -7}, (b) zeros em s = {-1, ∞}; polos em s = {1 ± 2j} e (c) zeros em s = {-2, ∞, ∞}; polos em s = {0, -0,5 ± j0,866}.
2. a, b , e. 3. f (∞) = 1 .
Sistemas de Controle
4. F1 (s) ⋅ F2 (s) =
90
1 3
s (s + 1)
5. (a) e-t – e-2t , (b)
t 2 e −t / 5 1 (2t + 1)e −2t , (c) − . 4 4 2
6. (a) e-2t – e-3t , (b)
1 ⎛ − t e −4 t e − t ⎜ te + − 3 ⎜⎝ 3 3
10. (a) 4e-t – 3e-2t , (b)
⎞ 5 1 ⎟ , (c) − 2e − t − cos 2t − sen 2t . ⎟ 2 2 ⎠
3 − e −t ⋅ (0,6 cos 2t − 0,3sen2t ) . 5
Modelagem de Sistemas Elétricos e Eletromecânicos
91
2. MODELAGEM DE SISTEMAS ELÉTRICOS E ELETROMECÂNICOS
2.1 Sistemas Elétricos Aplicando as Leis de Kirchhoff das tensões (LTK) e/ou das correntes (LCK) a um circuito elétrico obtemos o seu modelo matemático. Considere o circuito RLC da Fig. 1.33 e as equações algébricas (1.48) e (1.49) obtidas a partir das equações diferenciais que o representam. Admitindo condições iniciais nulas em (1.48) e (1.49), obtém-se:
− E i ( s ) + I ( s) ⋅ R + LsI ( s ) + E o ( s ) = 0 I ( s) = CsE 0 ( s )
(2.1) (2.2)
Substituindo (2.2) em (2.1), resulta:
− Ei ( s ) + RCsE0 ( s ) + LCs 2 E 0 ( s) + E o ( s) = 0
(2.3)
Supondo ei a entrada e e0 a saída, a função de transferência do circuito é:
E 0 ( s) 1 = 2 Ei ( s ) LCs + RCs + 1
(2.4)
Um modo alternativo de obter a função de transferência de um circuito elétrico é utilizar o conceito de impedância complexa Z(s). A impedância complexa de um elemento de dois terminais é a relação entre as transformadas de Laplace da tensão entre os seus terminais e da corrente que o atravessa, admitindo-se condições iniciais nulas, ou seja, Z(s) = E(s)/I(s). A Tabela 2.1 apresenta a impedância complexa para resistências, indutâncias e capacitâncias. A Fig. 2.1 apresenta o circuito RLC da Fig. 1.31 em termos de impedâncias complexas. A Função de Transferência deste circuito é:
Sistemas de Controle
92
E0 (s) Z 2 (s) = Ei ( s) Z1 ( s) + Z 2 ( s)
(2.5)
ou,
E0 (s) 1 / sC 1 = = 2 Ei ( s) R + sL + 1 / sC s LC + RCs + 1 logicamente idêntica a (2.4). TABELA 2.1 IMPEDÂNCIAS COMPLEXAS
Elemento
Relação Tensão/Corrente
Resistência R
R=
Capacitância C
Ei(s)
R
v(t ) V ( s ) ⇒ i (t ) I ( s)
1 sC
sV ( s ) 1 dv(t ) dt = ⇒ C i(t ) I (s) v(t ) V ( s) L= ⇒ di(t ) sI ( s) dt
Indutância L
R
Impedância Complexa
sL
sL
Z1(s) = R+sL
+ 1/sC E0(s)
Ei(s)
-
+
Z2(s) =1/sC
E0(s)
-
Fig.2.1 – Circuito RLC série representado por impedâncias complexas. Considere, agora o circuito de dois estágios mostrado na Fig. 2.2. Nesse circuito o primeiro estágio (R1C1) carrega o segundo estágio (R2C2). Aplicando a LTK ao circuito obtemos:
− ei + R1i1 + vC1 = 0
(2.6)
− v C1 + R 2 i 2 + e 0 = 0
(2.7)
Por sua vez a LCK nos dá:
i1 = i 2 + C1 e,
dvC1 dt
(2.8)
Modelagem de Sistemas Elétricos e Eletromecânicos
i2 = C 2
93
de0 dt
(2.9)
Aplicando a transformada de Laplace nas equações (2.6) a (2.9), admitindo condições iniciais nulas, obtém-se, respectivamente:
R1 ei
I1
R2 C1
I2
C2
eo
Fig. 2.2 – Circuito RC de dois estágios. − E i ( s ) + R1 I 1 ( s) + VC1 ( s) = 0
(2.10)
− VC 1 ( s ) + R 2 I 2 ( s ) + E 0 ( s ) = 0
(2.11)
I 1 ( s ) = I 2 ( s) + sC1VC1 ( s)
(2.12)
I 2 ( s) = sC 2 E 0 ( s)
(2.13)
Substituindo (2.13) em (2.11) e (2.12), obtém-se, respectivamente:
VC1 ( s) = sR2 C 2 E 0 ( s ) + E 0 ( s )
(2.14)
I 1 ( s ) = sC 2 E 0 ( s) + sC1VC1 ( s)
(2.15)
Substituindo (2.15) em (2.10), resulta:
− E i ( s) + sR1C 2 E 0 ( s) + sR1C1VC1 ( s ) + VC1 ( s ) = 0
(2.16)
Substituindo, agora (2.14) em (2.16), resulta:
− Ei ( s) + sR1C 2 E0 ( s) + s 2 R1C1 R2 C 2 E0 ( s) + sR1C1 E0 ( s) + sR2 C 2 E0 ( s) + E0 ( s ) = 0 (2.17) Agrupando os termos em E0(s), pode-se obter a função de transferência abaixo:
E0 (s) 1 = 2 E i ( s) R1C1 R2 C 2 s + ( R1C1 + R2 C 2 + R1C 2 ) s + 1
(2.18)
Considere, agora, o circuito mostrado na Fig. 2.3, onde um amplificador de isolação é inserido entre os estágios RC para evitar que o segundo estágio carregue o primeiro. Nesse caso, a função de transferência E0(s)/Ei(s) é igual ao produto das Funções de Transferência de cada estágio, considerando o amplificador um estágio intermediário. Assim,
Sistemas de Controle
94
E 0 ( s) 1 1 K = ⋅K ⋅ = Ei ( s ) R1C1 s + 1 R2 C 2 s + 1 (R1C1 s + 1) ⋅ (R2 C 2 s + 1)
(2.19)
ou,
E0 (s) 1 = 2 Ei ( s) R1C1 R2 C 2 s + ( R1C1 + R2 C 2 ) s + 1
ei
R1 C1
Amplificador de Isolação (Ganho K)
(2.20)
R2 C2
eo
Fig. 2.3 – Circuito RC de dois estágios isolados. Comparando as funções de transferência (2.18) e (2.20), observamos que elas diferem pelo termo R1C2. Esse termo, portanto, representa a interação entre os estágios RC. Essa análise nos mostra que quando dois circuitos são ligados em cascata, a Função de Transferência resultante só será o produto entre as Funções de Transferência de cada circuito, quando o segundo circuito apresentar impedância de entrada muito grande. Os elementos passivos, tais como indutores e capacitores, só podem fornecer energia a um sistema se tiverem armazenado esta energia anteriormente. Um sistema que contém apenas elementos passivos, tal como o circuito da Fig. 2.2, é dito passivo. Um elemento que pode fornecer energia para um sistema é denominado ativo. O amplificador
operacional é um elemento ativo, já que possui uma fonte de alimentação para prover energia ao sistema. Considere, agora, o circuito amplificador inversor da Fig. 2.4. Uma vez que uma corrente extremamente pequena flui para o amplificador operacional, a função de transferência pode ser obtida, a partir da equação:
i 1 = i2
(2.21)
Entretanto,
i1 =
ei − e ' R1
(2.22)
i2 =
e'−e0 R2
(2.23)
Substituindo (2.22) e (2.23) em (2.21), resulta:
Modelagem de Sistemas Elétricos e Eletromecânicos
95
ei − e' e'−e0 = R1 R2
(2.24)
Como em um amplificador operacional com realimentação negativa e’ ≅ 0, (2.24) torna-se:
ei e =− 0 R1 R2
(2.25)
Assim, tomando a transformada de Laplace de (2.25) e arrumando na forma de função de transferência:
E 0 ( s) R =− 2 Ei (s) R1 i2 ei
i1
R1
(2.26)
R2 -
e'
eo +
Fig. 2.4– Amplificador operacional em configuração inversora. Exercício: Encontre a função de transferência do amplificador operacional em configuração não inversora da Fig. 2.5.
R2 R1 ei
+
eo
Fig. 2.5– Amplificador operacional em configuração não-inversora. Considere, agora, o circuito integrador da Fig. 2.6. Uma vez que uma corrente extremamente pequena flui para o amplificador operacional, a função de transferência pode ser obtida, a partir da equação:
i 1 = i2 + i 3 onde i1 e i2 são dados, respectivamente, pelas expressões (2.22) e (2.23) e,
(2.27)
Sistemas de Controle
96
i3 = C
d (e'−e0 ) dt
(2.28)
Substituindo (2.22), (2.23) e (2.28) em (2.27), resulta:
ei − e' e'−e0 d (e'−e0 ) = +C R1 R2 dt
(2.29)
Uma vez que e’ ≅ 0, (2.29) torna-se:
ei e de =− 0 −C 0 R1 R2 dt
(2.30)
Assim, tomando a transformada de Laplace de (2.30) com condições iniciais nulas, obtém-se:
Ei ( s) E (s) =− 0 − CsE 0 ( s) R1 R2 ou,
Ei ( s) 1 + R2 Cs =− E0 ( s) R1 R2
(2.31)
Escrevendo (2.31) na forma de função de transferência, obtém-se:
E 0 ( s) R 1 =− 2 ⋅ Ei ( s ) R1 1 + R2 Cs
ei
i1
R1
e'
i3
C
i2
R2 eo
+
Fig. 2.6 – Amplificador operacional em configuração integradora. Exercício: Encontre a função de transferência do amplificador operacional em configuração integradora da Fig. 2.6 utilizando o método das impedâncias complexas. Para finalizar essa seção, iremos modelar o conversor abaixador ou buck apresentado na Fig. 2.7(a). Se o conversor estiver operando em condução contínua, é válida a seguinte relação:
Modelagem de Sistemas Elétricos e Eletromecânicos
97
v MED t =D= F Ei T
(2.32)
onde: tF é o tempo de condução do transistor; T é o período de chaveamento; D é a razão cíclica ou duty cycle. A partir da Fig. 2.7(b), extrai-se que:
t F vC = T VS
(2.33)
onde: vC é o sinal de controle; vS é o valor máximo da dente de serra. Substituindo (2.33) em (2.32) e rearranjando, resulta:
v MED E i = vC VS VMED
L0
(2.34)
E0 C0
Ei
R1 RL
E0*
VS
VC
R2
RSE
Zi Zf VB VC DRIVER
+
+ PWM
VS
VREF tF
Controlador / amplificador de erro
(a)
T
(b)
Fig. 2.7 – (a) Conversor abaixador e circuito de malha fechada e (b) formas de onda no elemento PWM. Por sua vez, a função de transferência do filtro de saída pode ser obtida a partir do método das impedâncias complexas como segue:
Sistemas de Controle
98
R L ⋅ (1 / sC 0 + R SE ) G ( s) =
sL0 + ⎛⎜ ⎝
R L + 1 / sC 0 + R SE
R L ⋅ (1 / sC 0 + R SE )
⎞ R L + 1 / sC 0 + R SE ⎟⎠
Como RL >> RSE, resulta:
R L ⋅ (1 / sC 0 + R SE ) G ( s) =
sL0 + ⎛⎜ ⎝
R L + 1 / sC 0
R L ⋅ (1 / sC 0 + R SE )
⎞ R L + 1 / sC 0 ⎟⎠
Prosseguindo: R L ⋅ (1 / sC 0 + R SE )
G ( s) =
R L + 1 / sC 0 (sL0 ⋅ (R L + 1 / sC 0 ) + R L ⋅ (1 / sC 0 + RSE )) R L + 1 / sC 0
R L ⋅ (1 / sC 0 + R SE ) (sL0 R L + L0 / C 0 + R L ⋅ (1 / sC 0 + RSE ))
G ( s) =
⎛ 1 + sC 0 R SE ⎞ ⎟⎟ R L ⋅ ⎜⎜ sC 0 ⎝ ⎠ G ( s) = ⎛ ⎛ 1 + sC 0 R SE ⎜ sL0 R L + L0 / C 0 + R L ⋅ ⎜ ⎜ ⎜ sC 0 ⎝ ⎝ ⎛ 1 + sC 0 R SE ⎞ ⎟⎟ R L ⋅ ⎜⎜ sC 0 ⎝ ⎠ G ( s) = 2 s L0 C 0 R L + sL0 + R L ⋅ (1 + sC 0 R SE )
(
G ( s) =
G (s) =
)
⎞⎞ ⎟⎟ ⎟ ⎟ ⎠⎠
sC 0
R L ⋅ (1 + sC 0 R SE )
s L0 C 0 R L + sL0 + R L ⋅ (1 + sC 0 R SE ) 2
R L ⋅ (1 + sC 0 R SE ) s 2 L0 C 0 R L + s ( L0 + R L C 0 R SE ) + R L
(2.35)
Finalmente, dividindo o numerador e o denominador de (2.35) por RL, obtém-se a função de transferência do filtro de saída
FT = G ( s) =
1 + sC 0 R SE
s 2 L0 C 0 + s(( L0 + R L C 0 R SE ) R L ) + 1
(2.36)
Podemos, agora, construir o diagrama de blocos do conversor Buck da Fig. 2.7, o qual mostramos na Fig. 2.8.
Modelagem de Sistemas Elétricos e Eletromecânicos
99
VC(s)
ε(s) EREF(s)
+
VMED(s) E0(s)
Ei VS
GC(s)
-
G(s)
R2 R1+ R2
Fig. 2.8 – Diagrama de blocos do conversor abaixador da Fig. 2.7(a).
2.2 Sistemas Eletromecânicos Modelaremos nesta seção o servomotor de corrente contínua controlado pela armadura apresentado na Fig. 2.9, onde: Ra é a resistência da armadura (Ω); La é a indutância da armadura (H); ia é a corrente da armadura (A); if é a corrente do campo (A); ea é a tensão aplicada na armadura (V); eb é fcem (V);
θ é o deslocamento angular do eixo do motor (rad); T é o torque desenvolvido pelo motor (Nm); J é o momento de inércia (kgm2);’ B é o coeficiente de atrito viscoso (Nm/rad/s). Ra ea
La eb
ia
M
Τ
J θ
B if = cte
Fig. 2.9 – Diagrama de um servomotor CC controlado pela armadura.
Sistemas de Controle
100
O torque ou conjugado T produzido pelo motor é proporcional ao produto do fluxo no entreferro pela corrente na armadura. Por sua vez o fluxo é proporcional a corrente de campo. Assim: T = K 1ϕ i a = K 1 K f i f i A
(2.37)
onde K1 e Kf são constantes. Como a corrente de campo é constante, a equação (2.37) tornase: T = K iA
(2.38)
onde K em [N.m/A] é a constante de torque do motor. Com a rotação do motor é induzida na armadura uma tensão proporcional ao produto do fluxo pela velocidade angular. Como o fluxo é constante, a tensão induzida eb é expressa por: eb = K b
dθ dt
(2.39)
onde Kb é uma constante expressa em [V/rad/s]. O controle de velocidade é alcançado por meio do controle da tensão aplicada na armadura ea. Sua polaridade determina o sentido da corrente na armadura que, por sua vez, determina o sentido de rotação do motor. A equação diferencial para o circuito de armadura é:
e a = La
dia + R a i a + eb dt
(2.40)
A corrente de armadura produz um torque de acordo com a expressão (2.38), que é aplicado a carga, que por sua vez consiste de uma inércia e de um amortecedor. O conjugado aplicado a um corpo com momento de inércia J produz uma aceleração angular. Por sua vez, para se produzir o movimento de um corpo através de um fluído como o ar, deve se aplicar um conjugado que supere o de amortecimento. Assim, a equação do conjugado é escrita como:
T = K iA = J
d 2θ dt
2
+B
dθ dt
(2.41)
Tomando a transformada de Laplace das equações (2.39), (2.40) e (2.41) sob condições iniciais nulas, obtemos:
E b ( s) = K b sΘ( s )
E a ( s ) = ( La s + R ) I a + E b ( s )
(2.42) (2.43)
Modelagem de Sistemas Elétricos e Eletromecânicos
101
(
)
T ( s) = K I A ( s) = J s 2 + Bs Θ( s)
(2.44)
Considerando Θ(s) como saída e Ea(s) como entrada e empregando as equações (2.42), (2.43) e (2.44) constrói-se o diagrama de bloco da Fig. 2.10(a). A vantagem do emprego do diagrama de blocos é que ele fornece uma imagem nítida da função de transferência de cada bloco do sistema. Embora um servomotor CC seja em si um sistema em malha aberta, o diagrama de blocos mostra que o motor tem uma malha de realimentação “interna” devido a fcem, a qual representa a realimentação de um sinal proporcional à velocidade do motor Aplicando a Fig. 2.10 a equação (1.29), obtém-se:
Θ( s ) = E a ( s)
(La s + R a ) 1+
K
(
s J s+B
)
KK b s ( La s + R a ) s J s + B
(
=
)
K ( La s + R a ) s J s + B
(
)
(La s + Ra ) s (J s + B ) + KK b s (La s + Ra ) s (J s + B )
Θ( s ) K = E a ( s ) (La s + Ra ) s J s + B + KK b s
(
)
(2.45)
Rearranjando o denominador de (2.45), obtém-se a função de transferência do servomotor CC controlado por armadura: K Θ( s ) = 2 E a ( s ) s La J s + ( La B + Ra J ) s + Ra B + KK b
(
)
(2.46)
Como La é normalmente pequena, ela pode ser desprezada. Nesse caso a função de transferência (2.46) torna-se: Θ( s ) K = E a ( s ) s (Ra Js + Ra B + KK b )
(2.47)
ou Θ( s ) = E a ( s)
K ⎛ ⎞ Ra J s ( R a B + KK b )⎜⎜ s + 1⎟⎟ ⎝ R a B + KK b ⎠
K =
R a B + KK b
⎛ ⎞ Ra J s⎜⎜ s + 1⎟⎟ ⎝ R a B + KK b ⎠
(2.48)
ou Km Θ( s ) = E a ( s ) s (τ m s + 1)
(2.49)
Sistemas de Controle
102
com
Km =
K / Ra K ⎛ rad / s ⎞ = ⎜ ⎟ Ra B + KK b B + K b K / Ra ⎝ V ⎠
(2.50)
τM =
Ra J J (s ) = Ra B + KK b B K / Ra + K b K / Ra
(2.51)
e
Essa função de transferência é representada no diagrama de blocos simplificado da Fig. 2.10(b). Ia(s) Ea(s)
+
-
1 sLa+ R
Eb(s)
K Js2+ Bs
θ (s)
Ea(s)
Km S(τm+ 1)
θ (s)
Kbs
(b)
(a)
Fig. 2.10 – (a) Diagrama de blocos de um servomotor CC e (b) diagrama de blocos simplificado. A partir de (2.49), sabendo que Ω(s) = sΘ(s), pode-se obter a função de transferência que relaciona velocidade e tensão de armadura: Km Ω( s ) = E a ( s ) (τ m s + 1)
(2.52)
As constantes elétricas do motor podem ser obtidas medindo-se, com o auxílio de um dinamômetro, o seu torque de partida e sua velocidade a vazio. Com esse objetivo vamos obter uma relação que expresse o torque do motor em função da velocidade angular. A partir de (2.38) obtém-se iA =
T K
(2.53)
Substituindo-se (2.39) e (2.53) em (2.40) e considerando La = 0, obtém-se
ea = Ra
T dθ + Kb K dt
(2.54)
Como ω = dθ dt , a relação desejada é obtida isolando-se T na expressão acima:
Modelagem de Sistemas Elétricos e Eletromecânicos
103
Kb K Ra ω ea − K Ra
T=
(2.55)
Considerando a tensão de armadura constante, a função expressa por (2.55) é a equação de uma reta cujo gráfico é apresentado na Fig. 2.11. Fazendo-se ω = 0 em (2.55) encontra-se o torque de partida do motor TP, expresso por:
TP =
Ra ea K
(2.56)
Quando o torque imposto pelo dinamômetro for nulo, a expressão (2.55) fornece a velocidade a vazio do motor ωo, expressa por:
ωo =
ea Kb
(2.57)
TP1 ea1
TP2 ea2
ωo 1
ωo2
ω
Fig. 2.10 – Curvas torque-velocidade tendo como parâmetro a tensão armadura ea. As constantes elétricas são, portanto, obtidas a partir de um ensaio de torque do motor com o auxílio das expressões (2.56) e (2.57):
R a TP = K ea
(2.58)
ea
(2.59)
e
Kb =
ωo
Se as constantes mecânicas do motor não forem conhecidas, elas podem ser determinadas, como veremos, a partir da análise do seu transitório de partida. A resposta transitória de sistemas de controle será discutida no próximo capítulo.
Recomendação de leitura: Para que o leitor conheça a modelagem matemático de outros sistemas, recomendamos a leitura de Ogata (1990, p. 79-113) e Dorf (1993, p. 47-61).
Sistemas de Controle
104
Exercícios. 1. Para os circuitos ativos das figuras abaixo, determine a Função de Transferência E0(s)/Ei(s) e desenhe o diagrama de blocos. R2
R4
R1 ei
+
eo
R3
C1
+
(a) – Compensador PD C2
R2
R4
R1 ei
+
R3
C1
eo
+
(b) – Compensador PI C2 R4 R2
R1 ei
+
C1
R3
+
eo
(c) – Compensador em avanço ou atraso de fase 2. Como se deve proceder para obter a função de transferência (FT) de um sistema físico? 3. Em um sistema realimentado, o que chamamos de F.T. de malha aberta?
Respostas selecionadas 1. (a)
R4 R2 R R R C s +1 R R R C s +1 , (c) 4 2 1 1 (R 1C1s + 1) , (b) 4 2 2 2 R 3 R1 R 3 R1 R 2C 2s R 3 R1 R 2C 2s + 1
Sistemas de Controle
105
3. ANÁLISE DE RESPOSTA TRANSITÓRIA E ANÁLISE DE ERROS EM REGIME PERMANENTE
3.1 Introdução Uma vez que o Capítulo II nos habilitou a derivar um modelo matemático para os sistemas elétricos e eletromecânicos, passaremos, agora, para a análise de desempenho dos sistemas. O método explorado neste capítulo é a análise da resposta no tempo do sistema a sinais de teste de entrada típicos como as funções degrau, rampa, aceleração, impulso e senoidais, os quais apresentamos na Tabela 3.1. TABELA 3.1 SINAIS DE TESTE TÍPICOS
Sinal Impulso unitário ou delta de Dirac5 Degrau unitário
Rampa unitária
Parábola unitária
5
Definição 0 ;t≠0 δ(t) ≡ Indefinido; t = 0 1 ;t≥0 u(t) ≡ 0 ;t<0 t ;t≥0 f(t) ≡ 0 ;t<0 t2/2 ; t ≥ 0 f(t) ≡ 0 ;t<0
Transformada de Laplace 1
1/s 1/s2 1/s3
Este sinal é empregado para imaginar um cenário no qual uma “unidade” de uma quantidade pode ser entregue instantaneamente. O nome deste sinal é uma homenagem ao físico quântico Paul Dirac que usou esta função para representar elétrons como sendo unidades de carga ocupando uma quantidade de espaço infinitesimalmente pequena. A função impulso pode ser aproximada por uma função onde f(t) = 1/ε para -ε/2 ≤ t ≤ ε/2 e f(t) = 0 para t < -ε/2 e t > ε/2. Observe que nesse caso, o limite de f(t) quando ε → 0 é ∞.
Análise de Resposta Transitória e Análise de Erros em Regime Permanente
106
A resposta no tempo fornece algumas figuras de mérito importantes para a análise e projeto. Uma destas figuras é o tempo de resposta ou acomodação a x%, definido como o tempo para a resposta do sistema entrar e permanecer em uma faixa de x% em torno do valor final da resposta.
3.2 Sistema de 1a ordem Considere o sistema de 1a ordem representado na Fig. 3.1. Sua função de transferência é dada por: C (s) 1 = R ( s ) Ts + 1
R(s)
+
(3.1)
C(s)
1 Ts
R(s)
1 Ts+ 1
C(s)
(b)
(a)
Fig. 3.1 – (a) Diagrama de bloco de um sistema de 1a ordem e (b) e diagrama simplificado.
3.2.1 Resposta a degrau unitário de sistemas de 1a ordem Como a transformada de Laplace da função degrau unitário é 1/s, substituindo-se R(s) por 1/s na equação 3.1, obtém-se: C ( s) =
1 1 ⋅ Ts + 1 s
(3.2)
Expandindo a equação (3.2) em frações parciais, resulta: C ( s) =
T 1 − s Ts + 1
(3.3)
Tomando a transformada inversa de Laplace da equação (3.3), obtém-se: c (t ) = 1 − e − t / T
(t ≥ 0)
(3.4)
Fazendo t = T na expressão (3.4), obtém-se c(T) = 0,632, ou seja, a constante de tempo T é o tempo que a resposta leva para atingir 63,2% da variação total.
Sistemas de Controle
107
A resposta é uma exponencial que tende assintoticamente para 1, ou seja, o regime permanente só é alcançado matematicamente após um tempo infinito. Os tempos de resposta a 5%, 2% e 1% podem ser calculados, fazendo-se na expressão (3.4) c(t) igual a, respectivamente, 0,95; 0,98 e 0,99. Assim: tS5% = 3T tS2% = 3,9T tS1% = 4,6T Na prática, entretanto, uma estimativa razoável do tempo de resposta é o tS2% = 4T. A saída a uma entrada a degrau unitário é apresentada na Fig. 3.2. c(t)
0.632
95% 98,2%
0
T
2T
3T
4T
t
Fig. 3.2 – Resposta a degrau unitário do sistema mostrado na Fig. 3.1.
)Usando o MATLAB para traçar a resposta a degrau de um sistema de controle .
A resposta a degrau de um sistema pode ser traçada no MATLAB utilizando-se a função step. Desta forma, step (num,den) traça a resposta a degrau da função de transferência G(s) = num(s)/den(s) onde num e den contém coeficientes polinomiais em potências decrescentes de s. Por sua vez, o comando Step (num,den,t) usa um vetor de tempo definido pelo usuário (que pode ser omitido), o qual deve ser regularmente espaçado. Para traçar a resposta a degrau da função de transferência G ( s ) = os seguintes comandos: >> >> >> >>
t=0:0.1:12; num=1;den=[1 1 1]; step(num,den,t) grid
1 , digite no Matlab s2 + s +1
Análise de Resposta Transitória e Análise de Erros em Regime Permanente
108
Na seqüência de comandos acima, a primeira linha define que o tempo inicial de simulaçãoé 0s o final é 12 s, sendo que é armazenado para plotagem um ponto a cada 0,1s. O comando grid permite a visualização do grid na Fig. 3.3, traçada após a execução do comando step(num,den,t).
)Função do MATLAB que aprendemos a utilizar: 9 Step
S te p Re sp o n se 1 .4
1 .2
A m p l i tu d e
1
0 .8
0 .6
0 .4
0 .2
0 0
2
4
6
8
10
12
t (s)
Fig. 3.3 – Resposta a degrau unitário de um sistema de controle, que foi traçada utilizando-se a função step do MATLAB.
)Utilizando o Simulink Uma alternativa para obter a resposta a degrau de sistemas de controle é utilizar a ferramenta Simulink do MATLAB que utiliza efetivamente uma interface gráfica. Para iniciar uma sessão do Simulink, digite simulink na janela de comando do MATLAB. Após pressionar-se enter, aparecerá uma janela intitulada Simulink Library Browser. Nessa janela selecione File Æ New Æ Model. Esta ação criará uma nova janela de
Sistemas de Controle
109
nome Untitled, que pode ser renomeada através da ação File Æ Save as. Na janela Simulink Library Browser, o bloco Simulink aparece organizado em sub-blocos. Estes sub-blocos são: 9 Continuous; 9 Discrete; 9 Functions & Tables; 9 Math; 9 Nonlinear; 9 Signals e Systems 9 Sinks; 9 Sources;
O modelo criado aqui usará um bloco Step (a partir de Sources), um bloco Transfer Fcn (a partir de Continuous) e um bloco Scope (a partir de Sinks). Para criar o modelo basta arrastar os blocos citados acima para a janela modelo e conectá-los mantendo-se pressionado o botão esquerdo do mouse. O modelo assim criado é mostrado na Fig. 3.4. 1 s+1 S te p
T ra n sfe r Fcn
S co p e
Fig. 3.4 – Modelo de um sistema simples criado no Simulink. Após criar o modelo ilustrado na Fig. 3.4, devemos configurar os blocos Step e Transfer Fcn, para que o modelo simule a resposta a degrau unitário de G ( s ) =
1 . s + s +1 2
Primeiro, posicione o cursor do mouse sobre Step e pressione duas vezes o botão esquerdo do mouse. Na janela que surgiu, altere apenas o parâmetro Step Time para 0. Repita a ação anterior no bloco Transfer Fcn; na janela que surgiu, altere o parâmetro Denominator para [1 1 1] e tecle OK. Para proceder ajustar os parâmetros da simulação, selecione Simulation Æ Simulation parameters. Na caixa que surgiu modifique o parâmetro Stop time para 12 e pressione OK. Após fechar esta janela, selecione Simulation Æ Start para iniciar a simulação.Quando aparecer a mensagem Ready no canto inferior esquerdo da janela do modelo, significa que a simulação acabou. Para ver a resposta ao degrau unitário do sistema G(s), posicione o cursor do mouse sobre Scope e pressione duas vezes o botão esquerdo do
Análise de Resposta Transitória e Análise de Erros em Regime Permanente
110
mouse. Aparecerá uma janela chamada Scope com a resposta do sistema. Para melhor visualização, pressione na janela o botão Autoscale, cujo ícone é um binóculo; a forma de onda que aparecerá será idêntica a da Fig. 3.3. Para conhecer melhor o Simulink, recomendase a leitura de UERJ (1999).
3.2.2 Resposta à rampa unitária de sistemas de 1a ordem Como a transformada de Laplace da função rampa unitária é 1/s2, substituindo-se R(s) por 1/s2 na equação (3.1), obtém-se: C (s) =
1 1 ⋅ 2 Ts + 1 s
(3.5)
Expandindo a equação (3.5) em frações parciais, resulta: C ( s) =
1
s2
−
T T2 + s Ts + 1
(3.6)
Tomando a transformada inversa de Laplace da equação (3.6), obtém-se: c(t ) = t − T + Te −t / T
(t ≥ 0)
(3.7)
O sinal de erro e(t) é então: e(t ) = r (t ) − c(t ) = T (1 − e − t / T )
Na expressão acima quando t tende a infinito, e-t/T tende a zero, e, portanto, o sinal de erro e(t) tende a T ou: e (∞ ) = T
A expressão acima nos mostra que quanto menor a constante de tempo T menor o erro. A entrada rampa unitária e a respectiva saída são apresentadas na Fig. 3.5. r(t) = t
6T
erro estacionário
4T
T
c(t)
T 2T
0
4T
2T
6T
t
Fig. 3.5 – Resposta à rampa unitária do sistema mostrado na Fig. 3.1.
Sistemas de Controle
111
3.2.3 Resposta a impulso unitário de sistemas de 1a ordem Como a transformada de Laplace da função impulso unitário é 1, substituindo-se R(s) por 1 na equação (3.1), obtém-se: C (s) =
1 Ts + 1
(3.8)
Observe que a resposta a impulso unitário é igual à função de transferência do sistema. Tomando a transformada inversa de Laplace da equação (3.8), obtém-se: c(t ) =
e −t / T T
(t ≥ 0)
(3.9)
A resposta a uma entrada a impulso unitário é apresentada na Fig. 3.6. c(t) 1/T
0
2T
4T
t
Fig. 3.6 – Resposta à impulso unitário do sistema mostrado na Fig. 3.1. Exercício: Obtenha no Simulink a resposta a um impulso unitário, um degrau unitário e uma rampa unitária do circuito RC série apresentado na Fig. 1.26, para valores abaixo. Verifique os tempos de resposta para a entrada a degrau, o erro de regime permanente para a entrada à rampa e o valor máximo da resposta impulsiva em cada caso. a.
R = 10 Ω e C = 1 μF;
b.
R = 1000 Ω e C = 100 μF.
3.3 Sistema de 2a ordem Investigaremos, agora, as respostas dinâmicas dos sistemas de 2a ordem para entradas em degrau, rampa e impulso.
Análise de Resposta Transitória e Análise de Erros em Regime Permanente
112
3.3.1 Resposta a degrau unitário de sistemas de 2a ordem A função de transferência de sistemas de 2a ordem é muito importante no projeto de controle. As especificações do sistema são freqüentemente dadas assumindo que ele é um sistema de 2a ordem. Para sistemas de mais alta ordem, nós podemos freqüentemente usar as técnicas de pólos dominantes para aproximar o sistema por uma função de transferência de 2a ordem. Assumimos que:
ω n2 C (s) = 2 R( s ) s + 2ζω n s + ω n2
(3.10)
onde ζ é o fator de amortecimento e ωn é a freqüência natural do sistema. Os pólos são:
s1, 2 = −ζω n ± jω n 1 − ζ 2 Note que os pólos podem ser ambos reais (ζ >1, sobreamortecido), reais e iguais (ζ =1, criticamente amortecido) ou complexos conjugados (0 < ζ < 1, subamortecido). Determinaremos a resposta do sistema representado por (3.10) para esses 3 casos. (a) Caso subamortecido (0 < ζ < 1): Neste caso, (3.10) pode ser escrita por:
ω n2 C ( s) = R( s) ( s + ζω n + jω ) ⋅ ( s + ζω n − jω ) onde ω = ω n 1 − ζ 2 . A freqüência ω é chamada freqüência natural amortecida. Para uma entrada em degrau (3.10) pode ser escrita como:
ω n2 C (s) = s ( s 2 + 2ζω n s + ω n2 )
(3.11)
A transformada inversa de Laplace da equação (3.11) foi obtida no capítulo I. Lembrando: c(t ) = 1 −
(
)
⎛ ⎛ 1− ζ 2 sen⎜ ω n 1 − ζ 2 ⋅ t + arctg ⎜ ⎜ ⎜ ζ 1− ζ 2 ⎝ ⎝
e −ζω nt
⎞⎞ ⎟⎟ ; t ≥ 0 ⎟⎟ ⎠⎠
O sinal de erro para esse sistema é a diferença entre a entrada e a saída, ou:
(
)
⎛ ⎛ 1−ζ 2 sen⎜ ω n 1 − ζ 2 ⋅ t + arctg ⎜ ⎜ ⎜ ζ 1−ζ 2 ⎝ ⎝
e −ζωnt
⎞⎞ ⎟⎟ ⎟⎟ ⎠⎠
(3.12)
Sistemas de Controle
113
O sinal de erro acima apresenta uma oscilação senoidal amortecida. Em regime permanente (t → ∞) o erro é nulo. Se o coeficiente de amortecimento ζ é igual a zero, a resposta se torna não amortecida e o sistema oscila indefinidamente. Substituindo ζ = 0 em (3.12), obtém-se a resposta para o caso não amortecido, ou
c(t ) = 1 − sen(ωnt + 900 ) = 1 − cos ωnt
(t ≥ 0)
(3.13)
Da equação (3.13) vemos que ωn representa a freqüência natural não-amortecida do sistema, ou seja, é a freqüência que o sistema oscilaria se o amortecimento fosse zero. (b) Caso de amortecimento crítico (ζ = 1): Neste caso, para uma entrada em degrau unitário (3.11) pode ser escrita como:
ω n2 C ( s) = R( s ) s ( s + ω n ) 2
(3.14)
A transformada inversa de Laplace da equação (3.14) pode ser determinada por:
c(t ) = 1 − e −ω nt (1 + ω n t ) ;
t≥0
(3.15)
(c) Caso sobreamortecido (ζ > 1): Neste caso, para uma entrada em degrau unitário (3.11) pode ser escrita como:
C ( s) =
ω n2 s( s + ζω n + ω n ζ 2 − 1) ⋅ ( s + ζω n − ω n ζ 2 − 1)
(3.16)
A transformada inversa de Laplace da equação (3.16) será: ⎛ e − s1t e − s2t ⎜ c(t ) = 1 + − ⎜ 2 s2 2 ζ − 1 ⎝ s1
ωn
(
)
(
)
⎞ ⎟ ⎟ ⎠
(t ≥ 0)
(3.17)
onde s1 = ζ + ζ 2 − 1 ⋅ ω n e s 2 = ζ − ζ 2 − 1 ⋅ ω n . Observe na equação (3.17) que quando ζ é razoavelmente maior que 1, a exponencial e − s1t decai mais rapidamente que a outra, pois representa uma constante de tempo menor e, desta forma que o termo e − s1t s1 pode ser desprezado. Nesse caso, o sistema apresentará uma resposta similar a um sistema de 1a ordem e a função de transferência e a sua resposta a degrau podem ser aproximadas por:
ζω n − ω n ζ 2 − 1 s C ( s) 1 = = 2 = s + 1 s + s 2 s + ζω − ω ζ 2 − 1 R( s) n n s2
Análise de Resposta Transitória e Análise de Erros em Regime Permanente
C ( s) =
ζω n − ω n ζ 2 − 1
(s + ζω
n
114
)
(3.18)
− ωn ζ 2 −1 ⋅ s
A transformada inversa de Laplace da equação (3.16) será: ς 2 −1)ω nt
c(t ) = 1 − e −(ς −
(t ≥ 0)
(3.19)
A equação (3.19) fornece uma resposta aproximada a entrada à degrau unitário quando um dos pólos da função de transferência pode ser desprezado. A título de exemplo, seja um sistema de 2a ordem com ζ = 1,5 e ωn = 1. Na Fig. 3.7 mostramos as curvas de resposta ao degrau unitário deste sistema considerando a solução exata (3.17) e a solução aproximada (3.19). Verifique que, mesmo escolhendo um ς ligeiramente maior que 1, a solução aproximada e exata não diferem muito. A Fig. 3.8 apresenta uma família de curvas c(t) obtidas a partir de (3.12), (3.15) e (3.17) para vários valores de ζ, onde a abscissa é a variável adimensional ωnt. Nesta figura vemos que um sistema subamortecido com ζ entre 0,5 e 0,8 chega perto do valor final mais rapidamente que sistemas com amortecimento crítico ou sobreamortecido. Exceto em algumas aplicações onde não se pode tolerar oscilações, é desejável que o sistema de 2a ordem seja subamortecido com ζ entre 0,4 e 0,8. Valores pequenos de ζ produzem uma resposta transitória com pico excessivo; valores muito grandes de ζ fazem o sistema excessivamente lento. 1
0.8
0.6
Solução exata
0.4
Solução aproximada
0.2
0
5
10
15
t
Fig. 3.7 - Curvas aproximada e exata de resposta ao degrau unitário de um sistema de 2a ordem.
Sistemas de Controle
115
2 ζ=0 1,8
ζ =0,1
1,6
ζ =0,2
1,4
c(t)
ζ =0,3
ζ =0,6 ζ=0,7
ζ =0,4
1,2
ζ =0,5
1 0,8 0,6
ζ =1
0,4 ζ=2 0,2 0
0
ζ =0,8
2
4
6
8
10
12
ωnt
Fig. 3.8 – Curva de resposta ao degrau unitário do sistema de 2a ordem representado pela equação (3.10) Para dar uma indicação sobre a resposta de um sistema de 2a ordem subamortecido, algumas figuras de mérito (Fig. 3.9) são definidas: •
Tempo de resposta ou acomodação (tS): é o tempo para a resposta do sistema entrar e permanecer em uma faixa de x% em torno do valor final da resposta. Na literatura de controle, encontramos os seguintes tempos de resposta: tS5% = 3τ =
3 ζ ⋅ωn
(3.20)
tS2% = 3,9τ=
3,9 ζ ⋅ωn
(3.21)
tS1% = 4,6τ =
4,6 ζ ⋅ωn
(3.22)
Observe que o tempo de acomodação é definido em função da constante de tempo τ = 1
ζ ⋅ωn
.
Análise de Resposta Transitória e Análise de Erros em Regime Permanente
116
MP 1,05 1 0,95 0,9
0,1
tr
tP tS5%
Fig.3.9 – Figuras de mérito para sistemas de 2a ordem. •
Tempo de subida (tr): é o tempo que a resposta leva para variar de 10% a 90% do calor final. Embora seja difícil obter uma expressão analítica exata para tr, Dorf (2001) oferece a seguinte aproximação : tr ≈
2,16ζ + 0,6
ωn
(3.23)
que é exata para 0,3 ≤ ζ ≤ 0,8.
•
Instante de pico (tP): é o tempo necessário para a resposta atingir o primeiro pico do sobre-sinal. Ele é obtido diferenciando a expressão (3.12) com respeito ao tempo e igualando o resultado obtido a zero, resultando: tP =
•
π ωn 1−ζ
2
(3.24)
Sobre-sinal máximo (MP): é a diferença entre o valor do primeiro pico da resposta e o valor final da resposta. Ele ocorre no instante de pico. De acordo definição temos: MP = c(tP) – 1
Sistemas de Controle
117
Fazendo t = tP em (3.12), substituindo na expressão acima e ajustando, obtém-se: −
MP = e
π ⋅ζ 1−ζ 2
(3.25)
A Fig. 3.10 apresenta o máximo sobre-sinal em função de ζ. Note que quando o amortecimento está entre 0,4 e 0,8 , o sobre-sinal máximo percentual está entre 25% e 2,5%. 100 90 80 70 60
MP (%)
50 40 30 20 10 0
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
ζ
Fig. 3.10 – Sobre-sinal máximo percentual em função do amortecimento.
Exemplo 3.1: Considere o sistema de 2a ordem abaixo, onde a = 6 e K = 25.
R(s)
+
1 s
K s+ a
C(s)
-
Fig. 3.11 – Diagrama de blocos de um sistema de segunda ordem. (a) Obtenha o tempo de subida tr, o instante de pico tP, o sobre-sinal máximo MP e o tempo de acomodação tS2% quando o sistema é sujeito a uma entrada à degrau unitário; (b) Qual o valor de K para que o tempo de acomodação tS2% seja igual a 1s
Análise de Resposta Transitória e Análise de Erros em Regime Permanente
(a)
118
A função de transferência do sistema será: K C ( s) K s 2 + as = = 2 K R( s) 1 + s + as + K s 2 + as
Comparando o resultado acima com (3.10), obtém-se: K = ωn2 = 25 ⇒ ωn = 5 rad/s a = 2ζωn = 6 ⇒ ζ = 0,6 Assim: tr ≈
2,16ζ + 0,6
π
tP =
ωn =
= 0,38 s
π
= 0,79 s
ωn 1−ζ 2 4 3,9 3,9 = 1,33 s tS2% = = ζ ⋅ω n 3 −
MP = e (b)
tS2% =
π ⋅ζ 1−ζ 2
= 0,095 ou 9,5%
3,9 = 1 ⇒ ωn = 6,5 rad/s ζ ⋅ω n
Para ωn = 6,5 rad/s ⇒ K = 6,52 = 42,25
)Usando o MATLAB para traçar a resposta do sistema da Fig. 3.11 .
Para avaliar o resultado utilizando o MATLAB, devem ser utilizados os seguintes comandos: >> >> >> >>
num=25; den1=poly([0]); den2=[1 6]; den=conv(den1,den2); [numf,denf]=cloop(num,den); printsys(numf,denf)
num/den = 25 -------------s^2 + 6 s + 25 >> step(numf,denf) >> grid
Na seqüência de comandos acima, a segunda linha realiza a convolução (multiplicação no plano s) entre os denominadores s e (s+1). A terceira linha produz a função de transferência de malha fechada do sistema de controle da Fig. 3.11. Se a realimentação fosse positiva, a terceira linha teria que ser substituída por
Sistemas de Controle
119
>> [numf,denf]=cloop(num,den,1); A resposta do sistema a uma entrada em degrau unitário é mostrada na Fig.3.12, onde foram feitas as seguintes medidas: tr = 0,37 s tP =0,78 s tS2% = 1,2 s MP = 9,5% Step Res pons e
1.2
1
A mplitude
0.8
0.6
0.4
0.2
0 0
0.2
0.4
0.6
0.8
1
1.2
1.4
1.6
1.8
2
Time (s ec )
Fig. 3.12 – Resposta a degrau unitário do sistema da Fig. 3.11.
)Funções do MATLAB que aprendemos a utilizar: 9 conv; 9 cloop.
Exercício: Utilize o Simulink para obter a resposta ao degrau unitário do sistema da Fig. 3.11.
3.3.2 Resposta à impulso unitário de sistemas de 2a ordem Como a transformada de Laplace de uma função impulso unitário r(t) é R(s) = 1, a resposta C(s) do sistema de segunda ordem regido pela expressão (3.10) é:
C ( s) =
ω n2 s 2 + 2ζω n s + ω n2
Análise de Resposta Transitória e Análise de Erros em Regime Permanente
120
A transformada inversa de Laplace desta equação resulta na resposta temporal c(t) como segue: Para 0 ≤ ζ ≤ 1 ,
c(t ) =
ωn 1−ζ
2
e −ζω nt sen(ω n 1 − ζ 2 t )
(t ≥ 0)
(3.26)
(t ≥ 0)
(3.27)
Para ζ = 1 ,
c(t ) = ω n2 te −ω nt sen(ω n 1 − ζ 2 t ) Para ζ > 1 ,
c(t ) =
ωn 2 ζ 2 −1
e −(ζ −
ζ 2 −1 )ω nt
−
ωn 2 ζ 2 −1
e −(ζ +
ζ 2 −1 )ω nt
(t ≥ 0)
(3.28)
A Fig. 3.13 apresenta uma família de curvas c(t)/ ωn obtidas a partir de (3.26) e (3.27) para vários valores de ζ, onde a abscissa é a variável adimensional ωnt. Nesta figura vemos que apenas em um sistema subamortecido a resposta oscila em torno do zero assumindo valores ora negativos, ora positivos. Para sistemas criticamente amortecidos ou sobreamortecidos a resposta ao impulso unitário é sempre positiva ou nula. Igualando-se a zero a derivada de (3.26), pode-se mostrar que o sobre-sinal máximo para a resposta ao impulso unitário de um sistema subamortecido e o instante em que ele ocorre são dados pelas equações (3.29) e (3.30). arctg
t=
1−ζ 2
ζ
ωn 1−ζ 2 −
c(t)max = ω n e
ζ 1−ζ
2
⋅arctg
(0 < ζ < 1)
(3.29)
(0 < ζ < 1)
(3. 30)
1−ζ 2
ζ
Sistemas de Controle
121
1 ζ = 0,1
0.8
ζ = 0,3 ζ = 0,5
0.6
ζ = 0,7
0.4
c (t) / ω
n
ζ= 1
0.2 0 -0.2 -0.4 -0.6 -0.8 0
2
4
6
8
10
12
ω t n
Fig. 3.13 – Curva de resposta ao impulso unitário do sistema de 2a ordem representado pela equação (3.10).
3.3.3 Resposta a rampa unitária de sistemas de 2a ordem A resposta transitória de um sistema de 2a ordem sujeito a uma entrada em rampa pode ser obtida de maneira análoga a que utilizamos quando obtemos as respostas à degrau. Por exemplo, para o caso subamortecido a resposta a rampa unitária do sistema representado pela equação (3.10) será: ⎛ 1− ζ 2 2 ⎜ + c(t ) = t − sen ω n 1 − ζ t − 2 ⋅ arctg ⎜ −ζ ωn 1− ζ 2 ⎝ 2ζ
e −ζωnt
⎞ ⎟ ; ⎟ ⎠
t≥0
(3.31)
O sinal de erro para esse sistema é a diferença entre a entrada e a saída, ou: ⎛ 1−ζ 2 2 ⎜ + sen ω n 1 − ζ t − 2 ⋅ arctg e(t) = ⎜ ωn −ζ 1− ζ 2 ⎝ 2ζ
e −ζωnt
⎞ ⎟ ⎟ ⎠
(3.32)
Em regime permanente (t = ∞) o erro será: e(∞) =
2ζ
ωn
(3.33)
Análise de Resposta Transitória e Análise de Erros em Regime Permanente
122
Para que a resposta transitória seja aceitável quando da aplicação de um degrau e o erro de regime fique em um patamar admissível quando da aplicação de uma rampa, ζ não pode ser muito pequeno e ωn deve ser suficientemente grande. Um ζ pequeno aumenta o sobre-sinal para uma entrada à degrau unitário (Fig. 3.10), um ζ grande eleva o erro de regime permanente para uma entrada à rampa. Exemplo 3.2: O sistema de 2a ordem da Fig. 3.14 quando submetido a um degrau, apresenta em t = 3 s um sobre-sinal de aproximadamente 25%. a.
Determine os valores de K e T;
b.
Determine o sobre-sinal máximo e o tempo em que ele ocorre quando a entrada for um impulso unitário; Calcule o erro de regime permanente quando for aplicada uma rampa
c.
unitária ao sistema R(s)
1 s
+
C(s)
K Ts+ 1
-
Fig. 3.14 – Diagrama de blocos de um sistema de segunda ordem.
Solução: (a)
Para um sobre-sinal de 25% a Fig. 3.10 nos fornece ς = 0,4. Sabemos que: tP =
π ωn 1−ζ 2
=
π ω n 1 − 0,4 2
= 3 s ⇒ ωn =
π 3 1 − 0,4 2
= 1,14 rad/s.
A função de transferência do sistema será: K K 2 C ( s) K Ts s + T = 2 = 2 = R( s) 1 + K 2 Ts + s + K s + s + K T T Ts + s
Comparando o resultado acima com (3.10), obtém-se:
T=
1 2ζω n
=
1 = 1,1 s 2 ⋅ 0,4 ⋅ 1,14
K = T.ωn2 = 1,1 . 1,142 = 1,43
Sistemas de Controle
(b)
123
O tempo em que ocorre o sobre-sinal será arctg
t=
1−ζ 2
ζ
ωn 1−ζ 2
1 − 0,4 2 0,4
arctg
=
1,14 1 − 0,4 2
=
1,16 = 1,1 s 1,059
Por sua vez, o sobre-sinal máximo será: −
c(t)max = ω n ⋅ e
ζ 1−ζ
2
⋅arctg
1−ζ 2
ζ
−
= 1,14 ⋅ e
0, 4 1−0, 4 2
⋅arctg
1−0, 4 2 0, 4
= 1,14 ⋅ e −0, 44 x1,15 = 0,69
(c) O erro de regime à rampa é dado pela expressão (3.33) e vale: e(∞) =
2ζ
ωn
= 0,7
3.3.4 Efeito de um terceiro pólo e um zero na resposta de sistemas de 2a ordem As curvas apresentadas na Fig. 3.8 são exatas para sistemas de segunda ordem representados pela equação (3.10). Entretanto, elas fornecem uma boa fonte de dados porque muitos sistemas possuem um par dominante de raízes e a resposta ao degrau pode ser estimadas utilizando-se a equação (3.11). Esta abordagem, embora aproximada, evita uma nova análise matemática para a determinação do sobre-sinal e outras figuras de mérito. Para um sistema de terceira-ordem representado pela função de transferências
C (s) 1 = 2 R( s) ( s + 2ζω n s + 1)(Ts + 1)
(3.34)
e com um par de pólos complexos dominantes, foi averiguado experimentalmente (CLEMENTE apud DORF, 2001, p. 233-234) que o sobre-sinal percentual MP e o tempo de acomodação tS eram representados pelas curvas do sistema de segunda-ordem quando
1 ≥ 10 ζω n T
(3.35)
Dorf (2001, p.234) apresenta uma tabela mostrando o efeito do terceiro pólo na resposta a degrau do sistema representado por (3.34) e ζ = 0,45, tabela que reproduzimos na Tabela 3.2. Para um sistema de segunda ordem com ζ = 0,45 e ωn = 1 o sobre-sinal estimado é 20% e o tempo de acomodação tS2% = 8,7 s. Observe que o efeito em um sistema de segunda ordem da adição de um terceiro pólo que não satisfaça a condição (3.35) é a redução do sobresinal.
Análise de Resposta Transitória e Análise de Erros em Regime Permanente
124
TABELA 3.2 EFEITO DO TERCEIRO PÓLO PARA ζ = 0,45
T
1/T
MP %
tS2%
2,25
0,44
0
9,63
1,5
0,67
3,9
6,3
0,9
1,11
12,3
8,81
0,4
2,5
18,6
8,67
0,05
20
20,5
8,37
0
∞
20,5
8,24
Você deve perceber, também, que as figuras de mérito de sistemas de segunda ordem calculadas pelas expressões estabelecidas nas seções anteriores são corretas para uma função de transferência sem zeros finitos. Se a função de transferência de um sistema de segunda ordem possui um zero finito e ele é localizado relativamente perto dos pólos complexos dominantes, então o zero afetará a resposta do sistema. A Fig. 3.15 apresenta a resposta transitória do sistema representado pela função de transferência
(
)
ω 2 a (s + a ) C ( s) = 2 n R( s ) s + 2ζω n s + ω n2 para valores escolhidos de a/ζωn com ζ = 0,5. Para um sistema de segunda ordem com ζ = 0,5 e ωn = 1 o sobre-sinal estimado é 16,3%, o tempo de acomodação tS2% = 7,8 s e o instante de pico tP = 3,63 s. Observe que quanto menor a razão a/ζωn , maior será sobre-sinal e menor o instante de pico da resposta a degrau unitário do sistema.
3.4 Análise de erro em regime permanente ou estacionário Seja o sistema de controle apresentado na Fig. 3.16. O sinal de erro desse sistema é dado por:
E ( s) =
C ( s) G ( s)
(3.36)
C ( s) =
G ( s) R( s) 1 + G ( s) H ( s)
(3.37)
Entretanto,
Substituindo-se (3.37) em (3.36), resulta:
Sistemas de Controle
125
E ( s) =
1 R( s) 1 + G ( s) H ( s)
(3.38)
3 (a/ζϖn) = 0,5 2.5 (a/ζϖn) = 1
2
(a/ζϖn) = 2
c(t) 1.5
1
0.5
0 0
(a/ζϖn) = 5
2
4
6
8
10
12
ϖ nτ
Fig. 3.15 - Resposta a degrau unitário de um sistema de segunda ordem com um zero para quatro valores da razão a/ζωn. TABELA 3.2 EFEITO DO ZERO PARA ζ = 0,5 a/ζωn
MP %
tS2%
tP
0,5
170
10,15
1,5
1
70
7,38
1,8
2
30
7,5
2,4
5
18
7,73
3,15
E(s)
R(s)
+
C(s) G(s)
-
B(s) H(s)
Fig. 3.16 – Diagrama de blocos de um sistema em malha fechada.
Análise de Resposta Transitória e Análise de Erros em Regime Permanente
126
Aplicando o teorema do valor final a equação (3.38), obtém o erro estacionário atuante do sistema:
sR( s ) s →0 1 + G ( s ) H ( s )
e ss = lim e(t ) = lim s ⋅ E ( s ) = lim t →∞
s →0
(3.39)
O erro estacionário apresentado pelo sistema em resposta a uma determinada entrada poderá ser nulo ou não, dependendo de sua classificação em função de sua habilidade para seguir um determinado tipo de entrada, classificação que apresentamos a seguir. Seja a função de transferência de malha aberta G(s)H(s): K (Ta s + 1)(Tb s + 1) K (Tm s + 1)
G ( s) H ( s) =
(3.40)
s N (T1 s + 1)(T2 s + 1) K (T p s + 1)
Na expressão acima aparece no denominador o termo sN, que representa um pólo de multiplicidade N na origem. A classificação é estabelecida em função desse termo da seguinte forma: se N = 0, o sistema será do tipo 0, se N = 1, do tipo 1, se N = 2, do tipo 2, etc. A seguir definiremos os coeficientes de erro estático, os quais se constituem em figuras de mérito dos sistemas de controle.
3.4.1 Coeficiente de erro de posição estático KP Se a entrada for um degrau unitário, a expressão (3.39) resulta em: 1 1 s = s →0 1 + G ( s ) H ( s ) s 1 + G (0) H (0)
e ss = lim
(3.41)
Definindo KP como K P = lim G ( s ) H ( s ) = G (0) H (0)
(3.42)
s →0
obteremos uma nova expressão para o erro atuante estacionário, esta em função do coeficiente de erro de posição estático KP.
e ss =
1 1+ KP
(3.43)
Para um sistema do tipo 1 ou maior, teremos: K P = lim G ( s ) H ( s ) = lim s →0
s →0
K (Ta s + 1)(Tb s + 1) K (Tm s + 1) s (T1 s + 1)(T2 s + 1) K (T p s + 1) N
=
K =∞ 0
Sistemas de Controle
127
Já para um sistema do tipo 0, teremos:
K (Ta s + 1)(Tb s + 1) K (Tm s + 1) =K s →0 (T s + 1)(T s + 1) K (T s + 1) 1 2 p
K P = lim G ( s ) H ( s ) = lim s →0
Portanto, para um sistema do tipo 0 o coeficiente de posição estático KP é finito; para um sistema do tipo 1 KP é infinito. Resumindo, o erro estacionário atuante para uma entrada em degrau unitário será:
e ss = e ss =
1 1+ K
1 =0 1+ ∞
para sistemas do tipo 0
para sistemas do tipo 1 ou maior
Conclui-se, a partir do que foi apresentado aqui, que a resposta ao degrau unitário de um sistema de controle realimentado apresentará um erro em regime permanente caso sua função de transferência de malha aberta não conter integrações (1/sN). Se o sistema possuir realimentação unitária, o erro na resposta em regime permanente será igual ao erro atuante estacionário. Esse erro pode ser tolerável caso K seja suficientemente grande. Entretanto, como veremos mais tarde com um ganho K grande é difícil obter um sistema estável. Para ilustrar, analisaremos a resposta transitória do conversor buck cujo diagrama de blocos foi apresentado na Fig. 2.8. Observe que a função de transferência em malha aberta não possui nem um integrador. O coeficiente de posição estático será: K P = lim G( s ) ⋅ H ( s ) = lim GC ( s ) ⋅ s →0
s →0
Ei R2 GF ( s) ⋅ VS R1 + R2
Considerando GC(s) igual a um ganho KC e GF(s) dado pela expressão (2.36), a expressão acima torna-se: K P = lim K C ⋅ s →0
Ei 1 + sC 0 RSE R2 ⋅ 2 ⋅ VS s L0 C 0 + (( L0 + RL C 0 RSE ) / RL ) + 1 R1 + R2
Resolvendo o limite: K P = KC ⋅
Ei R2 ⋅ VS R1 + R2
Consideremos, agora, um conversor com as seguintes especificações: 9
Entrada Ei = 24 V;
9
Saída E0 = 5 V / I0 = 5 A (RL = 1 Ω);
Análise de Resposta Transitória e Análise de Erros em Regime Permanente
9
Filtro com L0 = 200 μH, C0 = 1000 μF e RSE = 100 mΩ;
9
R1 = R2 = 10kΩ;
9
KC = 10;
9
Amplitude do dente de serra VS = 2,5 V.
128
O coeficiente KP para este conversor será:
K P = 10 ⋅
24 ⋅ 0,5 = 48 2,5
Como o ganho de realimentação é 1/2, para se obter uma tensão de saída de 5V, a tensão de referência será 2,5 V, o que equivale à aplicação de um degrau de tensão de 2,5 V na partida do sistema. Nesse caso, o valor acima de KP resultará em um erro atuante estacionário de:
e ss =
2,5 = 0,051 1+ KP
Como: e(t) = r(t) – 0,5c(t) Obtém-se: c(t) = 2[ r(t) – e(t) ] Quando t → ∞, teremos: c(∞) = 2 ( 2,5 – 0,051) = 4,9 V que representa um desvio de 2% em relação ao valor esperado. Para checar estes resultados, o conversor abaixador com as especificações apresentadas acima é simulado utilizando-se a ferramenta Simulink 2.0. O modelo criado é apresentado na Fig. 3.17 e o sinal de erro atuante e a tensão na saída resultantes são apresentados na Fig. 3.18.
3.4.2 Coeficiente de erro de velocidade estático KV Se a entrada for uma rampa unitária, a expressão (3.39) resulta em: 1 1 s lim = s →0 1 + G ( s ) H ( s ) s 2 s →0 sG ( s ) H ( s )
e ss = lim
(3.44)
Sistemas de Controle
129
10 R(s)
1 e -4 s+1
9 .6
Gc
c
2 e -7 s2 +3 e -4 s+1
Ei / Vs
te n sã o d e sa íd a
G (s)
e H(s) e rro a tu a n te 1 /2
Fig. 3.17 – Modelo de simulação do conversor buck para o Simulink.
5.6
0.3
5.4
0.2
5.2
0.1
5 0 4.8 -0.1
4.6
-0.2
4.4
-0.3
4.2 4
0.95
1
1.0
1.1
1.15
1.2 t x 10 -2
-0.4
0.95
(a)
1
1.05
1.1
1.15
1.2 t x 10 -2
(b)
Fig.3.18 – (a) resposta transitória da tensão de saída na partida do conversor buck especificado nessa seção e (b) sinal de erro atuante. Definindo KV como: K V = lim sG ( s ) H ( s ) s →0
(3.45)
obteremos uma nova expressão para o erro atuante estacionário, esta em função do coeficiente de erro de velocidade estático KV.
e ss =
1 KV
(3.46)
O termo erro de velocidade é usado para expressar o erro estacionário devido a uma rampa. Sua dimensão é a mesma que a do erro do sistema, isto é, o erro de velocidade não é um erro na velocidade, mas um erro na posição devido a uma entrada em rampa.
Análise de Resposta Transitória e Análise de Erros em Regime Permanente
130
Para um sistema do tipo 2 ou maior, teremos: K V = lim sG ( s ) H ( s ) = lim s →0
s →0
K V = lim s →0
sK (Ta s + 1)(Tb s + 1) K (Tm s + 1) s N (T1 s + 1)(T2 s + 1) K (T p s + 1)
K (Ta s + 1)(Tb s + 1) K (Tm s + 1) s
N −1
(T1 s + 1)(T2 s + 1) K (T p s + 1)
=
K =∞ 0
Já para um sistema do tipo 1 teremos: K V = lim sG ( s ) H ( s ) = lim s →0
s →0
sK (Ta s + 1)(Tb s + 1) K (Tm s + 1) s1 (T1 s + 1)(T2 s + 1) K (T p s + 1)
=K
E, para um sistema do tipo 0 teremos:
sK (Ta s + 1)(Tb s + 1) K (Tm s + 1) =0 s →0 (T s + 1)(T s + 1) K (T s + 1) 1 2 p
K V = lim sG ( s ) H ( s ) = lim s →0
Resumindo, o erro estacionário atuante para uma entrada em rampa unitária será:
e ss =
1 1 = =∞ KV 0
para sistemas do tipo 0
e ss =
1 1 = KV K
para sistemas do tipo 1
e ss =
1 1 = =0 KV ∞
para sistemas do tipo 2 ou maior
Perceba que um sistema de controle realimentado do tipo 0 é incapaz de seguir uma entrada a rampa unitária.
3.4.3 Coeficiente de erro de aceleração estático Ka Se a entrada for uma para uma parábola unitária, o erro atuante estacionário é dado por: 1 1 s = lim 2 3 s →0 1 + G ( s ) H ( s ) s s →0 s G ( s ) H ( s )
e ss = lim Definindo Ka como
(3.47)
Sistemas de Controle
131
K a = lim s 2 G ( s ) H ( s )
(3.48)
s →0
obteremos uma nova expressão para o erro atuante estacionário, esta em função do erro de aceleração estático Ka. e ss =
1 Ka
(3.49)
O erro de aceleração é o erro estacionário devido a uma parábola, ou seja ele um erro na posição. Para um sistema do tipo 3 ou maior, teremos: K a = lim s 2 G ( s ) H ( s ) = lim s →0
s →0
K a = lim s →0
s 2 K (Ta s + 1)(Tb s + 1) K (Tm s + 1) s N (T1 s + 1)(T2 s + 1) K (T p s + 1)
K (Ta s + 1)(Tb s + 1) K (Tm s + 1) s
N −1
(T1 s + 1)(T2 s + 1) K (T p s + 1)
=
K =∞ 0
Já para um sistema do tipo 2 teremos: 2
K a = lim s G ( s ) H ( s ) = lim s →0
s →0
s 2 K (Ta s + 1)(Tb s + 1) K (Tm s + 1) s 2 (T1 s + 1)(T2 s + 1) K (T p s + 1)
=K
Para um sistema do tipo 1 teremos: s 2 K (Ta s + 1)(Tb s + 1) K (Tm s + 1) K a = lim s G ( s ) H ( s ) = lim =0 s →0 s →0 s (T s + 1)(T s + 1) K (T s + 1) 1 2 p 2
E, finalmente, para um sistema do tipo 0 teremos: s 2 K (Ta s + 1)(Tb s + 1) K (Tm s + 1) =0 s →0 (T1 s + 1)(T2 s + 1) K (T p s + 1)
K a = lim s 2 G ( s ) H ( s ) = lim s →0
Resumindo, o erro estacionário atuante para uma entrada em parábola unitária será: e ss =
1 1 = =∞ Ka 0
para sistemas do tipo 0 e 1
e ss =
1 1 = Ka K
para sistemas do tipo 2
Análise de Resposta Transitória e Análise de Erros em Regime Permanente
e ss =
1 1 = =0 Ka ∞
132
para sistemas do tipo 3 ou maior
Perceba que sistemas de controle realimentado do tipo 0 e 1 são incapazes de seguir uma entrada a parábola unitária.
3.4.4 Resumo da seção A Tabela 3.4 resume os erros estacionários para sistemas do tipo 0, tipo 1 e tipo 2. TABELA 3.4 Erros em regime estacionário em termos do ganho K Tipo do sistema
Entrada em degrau
Entrada em rampa
Entrada em parábola
Sistema tipo 0
1 1+ K
∞
∞
Sistema tipo 1
0
1 K
∞
Sistema tipo 2
0
0
Sistema tipo 3 ou maior
0
0
1 K 0
Os coeficientes de erro KP, KV e Ka descrevem a habilidade de um sistema reduzir ou, até mesmo, eliminar erros de regime permanente, ou seja, eles indicam o desempenho do sistema em regime permanente. Para melhorar o desempenho do sistema podemos aumentar o seu tipo adicionando um ou mais integradores no ramo direto. Entretanto, como veremos mais tarde, esta ação pode levar o sistema à instabilidade. Exemplo 3.3: Calcule o erro estacionário a uma entrada em degrau unitário do sistema de controle apresentado na Fig. 3.19. R(s)
+
20 s2 + 17s + 10
C(s)
-
Fig. 3.19 – Sistema de controle para o Exemplo 3.3. A função de transferência de malha aberta do sistema em termos de ganho K, pólos e zeros é:
Sistemas de Controle
G( s ) H ( s ) =
133
20 20 = = s + 17 s + 10 ( s + 16,39)( s + 0,61) 2
20 s s + 1)( + 1) 16,39 ⋅ 0,61 ⋅ ( 16,39 0,61
2
G ( s) H ( s) =
s ( + 1)(1,64s + 1) 16,39 Como essa função de transferência representa um sistema do tipo 0 com K = 2, o
erro estacionário será: e ss =
1 1 = = 0,33 1+ K 1+ 2
Uma solução alternativa seria: K P = lim G( s ) H ( s ) = lim s →0
s →0
e ss =
20 =2 s + 17 s + 10 2
1 1 = = 0,33 1+ KP 1+ 2
Exercícios 1. A Fig. 3.20 apresenta a resposta transitória da tensão no capacitor do circuito RLC série da Fig. 2.1 (Cap. II) a uma entrada em degrau μ(t) = 5. Sabendo que o R medido foi de 2 Ω, encontre o coeficiente de amortecimento ζ, a freqüência natural não amortecida, L e C. 7
6
5
4
3
2
1
0
0
1
2
3
4
5
6
t x 10 -2
Fig. 3.20 –Resposta transitória a degrau para o Exercício 1
2. Dado o diagrama em blocos de um sistema de controle da Fig. 3.21, calcular o valor de K para que o tempo de subida de sua resposta a degrau unitário seja 0,1s. Determinar o erro em regime permanente nesta situação.
Análise de Resposta Transitória e Análise de Erros em Regime Permanente
E(s)
R(s)
+
-
K s+10
134
C(s)
B(s) 2
Fig. 3.21 – Diagrama de blocos para o Exercício 2.
3. Para o diagrama de blocos da Fig. 3.12, calcular o ganho KI do integrador que devemos inserir na função de transferência de alimentação direta para que o erro atuante em regime permanente a uma entrada em rampa unitária seja 0,2. 4. Quando avaliamos a resposta transitória de um sistema, o que chamamos de figuras de mérito? 5. Em relação ao erro em regime permanente, como classificamos os sistemas de controle? 6. Considerar um sistema de controle de realimentação unitária com a a FT de malha fechada C (s) ks + b = 2 R ( s ) s + as + b Determine a FT em malha aberta e mostre que o erro em regime estacionário à rampa a−k unitária é dado por e SS = b 7. Determinar a qualidade de funcionamento do sistema de 2a ordem da Fig. 3.22 e desenhar a
curva de resposta à entrada em degrau. E(s)
R(s)
+
-
2,25 s2+2s+1
C(s)
B(s) 1
Fig. 3.22 – Diagrama de Blocos para o exercício 7. 8. Para a função de transferência de malha fechada abaixo, determine o valor de F para que o sistema apresente uma sobre-elevação de 9,5%. Calcule, ainda tr e tS5%. C (s) 50 = 2 R ( s ) s + 12 s + 10 F
9. Seja o sistema da Fig. 3.23.
Sistemas de Controle
135
R(s)
+
10 5s+1
-
C(s)
B(s) 1/s
Fig. 3.23 – Diagrama de Blocos para o exercício 9.
Calcule o erro atuante em regime permanente e o valor final da saída para uma resposta em rampa unitária. 10. O diagrama de bloco de um rate loop para um missil teleguiado é mostrado na figura abaixo. Usando as equações analíticas para sistemas de segunda ordem, preveja MP, TP e TS para o sistema em malha fechada devido a um degrau unitário. Compare os resultados previstos com a resposta real a um degrau unitário obtida com o MATLAB. Explique as diferenças. R(s)
+
0,1+ 5 s
100(s+1)
s2+2s+100
-
Respostas selecionadas 1.ς = 0,45; ωn = 440 rad/s; L = 5 mH e C = 100μ. 2. eSS = 0,45. 3. KI = 4,17. 6. G (s) =
ks + b s + (a − k )s 2
7. tr = 0,38 s; tP = 2,1 s; tS2% = 3,9 s; MP = 12,2% e eSS = 0,31. 8. F =10; . tr = 0,19 s; tS5% = 0,5 s. 9. eSS = 0,1 e c(∞) = 1
C(s)
Sistemas de Controle
137
4. ESTABILIDADE DE SISTEMAS DE CONTROLE
4.1 Introdução O principal problema dos sistemas de controle lineares é a estabilidade. As questões que naturalmente se apresentam são: “Em que condições um sistema se torna instável?” e “Caso ele seja instável, como torná-lo estável?” No capítulo II, apresentamos a equação diferencial que representa um sistema linear invariante: n
n −1
.
m
m −1
.
a 0 y + a1 y + ... + a n −1 y + a n y = b0 u + b1 u + ... + bm −1 u + bm u
(4.1)
onde condições iniciais apropriadas são especificadas para a saída y(t) do sistema. A transformada de laplace da equação acima nos dá Y ( s) =
b0 s m + b1 s m−1 + b2 s m−2 + K + bm−1 s + bm a0 s + a1 s n
n −1
+ a2 s
n −2
+ K + a n−1 s + a n
U ( s) +
IC( s) a0 s + a1 s n
n −1
+ a 2 s n−2 + K + a n−1 s + a n
ou Y ( s) =
onde G ( s ) =
N ( s) IC ( s ) U ( s) + D( s ) D( s )
(4.2)
N ( s) e IC(s) é um polinômio em s contendo os termos resultantes das condições D( s )
iniciais. Como pode ser visto, a resposta total é a soma das contribuições devido as condições iniciais e a entrada do sistema u(t). Se o sistema é não forçado (isto é, a entrada é zero), nós chamamos a resposta resultante do sistema de resposta à entrada zero ou natural do sistema. Da mesma forma, se todas as condições iniciais são nulas, a entrada produz uma resposta de
Estabilidade de Sistemas de Controle
138
estado zero. Como vimos, a razão entre a transformada da saída e a transformada da entrada sob condições iniciais nulas é a função de transferência, denotada por G(s). Observe que ambos os termos na equação de saída contém o mesmo denominador, o qual é conhecido como equação característica. As raízes do denominador comum D(s) são as raízes características ou modos do sistema. A idéia de estabilidade envolve examinar se, para qualquer condição inicial, a resposta natural decai para zero. Esta é a chama estabilidade assintótica. Um conceito alternativo de estabilidade examina a resposta forçada do sistema observando se para uma entrada u(t) limitada a resposta também é limitada. Esta é a chamada estabilidade de entrada limitada – saída limitada ou BIBO estabilidade. Em linhas gerais, um sistema de controle é estável se e somente se todos os pólos de malha fechada estiverem localizados no semiplano esquerdo do plano s. Pólos no semiplano direito, para tempos crescentes, são dominantes e geram uma resposta transitória que cresce monotonicamente ou oscila com amplitude crescente, ou seja, na a presença de pólos no semiplano direito tornam o sistema instável. Entende-se por estabilidade absoluta aquela que se reporta ao fato de um sistema ser ou não estável; é uma condição do tipo sim ou não. Uma vez constatado que o sistema é estável, se desejarmos conhecer o seu grau de estabilidade, estudamos a sua estabilidade
relativa.
4.2 Estabilidade assintótica A idéia de estabilidade assintótica está relacionada simplesmente em examinar como um sistema se recupera a partir de uma dada condição inicial e na ausência de uma entrada u(t). A resposta natural do sistema linear invariante no tempo descrito por (4.1) é determinada somente pela equação característica do sistema e suas condições iniciais. O sistema é assintoticamente estável de e somente se Real (pk) < 0 ; k = 1, 2, ..., n. Claro, isto faz sentido, já que no caso de pk ser uma raiz isolada, ela adiciona uma contribuição
Sistemas de Controle
139
⎡ IC ( s ) ⎤ pk t s ⎢Re ⎥e ⎣ s = pk D( s ) ⎦
na solução de y(t) e se pk = σk + jωk, então e pk t = eσ k t (cos ω k t + jsenω k t )
Assim, se σk > 0, então y(t) conterá uma componente de crescimento ilimitado quando t cresce. Logo, todo o σk = Real (pk) deve ser negativo para a estabilidade assintótica. Quando a saída não decai a zero nem vai para o infinito, dizemos que o sistema é marginalmente estável. Isto ocorre quando σk = Real (pk) = 0, ou seja, quando uma raiz da equação característica é nula ou puramente imaginária. Se as raízes são repetidas e tem parte real nula, o sistema é instável. Isto pode ser visto a partir dos seguintes exemplos: Y1 ( s ) =
IC ( s ) 1 IC ( s ) IC ( s ) 1 1000 = Y2 ( s ) = = 2 Y3 ( s ) = = D( s) s D( s ) s + 100 D( s) s 2
Tomando a transformada inversa de Laplace das expressões acima, obtém-se: y1 (t ) = u S (t )
y 2 (t ) =
IC ( s ) = u S (t ) ⋅ 100 cos10t D( s)
y 3 ( s ) = t ⋅ u S (t )
Os sistemas com resposta y1(t) e y2(t) são marginalmente estáveis porque sua resposta natural nem decai para zero nem cresce sem limites. Já o sistema com resposta y3(t) é claramente instável.
4.3 BIBO Estabilidade Vamos estabelecer, sem uma prova formal, que um sistema é BIBO estável se e somente se todos os pólos do sistema se localizam no semiplano esquerdo aberto. Se algum pólo está localizado no semiplano direito, o sistema é instável. Pólos sobre o eixo imaginário requerem uma atenção especial. Um sistema marginalmente estável é BIBO estável? A resposta é não. Considere Y ( s) 1 = G ( s) = U ( s) s
Estabilidade de Sistemas de Controle
140
A resposta a degrau unitário de G(s) é Y ( s) =
1
s2
Tomando a transformada inversa de Laplace da expressão acima, obtém-se: y (t ) = t ⋅ u S (t )
Como o degrau unitário é limitado e a resposta do sistema é ilimitada, G(s) não é BIBO estável. Parece que as duas definições de estabilidade (assintótica e BIBO) são a mesma. Este é um ponto que necessita de algum cuidado. A estabilidade assintótica é determinada pelos modos, os quais são as raízes da equação característica. A BIBO estabilidade, entretanto, depende dos pólos. Em alguns caso, nós podemos encontrar uma função de transferência onde há cancelação de pólos e zeros. Tecnicamente, os pólos são computados após a função de transferência ser reduzida e alguns termos comum serem cancelados. Logo, alguns modos não aparecem como pólos. Conclui-se que a estabilidade assintótica implica em BIBO estabilidade mas não vice-versa. As definições são equivalentes somente no caso de funções de transferência sem cancelação de pólos e zeros.O próximo exemplo ilustra essa discussão: G ( s) =
( s − 1) ( s − 1)( s + 2)
Os modos são {1, -2}, mas o sistema tem somente um pólo. Logo, o sistema é BIBO estável. Por causa do modo no semi-plano direito em {1}, entretanto, ele não é estável no sentido de estabilidade assintótica. Estas respostas contraditórias são comuns quando nós encontramos funções de transferência onde há cancelação de pólos e zeros.
4.4 Critério de Routh-Hurwitz O critério de Routh-Hurwitz é um método algébrico que informa acerca da estabilidade absoluta de um sistema linear invariante no tempo, testando se há alguma raiz da equação característica no semiplano direito do plano s. O método também indica quantas raízes estão sobre o eixo imaginário e quantas estão no semiplano direito.
Sistemas de Controle
141
Seja a equação característica F ( s ) = a 0 s n + a1 s n −1 + a 2 s n − 2 + K + a n −1 s + a n = 0
(4.3)
onde todos os coeficientes são números reais. A fim de que não haja raízes desta equação com parte real positiva, é necessário,
porém não suficiente, que: •
Todos os coeficientes do polinômio tenham o mesmo sinal;
•
Nenhum dos coeficientes se anule
condições que podem ser verificadas por inspeção. Ressaltamos que estas condições não são suficientes, pois um polinômio com todos os coeficientes não nulos e de mesmo sinal pode ter zeros no semiplano direito do plano s. O critério que apresentaremos a seguir foi criado pelo matemático Adolf Hurwitz e aperfeiçoado pelo também matemático Edward John Routh. O primeiro passo do método consiste em colocar os coeficientes do polinômio (4.1) em duas linhas como segue: a0 a1
a2 a3
a4 a5
a6 a7
a8 K a9 K
Considerando para efeito de apresentação do método um sistema de sexta ordem, o segundo passo é ampliar a matriz gerada, perfazendo as operações indicadas: s6 s
5
s4 s3 s2 s1 s0
a0
a2
a4
a6
a1 a1 a 2 − a 0 a3 = b1 a1 b1 a3 − a1b2 = c1 b1 c1b2 − b1c 2 = d1 c1 d1c 2 − c1 a 6 = e1 d1 e1 a 6 − d1 0 = a6 e1
a3 a1 a 4 − a 0 a5 = b2 a1 b1 a5 − a1 a6 = c2 b1 c1 a 6 − b1 0 = a6 c1
a5 a1 a 6 − a 0 0 = a6 a1 b1 0 − a1 0 =0 b1 c1 0 − b1 0 =0 c1
0
0
0
0
0
0
0
0 0 0
Estabilidade de Sistemas de Controle
142
Uma vez montado o procedimento, que é conhecida como tabulação de Routh ou tabela de Routh, o terceiro e último passo é investigar os sinais dos números da primeira coluna da tabela, procedimento que pode levar a seguintes conclusão: Todas as raízes do polinômio estão no semiplano esquerdo do plano se todos os elementos da primeira coluna da tabela de Routh tiverem o mesmo sinal. Se houver troca de sinal nos elementos da primeira coluna, o número de trocas de sinal fornecerá o número de raízes com parte real positiva.
A seguir, ilustraremos através de exemplos a aplicação da tabela de Routh. Exemplo 4.1: Considere a função de transferência
1 C ( s) = que apresenta como equação R( s ) ( s − 2)( s + 1)( s − 3)
característica: ( s − 2)( s + 1)( s − 3) = s 3 − 4s 2 + s + 6 = 0 Sem aplicar o teste, sabemos que a equação característica apresenta duas raízes com parte real positiva (2 e 3). Porém, como o objetivo é apresentar o critério, montamos a tabela de Routh como segue: s3 s
2
s
1
s0
1
1
−4 6 − 4 ⋅1 − 1 ⋅ 6 = 2,5 0 −4 2,5 ⋅ 6 − (−4) ⋅ 0 =6 0 2,5
Como ocorrem duas trocas de sinal na primeira coluna, o polinômio apresenta duas raízes no semiplano direito, resultado de acordo com o que já se sabia. Exemplo 4.2 Considere a função de transferência
C (s) 1 = 4 que apresenta como 3 R( s ) 2s + s + 3s 2 + 5s + 10
equação característica: 2s 4 + s 3 + 3s 2 + 5s + 10 = 0 Como a equação característica não apresenta nenhum coeficiente nulo e todos os coeficientes possuem o mesmo sinal, ela satisfaz a condição necessária (porém não suficiente)
Sistemas de Controle
143
para não ter raízes no semiplano direito ou sobre o eixo imaginário. Porém, a condição suficiente deve ser verificada, montando-se a tabela de Routh: s4 s3 s2 s1 s0
2 3 10 1 5 0 1⋅ 3 − 2 ⋅ 5 1 ⋅ 10 − 2 ⋅ 0 = −7 = 10 0 1 1 − 7 ⋅ 5 − 1 ⋅ 10 = 6,43 0 0 −7 10
Como ocorrem duas trocas de sinal na primeira coluna, o polinômio apresenta duas raízes no semiplano direito.
Casos especiais 1. O primeiro elemento em uma linha qualquer da tabela de Routh é zero, mas os outros elementos não o são ou não há termos restantes. Se aparecer um zero na primeira posição de uma linha, os elementos da linha seguinte se tornarão infinitos. Para contornar essa situação, substitui-se o termo zero por um número positivo arbitrariamente pequeno ε. Exemplo 4.3 Considere a função de transferência
C ( s) 1 que apresenta como = 3 R( s) s + 2s 2 + s + 2
equação característica: s 3 + 2s 2 + s + 2 = 0
Que gera a seguinte tabela de Routh: s3 s2 s1 s0
1 2 2 ⋅1 − 1 ⋅ 2 =0≅ε 2 ε ⋅2 − 2⋅0 =2
1 2
ε
Nesse caso, como não houve troca de sinal, isto indica que há um par de raízes imaginárias, no caso, s = ±j. Por outro lado, a equação característica s 3 − 3s + 2 = ( s − 1) 2 ( s + 2) = 0 , gera a seguinte tabela:
Estabilidade de Sistemas de Controle
144
s3 s2 s1
1 0≅ε 2 − 3 ⋅ ε − 1⋅ 2 = −3 −
s0
2
ε
−3 2
ε
As duas trocas de sinal estão de acordo com a fatoração realizada na equação característica.
2. Os elementos de uma linha da tabela são todos iguais a zero. Se todos os coeficientes de uma linha calculada forem zero, isto indica que há duas raízes reais com sinais opostos ou duas raízes complexas conjugadas. Em tal caso, o cálculo da tabela pode prosseguir se formarmos um polinômio auxiliar com os coeficientes da ultima linha e usando os coeficientes da derivada deste polinômio na linha seguinte. As raízes podem ser calculadas resolvendo-se o polinômio auxiliar. EXEMPLO 4.4 - Seja a seguinte equação característica: s 5 + 2s 4 + 24 s 3 + 48s 2 − 25s − 50 = ( s + 1)( s − 1)( s + j 5)( s − j 5)( s + 2) = 0 Que gera a seguinte tabela de Routh: s5 s4 s3
1 2 2 ⋅ 24 − 1 ⋅ 48 =0 2
24 − 25 48 − 50 (2 ⋅ −25) − (1 ⋅ −50) =0 2
Como a linha de s3 contém só zeros, formamos o seguinte polinômio auxiliar: A( s ) = 2s 4 + 48s 2 − 50 = 0 Que indica que há dois pares de raízes de igual módulo e sinal oposto. Derivando A(s) em relação a s, obtém-se:
8s 3 + 96s = 0 cujos coeficientes passam a integrar a linha s3: s5 s4 s3 s2 s1 s0
1 24 − 25 2 48 − 50 8 96 8 ⋅ 48 − 2 ⋅ 96 = 24 − 50 8 24 ⋅ 96 − (8 ⋅ −50) = 112,7 0 24 − 50
Sistemas de Controle
145
Como há uma troca de sinal, portanto a equação característica tem uma raiz positiva. Podemos encontrar as raízes de igual módulo e sinal oposto resolvendo a equação auxiliar.
2s 4 + 48s 2 − 50 = 0 que possui como raízes: 48 ± 48 2 + 400 4
s2 = −
ou
s2 = 1 ⇒ s = ± 1
s 2 = −25 ⇒ s = ±j5
e
Aplicação do critério de Routh na análise de sistemas de controle Utilizando o critério de Routh é possível determinar o efeito na estabilidade de um sistema motivado pela alteração de um determinado parâmetro do sistema. Exemplo 4.5 Considere um sistema com realimentação unitária que apresenta como função de transferência de malha aberta G ( s ) H ( s ) =
K . s + s + 11s 2 + s + 0,5 4
3
Determine para quais valores de K o sistema é estável. Solução: O sistema apresentará (confira) como equação característica: s 4 + s 3 + 11s 2 + s + K + 0,5 = 0 A tabela de Routh será: s4 s3 s2 s1 s0
1 1 10 9,5 − K 10 K + 0,5
11 K + 0,5 1 K + 0,5 0
Para o sistema ser estável, não pode haver troca de sinal na 1a coluna, ou seja: •
9,5 – K > 0 ⇒ K < 9,5
•
K + 0,5 > 0 ⇒ K > - 0,5
Logo, - 0,5 < K < 9,5 manterá o sistema estável.
Estabilidade de Sistemas de Controle
146
4.3 O lugar das raízes ou root locus 4.3.1 – Introdução A estabilidade relativa e o desempenho transitório de um sistema de controle em malha fechada estão diretamente relacionados com a localização das raízes de malha fechada da equação característica no plano s. É freqüentemente necessário ajustar um ou mais parâmetros para se obter uma localização desejável das raízes. Logo, é desejável determinar como as raízes da equação característica de um dado sistema se movimentam no plano s quando os parâmetros variam; isto é, é usual determinar o lugar das raízes no plano s. O método do lugar das raízes, introduzido por Evans em 1948, foi aperfeiçoado e tem sido utilizado extensivamente em projetos de controle. A técnica do lugar das raízes é um método gráfico para esboçar o lugar das raízes no plano s quando um parâmetro varia. Esta técnica pode ser utilizada em conjunto com o critério de Routh-Hurwitz. O método do lugar das raízes fornece informação gráfica que pode ser usada para se obter informação qualitativa no que diz respeito à estabilidade e o desempenho do sistema. Se a localização das raízes não for satisfatória, os ajustes necessários nos parâmetros podem ser prontamente verificados a partir do lugar das raízes.
4.3.2 – O conceito de lugar das raízes A performance dinâmica de um sistema de malha fechada é descrita pela função de transferência de malha fechada T ( s) =
C (s) p( s) = R( s) q( s)
(4.4)
onde p(s) e q(s) são polinômios em s. A equação característica é obtida igualando q(s) a zero. No caso do sistema mostrado na Fig. 4.1, a equação característica é: 1 + KG ( s ) H ( s ) = 0
(4.5)
onde K é o parâmetro variável. Os valores de s que satisfazem a equação (4.5) são onde as raízes se encontram no plano s. Reescrevendo a equação (4.5) na forma polar obtém-se a condição de módulo: KG ( s ) H ( s ) = 1
(4.6)
Sistemas de Controle
147
e a condição de fase: ∠ KG ( s ) H ( s ) = 180 o ± k 360 o
(4.7)
onde k=0, ±1, ±2, ±3 ... A equação (4.5) pode ser escrita, ainda, na forma 1+
K ( s + z1 )( s + z 2 ) K ( s + z m ) =0 ( s + p1 )( s + p 2 ) K ( s + p n )
(4.8)
ou M
∏ (s + z m ) m =1 N
1+ K
(∏ ( s + p n )
=0
(4.9)
n =1
e as condições de módulo e fase para o lugar das raízes tomam a forma KG ( s ) H ( s ) =
K ⋅ s + z1 ⋅ s + z 2 K s + p1 ⋅ s + p 2 K
=1
(4.10)
e ∠KG ( s ) H ( s ) = ∠s + z1 + ∠s + z 2 + K − (∠s + p1 + ∠s + p 2 + K) = 180 o ± k 360 o (4.11) onde k é um inteiro. A condição de módulo habilita a determinação do valor de K para uma dada raiz s1. Um ponto de teste s1 no plano s é verificado como uma raiz quando (4.11) é satisfeita. Os ângulos são todos medidos no sentido anti-horário a partir de uma linha horizontal. R(s)
C(s) +
G(s) -
H(s)
Fig. 4.1 – Sistema de controle. Para ilustrar o que foi dito, considere o sistema de segunda ordem mostrado na Fig. 4.2. A equação característica deste sistema é 1 + KG ( s ) H ( s ) = 1 +
K =0 s ( s + 2)
Estabilidade de Sistemas de Controle
148
ou, alternativamente q ( s ) = s 2 + 2 s + K = s 2 + 2ζω n s + ω n 2 = 0 O lugar das raízes à medida que K é variado é encontrado satisfazendo-se: KG ( s ) H ( s ) =
K =1 s ( s + 2)
R(s) +
1 s(s+2)
K -
(4.12)
C(s)
1
Fig. 4.2 – Sistema de controle com realimentação unitária, com o parâmetro variável K. e ∠ KG ( s ) H ( s) = ±180, ± 540 0
(4.13)
Note que o ganho K pode ser variado de zero a um valor positivo infinitamente grande. Para um sistema de segunda ordem as raízes de são s1 , s 2 = −ζω n ± ω n ζ 2 − 1 ou na forma polar para ζ < 1 s1 , s 2 = ω n ∠arctg
ζ 1−ζ
2
= ω n ∠ arccos ζ
No caso do sistema da Fig. 4.2 s1 , s 2 = −1 ± 1 − K As raízes são reais para 0 ≤ K ≤ 1 e complexas para K > 1. O lugar das raízes correspondentes a todos os valores de K está indicado na Fig. 4.3, onde o movimento das raízes conforme K aumenta é indicado por setas. Com ζ < 1 (K > 1), para satisfazer a condição de ângulo [equação (4.13)] o lugar das raízes é uma linha vertical. Por exemplo, conforme mostra a Fig. 5.3, junto à raiz s1 os ângulos são ⎡ K ⎤ ∠⎢ = −∠s1 −∠(s1+2) = −[(1800 − θ1) − θ1] = −1800 ⎥ ⎣ s ( s + 2) ⎦ s = s1
Sistemas de Controle
149
Note que a condição de ângulo é satisfeita em qualquer ponto da linha entre 0 e –2 no eixo real e da linha vertical que lhe é perpendicular. Por sua vez, o ganho K no ponto particular s1 é encontrado empregando-se (4.12) como segue: K K = =1 s ( s + 2) s = s s1 ⋅ s1 + 2 1 logo K = s1 ⋅ s1 + 2
s1
jω
K=2
+j
|s1 +2|
|s1|
s1+2 =θ1 -2 K=0
s1 =180o – θ1 -1
0 K=0
K=1
Pólos do sistema em malha aberta
K=2
σ
-j
Fig. 4.3 – Lugar das raízes para o sistema de segunda ordem da Fig. 4.2. 4.3.3– Procedimento para construção do lugar das raízes
As raízes da equação característica de um sistema fornecem uma valiosa visão sobre a resposta do sistema. Para localizar graficamente as raízes da equação característica no plano s, indica-se a seqüência de doze passos que fornece um rápido rascunho do lugar das raízes. Exemplo 4.7 – Seja o sistema de controle com realimentação unitária que possui como função de transferência de ramo direto: KG ( s ) =
K ( s + 1) 3
s + 5s 2 + 6 s
Passo 1: Escrever a equação característica na forma indicada por (4.5):
Estabilidade de Sistemas de Controle
150
1 + KG ( s ) H ( s ) = 1 +
K ( s + 1) 3
s + 5s 2 + 6 s
=0
Passo 2: Fatorar e escrever KG(s)H(s) na forma de pólos e zeros expressa por (4.9):
1 + KG ( s) H ( s) = 1 +
K ( s + 1) =0 s( s + 2)( s + 3)
(4.14)
Passo 3: Locar os pólos e zeros no plano s com os símbolos selecionados ( x para pólos e o
para zeros). Nós estamos particularmente interessados em determinar o lugar das raízes para 0 ≤ K ≤ ∞. Reescrevendo (4.9), obtém-se: N
M
n =1
m =1
∏ (s + pn ) + K ∏ (s + z m ) = 0
(4.15)
A equação (4.15) nos mostra que com K = 0, as raízes da equação característica são os pólos de G(s)H(s); quando K se aproxima do infinito, o lugar das raízes da equação característica são os zeros de G(s)H(s). Logo: O lugar das raízes da equação característica 1 + KG ( s) H ( s) = 0 inicia nos pólos de G(s)H(s) e termina nos zeros G(s)H(s) quando K vai de 0 ao infinito.
Para muitas funções G(s)H(s) muitos dos zeros estarão junto ao infinito no plano s. Isto ocorre porque a maioria das funções em controle tem mais pólos do que zeros. Com n pólos e m zeros e n > m, tem-se n – m ramos do lugar das raízes indo aos n – m zeros do infinito. A Fig. 4.4 mostra os pontos para os quais K = 0 e K = ∞ no lugar das raízes do sistema representado pela equação característica (4.14). jω
plano s
K=0
K=0
-3
-2
Κ=∞
-1
K=0
σ
0
Fig. 4.4 – Pontos para os quais K = 0 e K = ∞ no lugar das raízes do sistema do exemplo 4.7. Há mais dois pontos para K = ∞ em s = ∞.
Sistemas de Controle
151
Passo 4: Localizar os segmentos do eixo real que são lugares das raízes. O lugar das raízes no
eixo real está sempre em uma seção do eixo real à esquerda de um número ímpar de pólos e zeros. Este fato é constatado examinando-se a equação (4.11). O lugar das raízes no eixo real para o sistema do exemplo 4.7 é mostrado na Fig. 4.5, onde a direção do lugar das raízes quando K aumenta é mostrado por uma seta. Como foi dito anteriormente, o lugar das raízes inicia nos pólos e termina nos zeros. Podemos, por exemplo, calcular o valor de K para a raiz s = s1= -1/2 empregando a equação (4.10) como segue: KG ( s1 ) H ( s1 ) =
K ⋅ s1 + 1 s1 s1 + 2 ⋅ s1 + 3
=
K ⋅ −1 +1 K⋅1 2 2 =1 = −1 −1 + 2 ⋅ −1 + 3 1 ⋅ 3 5 2 2 2 2 2 2
15 K=
6 = 15 1 3 2 jω
σ -3
-2
-1
0
Fig. 4.5 – O lugar das raízes sobre o eixo real do sistema do exemplo 4.7.
Passo 5: Determinar o número de ramos do lugar das raízes completo. Como os ramos iniciam nos pólos e terminam nos zeros, o número de ramos é igual ao número de pólos, já que o número de pólos é maior ou igual ao número de zeros. Logo, para o nosso exemplo, o número de ramos é igual a três.
Passo 6: O lugar das raízes completo é simétrico em relação ao eixo horizontal real, uma vez que as raízes complexas devem aparecer com pares de raízes complexas conjugadas.
Passo 7: O lugar das raízes segue para os zeros no infinito por assíntotas com centro em σA e com ângulos φA. Quando o número de zeros finitos de G(s)H(s), m, é menor que o número de pólos, n, pelo número finito N = n – m, então n ramos do lugar das raízes terminam em zeros no infinito. Estes ramos do lugar das raízes seguem para zeros no infinito por assíntontas quando K se aproxima do infinito. Estas assíntotas são centradas em um ponto sobre o eixo real dado por:
Estabilidade de Sistemas de Controle
σA =
152
∑ polos de G(s) H (s) − ∑ zeros de G(s) H (s) =
∑ (− p j ) − ∑ (− zi ) n
m
j =1
i =1
n−m
n−m
(4.16)
e com ângulos dados por
φA =
(2q + 1) 180 o n−m
(4.17)
onde q = 0, 1, 2, ..., (n – m –1 ). O leitor pode encontrar a prova das equações (4.16) e (4.17) em Dorf (2001, p. 339-340). Para o nosso exemplo
σA =
(−2) + (−3) − (−1) − 4 = −2 = 3 −1 2
e
φ A = 90 o para q = 0 e φ A = 270 o para q = 1 A Fig. 4.6 representa as assíntotas e os ramos do lugar das raízes no eixo real. jω assíntotas
σ -3
-2
-1
0
Fig. 4.6 – As assíntotas e o lugar das raízes sobre o eixo real do sistema do exemplo 4.7.
Passo 8: Determinar o ponto no qual o lugar das raízes cruza o eixo imaginário (se ele o faz), empregando o critério de Routh-Hurwitz. Em nosso exemplo, a equação característica é reescrita a partir de (4.14) como: s ( s + 2)( s + 3) + K ( s + 1) = s 3 + 5s 2 + (6 + K ) s + K = 0 Logo a matriz de Routh será: s3 s2 s1 s0
1 5 30 + 4 K 5 K
6+K K
Assim, verifica-se que não existe valor de K maior que zero que leve o sistema ao limite da
Sistemas de Controle
153
estabilidade. Caso esse valor existisse, as raízes da equação auxiliar 5s 2 + K = 5( s 2 + 5 ) K seriam os pontos onde o lugar das raízes cruza o eixo imaginário.
Passo 9: Determinar o ponto de ruptura sobre o eixo real (se ele o faz). O lugar das raízes no nosso exemplo deixa o eixo real em um ponto de ruptura situado entre os pólos –2 e –3. O ponto de ruptura a partir do eixo real ocorre onde a mudança líquida no ângulo causada por um pequeno deslocamento é zero. O lugar das raízes deixa o eixo real onde há uma multiplicidade de raízes, tipicamente duas. O ponto de ruptura para um sistema de segunda ordem é mostrado na Fig. 4.7(a) e para um caso especial de um sistema de quarta ordem na Fig. 4.7(b). Em geral, devido ao critério de fase, as tangentes para os lugares das raízes no
ponto de ruptura são igualmente espaçadas sobre 360o. Logo, na Fig. 4.7(a), nós temos que os dois lugares no ponto de ruptura estão espaçados de 180o, já na Fig. 4.7(b), os quatro lugares são espaçados de 90o. Para calcular o ponto de ruptura em nosso exemplo, que de acordo com a Fig. 4.6 está entre –2 e –3 , isolaremos o fator K na equação característica como segue 1+
K ( s + 1) − s ( s + 2)( s + 3) =0⇒ K = s ( s + 2)( s + 3) s +1
O ponto de ruptura ocorrerá onde K alcança o seu máximo valor. Para obter este valor, diferenciamos K = f(s) em relação a s e igualamos a zero, ou seja dK d ⎛ − s ( s + 2)( s + 3) ⎞ d ⎛ s 3 + 5s 2 + 6 s ⎞ ⎟⎟ = 0 ⎜ = ⎜ = − ⎟ ds ds ⎝ s +1 ds ⎜⎝ s +1 ⎠ ⎠
jω
jω
j1
σ -3
-1
0
σ -2
0 -j1
(a)
(b)
Estabilidade de Sistemas de Controle
154
Fig. 4.7 – Exemplos de ponto de ruptura: (a) para um sistema de segunda ordem e (b) para um sistema de quarta ordem. ⎛ 2 s 3 + 8s 2 + 10 s + 6 ⎞ ⎛ ( s + 1) ⋅ (3s 2 + 10 s + 6) − ( s 3 + 5s 2 + 6 s ) ⎞ dK ⎟⎟ = 0 ⎜⎜ ⎟ = − = −⎜⎜ ⎟ ds ( s + 1) 2 ( s + 1) 2 ⎠ ⎝ ⎠ ⎝
2 s 3 + 8s 2 + 10 s + 6 = 0 cujo as raízes, calculadas com o auxílio do MATLAB, são-2.4656, -0,7672 + j0,7926 e 0,7672 j0,7926. Logo, o ponto de ruptura é –2,46. Assim, o esboço do lugar das raízes do sistema de controle com realimentação unitária que possui como função de transferência de ramo direto KG ( s ) =
K ( s + 1) 3
s + 5s 2 + 6 s
é
mostrado na Fig. 4.8. L u g a r d a s ra íze s 8
6
a s s ín to ta
Eixo imaginário
4
2
0
-2
-4
-6
-8 -3
-2 .5
-2
-1 .5
-1
-0 .5
0
E ix o re a l
Fig. 4.8 – O lugar das raízes do sistema do exemplo 4.7. Podemos determinar o valor do parâmetro Kx em uma raiz específica sx usando a condição de módulo (4.9). Assim,
Sistemas de Controle
155
⎡ N ⎢ ∏ s + pn K x = ⎢ nM=1 ⎢ ⎢ ∏ s + zm ⎣ m =1
⎤ ⎥ ⎥ ⎥ ⎥ ⎦ s=sx
(4.18)
No nosso exemplo, o valor de K para a raiz s = -2,46 pode ser calculada a partir de 4.18 como segue: ⎡ s s+2 s+3⎤ 2,46 ⋅ 0,46 ⋅ 0,64 = = 0,5 K −2, 46 = ⎢ ⎥ 1,46 s +1 ⎣⎢ ⎦⎥ s = −2, 46
)Usando o MATLAB para traçar o lugar das raízes O procedimento descrito no Exemplo 4.7 nos permite obter o esboço do lugar das raízes; um lugar das raízes mais preciso pode ser obtido empregando-se o MATLAB. Entretanto, o leitor não deve ficar tentado em utilizar apenas o MATLAB na construção do lugar das raízes, ignorando o procedimento manual. Os conceitos fundamentais por trás do método do lugar das raízes estão embutidos no procedimento manual, conceitos que são essenciais para uma compreensão plena das aplicações do método. Vamos obter o lugar das raízes do sistema de controle a realimentação unitária representado pela função de transferência de malha aberta G ( s) H ( s) =
K ( s + 1) s ( s + 4)( s 2 + 2s + 2)
Sua equação característica pode ser escrita como 1+
K ( s + 1) =0 s ( s + 4)( s 2 + 2 s + 2)
(4.19)
Para obter o lugar das raízes com o MATLAB devemos executar os seguintes comandos: >> p=[1 2 2]; >> raizes=roots(p) raizes = -1.0000 + 1.0000i -1.0000 - 1.0000i >> num=[1 1]; >> den=poly([0 -4 -1.0000 + 1.0000i -1.0000 - 1.0000i]); >> sys=tf(num,den); rlocus(sys)
Estabilidade de Sistemas de Controle
156
O lugar das raízes referente à equação característica (4.19) é apresentado na Fig. 4.9, que mostra, ainda, os dados relativos a um determinado ponto do lugar das raízes. O valor de K onde o lugar das raízes intercepta o eixo imaginário pode ainda ser obtido utilizando-se o comando rlocfind, mas só após o lugar das raízes ter sido obtido com o comando rlocus. Ao executar-se o comando rlocfind, aparecerá um marcador sobre o gráfico do
lugar das raízes; movendo-o ao ponto de interesse e pressionando a tecla enter, o valor de do parâmetro K e o ponto selecionado aparecerão na janela de comando. Por exemplo: Root Loc us 6
4
Im aginary A x is
2
0
-2 S ys tem : s ys Gain: 24.9 P ole: 0.00227 - 2.34i Dam ping: -0.000969 Overs hoot (% ): 100 Frequency (rad/s ec ): 2.34
-4
-6 -8
-7
-6
-5
-4
-3
-2
-1
0
1
Real A x is
Fig. 4.9 – Lugar das raízes da equação característica 1 +
K ( s + 1) = 0. s ( s + 4)( s 2 + 2s + 2)
>> rlocfind(sys) Select a point in the graphics window selected_point = -0.4572 + 1.4731i
ans = 6.8727
Quando K = 6,87, a função de transferência de malha fechada
2
Sistemas de Controle
157
FT ( s ) =
G(s) K ( s + 1) = 2 1 + G ( s ) H ( s ) s ( s + 4)( s + 2s + 2) + K ( s + 1) FT ( s ) =
6,87( s + 1) s + 6 s + 8s 2 + 14.87 s + 6,87 4
3
apresenta pólos e zeros em
>> num=6.87*[1 1]; den=[1 6 8 14.87 6.87]; >> [zeros,polos,k] = tf2zp(num,den) zeros = -1
polos = -4.9320 -0.2496 + 1.5448i -0.2496 - 1.5448i -0.5689
k = 6.8700
Note que, para obter os zeros e pólos de FT(s) utilizamos o comando do MATLAB tf2zp.
)Funções do MATLAB que aprendemos a utilizar: 9 rlocus; 9 rlocfind; 9 tf2zp;
Exercício: Obter o lugar das raízes da Fig. 4.9 empregando o procedimento manual. Observação: Para obter o lugar das raízes representado na Fig. 4.9, é preciso determinar o ângulo de partida dos pólos complexos conjugados. A presença de um par de pólos de malha aberta complexos conjugados requer a determinação do ângulo de partida destes pólos. O conhecimento dos ângulos é importante para esboçar os lugares das raízes com razoável precisão, pois mostra como o lugar das raízes originário do pólo migra para o eixo real ou estende-se para a assíntota.
Estabilidade de Sistemas de Controle
158
O ângulo de partida y do lugar das raízes que deixa o pólo em –1 + j é determinado empregando-se a equação (4.11). Se s1 é um ponto do lugar das raízes que deixa –1 + j e s1 estiver muito próximo de –1 + j conforme mostra a Fig. 4.10, a equação (4.11) fornece: ∠(s1 + 1) − [∠s1 + ∠(s1 + 4) + ∠(s1 + 1 + j ) + ∠(s1 + 1 − j )] = 1800 ± k 3600 900 − (1350 + 18,430 + 900 + θ ) = 1800 ± k 3600 para k = 0, ±1, ±2, ... Conseqüentemente:
θ = −333,4 0 = +26,57 0 Como o lugar das raízes é simétrico em relação ao eixo real, o ângulo de partida do pólo –1 – j é – 26,570. jω θ
j
s1 -1
-4
0
σ -j
Fig. 4.10 – Determinação do ângulo de partida.
4.3.4– Os dez passos do procedimento do lugar das raízes 1. Escreva a equação característica na forma
1 + KG ( s) H ( s) = 0 . 2. Coloque o fator G(s)H(s) em termos de zeros e pólos, gerando a equação M
1+ K
∏ (s + z m ) m =1 N
(∏ ( s + p n )
=0
n =1
3. Localizar os pólos ( x )e zeros ( o )de malha aberta no plano s, sendo que o locus iniciam nos pólos e terminam nos zeros. 4. Localizar os segmentos do eixo real que são lugares das raízes. O lugar das raízes no eixo real está sempre em uma seção do eixo real à esquerda de um número ímpar de pólos e zeros.
Sistemas de Controle
159
5. Determinar o número de ramos do lugar das raízes, número este que é igual ao número de pólos. 6. Note que o lugar das raízes completo é simétrico em relação ao eixo horizontal real. 7. Os ramos seguem para os zeros no infinito ao longo de assíntotas cujo centro sA e ângulos φA são dados por
σA =
∑ (− p j ) − ∑ (− zi ) n
m
j =1
i =1
n−m
φA =
(2q + 1) 180 o n−m
8. Determinar, quando houver, o ponto no qual o lugar das raízes cruza o eixo imaginário, empregando o critério de Routh-Hurwitz. 9. Determinar o ponto de ruptura sobre o eixo real (a) isolando K na equação característica, (b) derivando K em relação a s e (c) calculando as raízes de (b). 10. Determinar o ângulo de partida de um pólo complexo ou o ângulo de chegada de um zero complexo: Ângulo de partida de um pólo complexo = 180o – (soma dos ângulos de vetores para o pólo complexo a partir de outros pólos) + (soma dos ângulos de vetores para o pólo complexo a partir de zeros) Ângulo de partida de um zero complexo = 180o – (soma dos ângulos de vetores para o zero complexo a partir de outros pólos) + (soma dos ângulos de vetores para o pólo complexo a partir de pólos)
4.3.5– Aspectos importantes da construção do lugar das raízes Efeito da adição de pólos: Considere a função G ( s) H ( s) =
K s ( s + 2)
(4.20)
Os zeros de 1 + G(s)H(s) são apresentados pelo diagrama do lugar das raízes da Fig. 4.11(a). Introduzindo um pólo em s = -4, este pólo adicional, conforme mostra a Fig. 4.11(b), força a parte complexa do lugar das raízes a migrar em direção à metade direita do plano s, tornando o sistema instável para valores de K acima de um limite. O leitor poderá concluir, utilizando o MATLAB para acrescentar mais um pólo ou um par de pólos
Estabilidade de Sistemas de Controle
160
complexos conjugados a planta original, que a adição de pólos efeito desloca o lugar das raízes na direção da metade direita do plano s. Root Locus 0.8 0.6
Imaginary Axis
0.4 0.2 0 -0.2 -0.4 -0.6 -0.8 -3
-2.5
-2
-1.5
-1
-0.5
0
0.5
1
-2
0
2
4
Real Axis
(a) Root Locus 8 6
Imaginary Axis
4 2 0 -2 -4 -6 -8 -12
-10
-8
-6
-4 Real Axis
(b) Fig. 4.11 – Lugar das raízes mostrando o efeito da adição de pólos a G(s)H(s).
Sistemas de Controle
161
Efeito da adição de zeros: Considere novamente a função expressa por (4.20). Introduzindo um zero em s = -4, este zero, conforme mostra a Fig. 4.12(a), força a parte complexa do lugar das raízes a migrar em direção à metade esquerda do plano s, aumentando a estabilidade relativa do sistema. Efeito semelhante ocorrerá se o par de zeros complexos conjugados s = -2 + j2 e s = -2 – j2 forem acrescentados [ Fig. 4.12(b) ]. Root Locus 3
2
Imaginary Axis
1
0
-1
-2
-3 -8
-7
-6
-5
-4
-3
-2
-1
0
Real Axis
(a) Root Locus 2 1.5
Imaginary Axis
1 0.5 0 -0.5 -1 -1.5 -2 -2
-1.8
-1.6
-1.4
-1.2
-1 Real Axis
-0.8
-0.6
-0.4
-0.2
0
Estabilidade de Sistemas de Controle
162
(b) Fig. 4.12 – Diagramas do lugar das raízes mostrando os efeitos da adição de zeros a G(s)H(s). Exercícios: 1. Usando o procedimento de 10 passos, construa o lugar das raízes de G ( s) H ( s) =
K ( s + 1)( s + 2 − j )( s + 2 + j )
Dica – Cheque utilizando o MATLAB. 2. Utilizando o MATLAB, construa o lugar das raízes de G ( s) H ( s) =
K ( s + 2) ( s + 1)( s + 2 − j )( s + 2 + j )
Perceba que foi acrescido um zero a FT do exercício 1. Você esperava o resultado obtido?
4.4 Análise da resposta em freqüência A análise da resposta em freqüência é o coração do controle clássico. O fato de poder ser medida em laboratório e utilizada para análise sem se reportar a um modelo matemático é a sua vantagem tradicional. Sua natureza gráfica junto com seu apelo físico e intuitivo, sua habilidade para predizer a resposta em malha fechada a partir da análise em malha aberta e muitos anos de aplicação com sucesso são as principais razões para as técnicas de resposta em freqüência terem sobrevivido e terem, recentemente, sido generalizadas para manipular sistemas multivariáveis.
4.4.1 Função de transferência senoidal Pode ser mostrado que6, exceto por um período transitório, as características de resposta em freqüência de um sistema podem ser obtidas diretamente da função de transferência senoidal, a função de transferência na qual a variável s é substituída por jω. A função de transferência senoidal G(jω) é a relação entre a amplitude da senóide de saída, Y(jω), e a senóide de entrada, X(jω). Ela é uma grandeza complexa e pode ser representada pelo módulo e pelo ângulo de fase, tendo a freqüência como variável.Assim:
6
A demonstração desta afirmação é encontrada em OGATA (1993).
Sistemas de Controle
163
G ( jω ) =
Y ( jω ) X ( jω )
G ( jω ) =
Y ( jω ) X ( jω )
4.4.2 Gráficos de Bode Os gráficos de Bode são utilizados para determinar a estabilidade e a estabilidade relativa e também são usados para propósitos gerais. Eles podem ser obtidos para qualquer função de transferência, mas distingue-se entre gráficos de Bode de malha aberta e malha fechada. O gráfico de Bode da função de transferência de malha aberta pode ser usado para determinar as margens de estabilidade relativa de sistemas estáveis de malha fechada. Para facilidade de emprego, é necessário que o sistema de malha aberta seja estável e de fase mínima. Entende-se por fase mínima, o sistema que não tem nenhum zero no semiplano direito. Os gráficos de Bode também são usados para o projeto de compensadores como descreveremos no Capítulo V, fato que se constitui no seu principal emprego em sistemas de controle. Porque os gráficos de ganho e fase podem ser somados, os efeitos do compensador podem ser facilmente determinados. Os gráficos de Bode da função de transferência de malha fechada podem ser usados para determinar a largura de banda do sistema, o qual é uma medida das propriedades da filtragem e da velocidade de resposta do sistema. Como vimos, uma função de transferência senoidal, pode ser representada por dois gráficos separados, um que dá o módulo versus freqüência e outro para o ângulo de fase (em graus) versus freqüência. Um diagrama de Bode consiste de dois gráficos, um é o gráfico do logaritmo do módulo da função de transferência senoidal; o outro é um gráfico do ângulo de fase. Ambos são construídos em função da freqüência em escala logarítmica. A representação padrão do módulo logarítmico de G(jω) é 20 log G(jω), sendo a unidade o decibel (dB). A principal vantagem de usar gráfico logarítmico é que a multiplicação dos módulos é convertida em uma adição.
Fatores básicos de G(jω).H(jω) Para a construção do diagrama de Bode utilizar-se-á os seguintes fatores básicos:
Estabilidade de Sistemas de Controle
164
•
Ganho K;
•
Fatores integral e derivativo (jω)±1;
•
Fatores de 1a ordem (1 + jωT)±1;
•
Fatores quadráticos [1 + 2ς(jω/ωn) + (jω/ωn)2]±1;
Uma vez familiarizados com os gráficos dos fatores básicos, é possível utiliza-los na construção de gráficos compostos para qualquer G(jω).H(jω) esboçando-se as curvas de cada fator e adicionando-as individualmente, porque a adição dos logaritmos dos ganhes corresponde à multiplicação dos mesmos.
O Ganho K A curva logarítmica de módulo de um ganho constante K é uma horizontal de valor 20 log K (dB). O ângulo de fase do ganho K é nulo.
Os fatores integral e derivativo (jω)±1 O módulo em dB de 1/jω é: 20 log
1 = −20 log ω (dB) jω
e o ângulo de fase é constante e igual a –900. Se a expressão do logaritmo do módulo de 1/jω é colocado em um gráfico com ω na escala logarítmica, a curva resultante é uma reta com inclinação de –20 dB/década. Por sua vez, o módulo em dB de jω é: 20 log jω = 20 log ω (dB)
e o ângulo de fase é constante e igual a 900. Generalizando para os fatores (jω)± n resulta para o módulo em dB: n
20 log jω ± = ±20n log ω (dB) A inclinação da curvas do logaritmo do módulo para os fatores (jω)± n são então de ± 20n dB/décadas. O ângulo de fase será ± n x 900. As curvas de resposta em freqüência do módulo de (jω)±1 e (jω)±2 são apresentadas na Fig. 4.13.
Sistemas de Controle
165
60
jω 2 jω
40
20
0
20
jω -1 40
60
jω -2 0,1
1
10
ω
100
1 10
3
1 10
4
Fig. 4.13 – Curvas de resposta em freqüência de (jω)±1 e (jω)±2.
Fatores de 1a ordem (1 + jωT)±1 O módulo em dB de 1/(1 + jωT) é: 20 log
1 = −20 log 1 + ω 2T 2 (dB) 1 + jω T
(4.21)
Para baixas freqüências ω << 1/T, o que implica em ω2T2 << 1, e a equação (4.21) pode ser aproximada por: − 20 log 1 + ω 2T 2 = −20 log 1 = 0 dB
Para altas freqüências ω >> 1/T, o que implica em ω2T2 >> 1, e a equação (4.21) pode ser aproximada por: − 20 log 1 + ω 2T 2 = −20 log ωT
(4.22)
Em ω = 1/T, a equação (4.22) resulta em um ganho de 0 dB; em ω = 10/T, -20 dB. Portanto, o valor de (4.3) decresce 20 dB/década. A análise anterior mostra que a representação logarítmica da curva de módulo do fator 1/(1 + jωT) pode ser aproximada por duas retas assintóticas, uma de 0 dB para freqüências menores que ω = 1/T e uma outra com inclinação de –20 dB/década para freqüências maiores que ω = 1/T . A freqüência em que as duas assíntotas se interceptam, ω =
Estabilidade de Sistemas de Controle
166
1/T é denominada freqüência de canto. Assim, para obtenção do gráfico do módulo proceda da seguinte forma: 1. Localize a freqüência de canto ω = 1/T; 2. Até a freqüência de canto o ganho é 0 dB; 3. A partir da freqüência de canto o ganho decresce 20 dB por década. O ângulo de fase exato para o fator 1/(1 + jωT) é dado por:
φ = −arctgωT
(4.23)
Na freqüência zero, o ângulo de fase é 0. Na freqüência de canto, o ângulo é:
φ = −arctg 1 = −45 0 e no infinito, o ângulo de fase torna-se -900. A análise anterior mostra que para a obtenção do gráfico aproximado de fase para o fator 1/(1 + jωT), deve se proceder da seguinte forma: 1. Localize a freqüência de canto ω = 1/T; 2. Na freqüência de canto a fase é -450; 3. Uma década abaixo da freqüência de canto a fase é 00; 4. Uma década acima da freqüência de canto a fase é -900. As curvas de resposta em freqüência exatas e aproximadas do módulo e de fase de 1/(1 + jωT) são apresentadas na Fig. 4.14. O erro nas curvas causado pelo uso de assíntotas pode ser calculado. A Tabela 4.1 apresenta o módulo exato (4.21), o módulo aproximado, a fase exata (4.23), a fase aproximada e os erro provenientes do uso das aproximações assintóticas do módulo e da fase do fator 1/(1 + jωT). Observe que o erro máximo na curva de módulo causado pelo uso de assíntotas é – 3 dB na freqüência de canto. Uma vantagem do diagrama de Bode é que para fatores recíprocos, como 1 + jωT, as curvas de módulo e de fase necessitam apenas trocar de sinal, já que: 20 log 1 + jωT = −20 log
1 1 + jω T
Sistemas de Controle
167
1 + jωT = arctgωT = −
1 1 + jω T
Assim, a freqüência de canto em ambos os casos é a mesma, a inclinação da assíntota para freqüências superiores a de canto é 20 dB/década e o ângulo de fase varia de 0 a 900 conforme a freqüência varia desde 0 a infinito. As curvas de resposta em freqüência exatas e aproximadas do módulo e de fase de 1 + jωT são apresentadas na Fig. 4.15. 0 Curva aproximada
Curva exata
20
40
0.01/T
0.1/T
1/T
10/T
100/T
ω
0 Curva exata
15 30 Curva aproximada 0
φ( ) 45 60 75 90
0.01/T
0.1/T
1/T
1/10
1/100T
ω
Fig. 4.14 – Curvas de resposta em freqüência exatas e aproximadas do módulo e de fase de 1/(1 + jωT).
Estabilidade de Sistemas de Controle
168
TABELA 4.1 ERROS PROVENIENTES DO USO DAS APROXIMAÇÕES DO LOGARITMO DO MÓDULO E DA FASE DO FATOR 1/(1 + jωT) Aproximação
G
ωT
Assintótica do
(dB)
G(dB)
Aproximação
erro
o
φ( )
(dB)
Assintótica de ϕ (°)
|erro| (0)
0,01
0
0
0
-0,6
0
0,6
0,1
-0,043
0
0,043
-5,7
0
5,7
0,2
-0,17
0
0,17
-11,3
-13,5
2,2
0,5
-1
0
1
-26,6
-31,5
4,9
0,76
-2
0
2
-37,2
-39,6
2,4
1
-3
0
3
-45
-45
0
1,31
-4,3
2,34
2
-52,6
-50,3
2,3
2,0
-7
6
1
-63,4
-58,6
4,8
5,0
-14,2
14
0,2
-78,7
-76,5
2,2
10,0
-20,3
20
0,043
-84,3
-90
5,7
100
-40
40
0
-89,4
-90
0,6
Fatores quadráticos [1 + 2ς(jω/ωn) + (jω/ωn)2]±1 Fatores quadráticos do tipo [1 + 2ς(jω/ωn) + (jω/ωn)2]-1 aparecem freqüentemente em sistemas de controle. Se ς > 1, o termo quadrático pode ser fatorado segundo dois termos de primeiro ordem com pólos/zeros reais. Se 0 < ς < 1, esse fator quadrático é o produto de dois termos complexos conjugados e será traçado o diagrama do fator em vez de fatorá-lo. O módulo em dB e a fase do fator quadrático são obtidos de:
2 ⎛ ⎜1 − ω 20 log − = 20 log 2 ⎜ ω 2 ⎛ ω ⎞ ⎛ ω ⎞ n ⎝ ⎟⎟ + ⎜⎜ j ⎟⎟ 1 + 2ς ⎜⎜ j ⎝ ωn ⎠ ⎝ ωn ⎠
1
2
⎞ ⎛ ⎟ + ⎜ 2ς ω ⎟ ⎜ ωn ⎠ ⎝
⎞ ⎟⎟ ⎠
2
(4.24)
Sistemas de Controle
169
40
20 Curva exata
0
0.01/T
0.1/T
1/T
10/T
100/T
ω
90 75 60 Curva aproximada
φ( 0 ) 45 30
Curva exata
15 0
0.01/T
0.1/T
1/T
10/T
100/T
ω
Fig. 4.15 – Curvas de resposta em freqüência exatas e aproximadas do módulo e de fase de 1 + jωT. ⎤ ⎡ ω ⎥ ⎢ 2ς ωn ⎥ ⎢ 1 arctg = − φ =⎢ ⎥ 2 ω2 ⎛ ω ⎞ ⎛ ω ⎞ ⎥ ⎢ 1 − ⎢1 + 2ς ⎜⎜ j ω ⎟⎟ + ⎜⎜ j ω ⎟⎟ ⎥ ωn2 n ⎠ ⎝ n ⎠ ⎦ ⎝ ⎣
(4.25)
A partir de (4.24) vê-se que para baixas freqüências ω << ωn e o log do módulo resulta em: - 20 log 1 = 0 dB
Estabilidade de Sistemas de Controle
170
Logo, a assíntota de baixa freqüência é uma reta horizontal em 0 dB. Parta altas freqüências tais que ω >> ωn, o log do módulo torna-se:
− 20 log
ω2 ω = −40 log dB 2 ωn ωn
e a assíntota de alta freqüência possui uma inclinação de –40 dB/década. As assíntotas se interceptam em ω = ωn, já que nessa freqüência:
− 40 log 1 = 0 As duas assíntotas que acabamos de deduzir são independentes de ς, o que não ocorre com as curvas exatas obtidas a partir das equações (4.24) e mostradas na Fig. 4.16. Como se vê, próximo a freqüência de canto ωn ocorre um pico de ressonância, tanto maior quanto menor for o coeficiente de amortecimento. Assim, o erro proveniente da aproximação assintótica depende de ς. A partir de (4.25), observa-se que o ângulo de fase é uma função de ω e de ς. Em
ω = 0, o ângulo de fase é 0; Na freqüência de canto, é –900, independente de ς, já que:
φ = −arctg
2ς = −arctg∞ = −90 0 0
Em ω = ∞, o ângulo de fase é -1800. Não há maneira simples de traçar a curva de fase, sempre que necessário é preciso remeter-se às curvas da Fig. 4.16. As curvas de resposta em freqüência para o fator 1 + 2ς(jω/ωn) + (jω/ωn)2 podem ser obtidas invertendo-se o sinal das curvas de log-módulo e de fase do fator [1 + 2ς(jω/ωn) + (jω/ωn)2]-1
Sistemas de Controle
171
Fig. 4.16 – Curvas do log-módulo conjuntamente com as assíntotas e curvas do ângulo de fase do fator quadrático.
Procedimento geral para traçado de gráficos de Bode: 1. Reescreva a função de transferência senoidal G(jω)H(jω) como um produto dos quatro fatores básicos apresentados; 2. Identifique as freqüências de canto associadas a estes fatores básicos; 3. Desenhe as curvas assintóticas do logaritmo do módulo fazendo as correções apropriadas e, quando possível, a curva do ângulo de fase para cada fator básico; 4. Finalmente, adicione as curvas de módulo e de fase dos fatores individuais.
Exemplo 4.8: Desenhar um diagrama de Bode para a função de transferência de malha aberta
G ( s) =
100 s( s + 10)( s + 1)
Estabilidade de Sistemas de Controle
1.
Substituindo s por jω e reescrevendo em termos dos fatores básicos resulta:
G ( jω ) =
2.
172
100 10 = 1 1 jω 10 ⋅ ( jω + 1)( jω + 1) jω ⋅ ( jω + 1) ⋅ ( jω + 1) 10 10
As freqüências de canto associadas são: Para (jω1/10+1)-1 temos como freqüência de canto ω = 1/T = 10. Para (jω+1)-1 temos como freqüência de canto ω = 1.
3.
As curvas assintóticas do logaritmo do módulo e da fase para cada fator são traçadas e mostradas na Fig. 4.17;
4.
Adicionam-se os termos individuais, conforme mostra a Fig. 4.17.
60
jω-1
40
G(jω) 20log10
20 db
0 (jω/10+1)
(jω+1)-1
20
-1
40
60 0,01
0,1
1
ω
10
100
1000
100
1000
0
(jω/10+1)-1 -45
-90
ϕ(°)
(jω+1)-1
jω-1
-135
G(jω)
-180
-225
-270
0,01
0,1
1
ω
10
Fig. 4.17 – Diagrama de Bode aproximado do sistema do exemplo 4.6.
Sistemas de Controle
173
)Usando o MATLAB para traçar os Diagramas de Bode As curvas exatas podem ser traçadas utilizando-se o software MATLAB, digitando-se os seguintes comandos: >> num=100; den=poly([0 -1 -10]); w =logspace(-2,3,1000); >> [m,p]=bode(num,den,w); >> subplot(211); semilogx(w,20*log10(m)); subplot(212); semilogx(w,p);
A primeira linha de comando define o numerador de G(jω) como 100, define o denominador através de seus zeros e o eixo da freqüência usando o comando logspace. O comando logspace produz um vetor linha de pontos logaritmicamente espaçados de 10-2 a 103 com 1000 pontos. A segunda linha define o traçado do módulo “m” e da fase “p” de G(jω) em um diagrama de Bode. A terceira linha gera os gráficos, sendo que o primeiro comando divide a tela em duas metades e coloca o módulo na metade de cima; o segundo comando define um gráfico semilogarítmico; o terceiro e o quarto comando colocam a fase na metade inferior. As curvas exatas, semelhantes às aproximadas, são mostradas na Fig. 4.18. 100 50 0 -50 -100 -150 -2 10
10
-1
10
0
10
1
10
2
10
3
-50 -100 -150 -200 -250 -300 -2 10
10
-1
10
0
10
1
10
2
10
Fig. 4.18 – Diagrama de Bode exato do sistema do exemplo 4.8.
3
Estabilidade de Sistemas de Controle
174
Uma forma alternativa de introduzir o denominador de G(jω) é multiplicar os termos, obtendo-se s3 + 11s2 + 10s. A linha de comando substitui a primeira linha de comando: >> num=100; den=[1, 11, 10, 0]; w=logspace(-2,3,1000);
Quando não se deseja gerar os valores de módulo e fase em função de ω, os Diagramas de Bode podem ser traçados utilizando o comando >> bode(num,den);
)Funções do MATLAB que aprendemos a utilizar: 9 bode;
Exercício: Desenhar um diagrama de Bode para a função de transferência de malha aberta G ( s) =
4(1 + 0,5s ) s (1 + 2 s )[1 + 0,05s + (0,125s ) ] 2
Observação: Para colocar no MATLAB recomenda-se alterar a forma de G(s) conforme o procedimento abaixo:
G(s) =
4 ⋅ 0,5 ⋅ ( s + 2) 64 ⋅ ( s + 2) = 2 2 s ( s + 0,5)( s + 1,6 − j 7,84)( s + 1,6 + j 7,84) 2 s ⋅ ( s + 0,5) ⋅ 0,125 ⋅ [ s + 3,2 s + 64] As raízes de s2 + 3,2s + 64 podem ser encontradas no MATLAB através do
comando roots como segue: >> [quad]=[1 3.2 64]; >> [raizes]= roots(quad)
4.4.3 Estabilidade relativa e resposta em freqüência A estabilidade de um sistema pode ser estudada, também, a partir da sua resposta em freqüência obtida, por exemplo, do Diagrama de Bode. A condição de estabilidade é dada pela equação característica:
1 + KG( s ) H ( s ) = 0 ou,
Sistemas de Controle
175
KG ( s ) H ( s ) = 1
∠ G ( s ) H ( s ) = −180 0 Haverá um determinado ganho K = KC em uma freqüência ω = ωC que levará o sistema a condição no limiar da instabilidade (pólos sobre o eixo imaginário jω), que corresponde a: K C G ( jω C ) H ( jω C ) = 1
∠ K C G ( jω C ) H ( jω C ) = −180 0 Conclui-se que o sistema é estável desde que KG ( jω ) H ( jω ) < 1 na freqüência onde ∠ G ( jω ) H ( jω ) = −180 0 . Esta conclusão não é geral, pois existem sistemas estáveis que não satisfazem essa condição. Para uma conclusão geral, o aluno deve utilizar o critério de estabilidade de Nyquist, encontrado na literatura.
4.4.4 Margens de estabilidade Muitas vezes é desejável conhecer a qual distância da instabilidade um sistema se encontra. No domínio da freqüência, as margens de fase e de ganho fornecem uma indicação dessa distância, tornando-se indicadores úteis na análise e projeto e projeto de sistemas de controle fase .
Ponto de fase crítica – é o ponto do diagrama no qual a fase da função de transferência de malha aberta KG(jω)H(jω) é -1800. A freqüência nesse ponto é chamada freqüência de cruzamento de fase ωφ.
Margem de Ganho (MG) – é o fator pelo qual deve ser multiplicado o ganho para se produzir instabilidade. Em termos da função de transferência na freqüência de cruzamento de fase ωφ, tem-se
KG ( jω φ ) H ( jω φ ) ⋅ MG = 1 ou em dB: 20 log KG ( jω φ ) H ( jω φ ) + 20 log MG = 0
Estabilidade de Sistemas de Controle
176
A equação acima nos leva a uma definição alternativa, a saber, a margem de ganho é o fator que deve ser somado ao ganho em dB para levar o sistema ao limiar da instabilidade. A Fig. 4.19 mostra a margem de ganho de um sistema estável e de um sistema instável em um Diagrama de Bode. Para o sistema ser estável a margem de ganho em decibéis deve ser positiva.
Ponto de ganho crítico – é o ponto do diagrama no qual o módulo da função de transferência de malha aberta KG(jω)H(jω) é unitário. A freqüência nesse ponto é chamada freqüência de cruzamento de ganho ωG.
Margem de Fase (γ) – É o atraso de fase adicional na freqüência de cruzamento de ganho ωG necessário para levar o sistema ao limiar de instabilidade. A margem de fase γ é 1800 mais o ângulo de fase φ de KG(jω)H(jω) na freqüência de cruzamento, ou
γ = 1800 + φ A Fig. 4.19 mostra a margem de fase de um sistema estável e de outro instável em um Diagrama de Bode. Para o sistema ser estável a margem de fase deve ser positiva.
Comentários – Para um sistema ser estável, tanto a margem de fase como a margem de ganho devem ser positivas. Margens negativas indicam instabilidade. Para alcançar um desempenho satisfatório a margem de fase deve estar entre 300 e 600 e a margem de ganho deve ser maior que 6 dB. À medida que você adquirir experiência o valor da margem de fase a ser utilizada tornar-se-á mais evidente. Esta orientação relativa ao desempenho do sistema se aplica a sistemas cujo comportamento seja equivalente ao de um sistema de segunda-ordem, ou seja, sistemas de ordem mais alta que possuam um par dominante de pólos. Na maioria dos casos práticos uma inclinação de –20 dB/década do módulo da função de transferência de malha aberta na freqüência de cruzamento garante a estabilidade do sistema (lembre que o fator (1 + jω)-1 apresenta um módulo com inclinação de –20 dB/década a partir da freqüência de canto e fase que varia de 0 a –900). Se esta inclinação for de –40dB/década, o sistema pode ser estável ou instável; no caso de –60 dB/década, o sistema provavelmente é instável.
Sistemas de Controle
177
ωG
Margem de ganho +
ωφ
0
db
-100
graus -180
Margem de fase +
log ω
-270
(a) Margem de ganho 0
ωφ
db
ωG
-100
graus
log ω -180
Margem de fase -270
(b) Fig. 4.19 – (a) Diagrama de Bode de um sistema estável e (b) de um sistema instável. Exercício: Encontre a margem de fase e a margem de ganho do sistema abaixo:
G ( jω ) =
10 jω ( jω + 1)( j 0,2ω + 1)
a. Construindo os diagramas de bode assintóticos; b. Utilizando o comando margin do MATLAB:
Estabilidade de Sistemas de Controle
178
>> [mg,mf,wf,wg] = margin(m,p,w);
onde mg é a margem de ganho, mf é a margem de fase, wf é a freqüência onde a fase é – 1800 e wg é a freqüência de cruzamento (ganho 0 dB).
)Funções do MATLAB que aprendemos a utilizar: 9 margin;
4.4.5 Relação entre margem de fase e amortecimento Em um sistema de segunda ordem, a margem de fase e o amortecimento em um sistema de malha fechada guardam uma relação direta. A relação aqui obtida pode ser generalizada para sistemas de ordem mais elevada que tenham um par de pólos dominantes. O sistema de segunda ordem representado pela equação (3.10) possui a seguinte função de transferência de malha aberta:
G ( s) =
ω n2 ω n2 = s( s + 2ςω n ) s ( s + 2ςω n )
A função de transferência senoidal resulta em:
ω n2 ω n2 G ( jω ) = = jω ( jω + 2ςω n ) j 2ςω n ω − ω 2 função de transferência que apresenta módulo igual a:
1
G ( jω ) = j 2ς
ω ⎛ω ⎞ ⎟ −⎜ ω n ⎜⎝ ω n ⎟⎠
2
1
= ⎛⎛ ω ⎜⎜ ⎜ ⎜⎝ ω n ⎝
⎞ ⎟⎟ ⎠
2
2
⎞ ⎛ ⎟ + ⎜ 2ς ω ⎟ ⎜⎝ ω n ⎠
⎞ ⎟⎟ ⎠
2
A freqüência de cruzamento de ganho ocorre quando |G(jω)| = 1. Assim: ⎛⎛ ω ⎜⎜ G ⎜ ⎜⎝ ω n ⎝
⎛ω Fazendo ⎜⎜ G ⎝ ωn
⎞ ⎟⎟ ⎠
2
2
⎞ ⎛ ω ⎟ + ⎜ 2ς G ⎟ ⎜⎝ ω n ⎠
2
⎞ ⎟ =1 ⎟ ⎠
2
⎞ ⎟⎟ = y, resulta: ⎠ y 2 + 2ςy − 1 = 0
Sistemas de Controle
179
Que possui com raiz positiva: ⎛ω y = ⎜⎜ G ⎝ ωn
2
⎞ ⎟⎟ = 4ς 4 + 1 − 2ς 2 ⎠
Assim, a freqüência de cruzamento de ganho será:
ωG = ωn
4ς 4 + 1 − 2ς 2
(4.26)
Nesta freqüência o ângulo de fase será: ∠G(jω) = -∠ jω-∠ jω+ 2ςω n = -900 - arctg
4ς 4 + 1 − 2ς 2 2ς
Assim, a margem de fase γ resulta em: 0
4ς 4 + 1 − 2ς 2
0
γ = 180 +∠G(jω) = 90 – arctg γ = arctg
2ς
2ς 4ς + 1 − 2ς 4
(4.27) 2
A equação (4.27) fornece a relação entre margem de fase γ e o coeficiente de amortecimento ς. A Fig. 4.20 fornece um gráfico apresentando essa relação direta. 90o
60o
30o
0o 0
0,4
0,8
1,2
1,6
2,0
Fig. 4.20 – Curva de margem de fase versus coeficiente de amortecimento para o sistema de segunda ordem representado pela equação (3.10).
Estabilidade de Sistemas de Controle
180
Percebe-se na Fig.4.20 que para o sistema de segunda ordem padrão a margem de fase γ e o coeficiente de amortecimento ς, para 0 ≤ ς ≤ 0,6, estão relacionados pela razão:
γ = 100 ( 0 ) ς razão que representa uma relação importante entre a margem de fase e o amortecimento. Conforme vimos no capítulo III para um desempenho transitório apropriado os sistemas de segunda ordem, ou aqueles que podem ser reduzidos a estes, devem ser projetados com ς entre 0,4 e 0,8, o que resulta numa margem de fase entre 450 e 700. Em alguns sistemas pode-se ter várias passagens por 0 dB ou –1800, sendo as margens de ganho e fase definidas de maneira não única. Em outros, pode-se ter conflito entre a margem de fase e a margem de ganho, por exemplo, uma positiva e outra negativa. Nesses casos, devemos, para dirimir as dúvidas, utilizar o critério de Nyquist, não apresentado nesse curso. Exemplo 4.9 – Considere o sistema de retroação unitária com a função de transferência de malha aberta dada por ( s + 1)( s 2 + 2 s + 43.25) G ( s) = s ( s 2 + 2s + 82) A FT de malha aberta apresenta os zeros, pólos e o ganho mostrados a seguir, obtidos no MATLAB com a ajuda do comando tf2zp: >> num=[1 3 45.25 43.25]; den=[1 2 82 0]; >> [z,p,k] = tf2zp(num,den) z= -1.0000 + 6.5000i -1.0000 - 6.5000i -1.0000 p= 0 -1.0000 + 9.0000i -1.0000 - 9.0000i k= 1
Sistemas de Controle
181
Percebe-se que a FT de malha aberta não possui zeros no semiplano direito de s, constituindo-se num sistema de fase mínima. Caso a FT apresentasse zeros no semiplano direito, teríamos um sistema de fase não mínima7. Podemos obter a função de transferência de malha fechada do sistema com a ajuda do comando cloop como segue: >> [nmf,dmf]=cloop(num,den); >> printsys(nmf,dmf)
num/den =
s^3 + 3 s^2 + 45.25 s + 43.25 ------------------------------------------2 s^3 + 5 s^2 + 127.25 s + 43.25
que não possui pólos nem zeros no semiplano direito do plano s: >> [z,p,k] = tf2zp(nmf,dmf)
z=
-1.0000 + 6.5000i -1.0000 - 6.5000i -1.0000
p=
-1.0781 + 7.8563i -1.0781 - 7.8563i -0.3439
k=
0.5000
Finalmente, traçamos, com as linhas de comando mostradas a seguir, o Diagrama de Bode mostrado na Fig. 4.21.
7
Uma discussão sobre sistemas de fase não mínima é apresentada em Dorf (2001, p. 424-426).
Estabilidade de Sistemas de Controle
182
>> num=[1 3 45.25 43.25]; den=[1 2 82 0]; >> w=logspace(-2,2,1000); >> [m,p]=bode(num,den,w); >> subplot(211);semilogx(w,20*log10(m));subplot(212);semilogx(w,p);
40
20
0
-20 10
-2
10
-1
10
0
10
1
10
2
100 50 0 -50 -100 -2 10
10
-1
10
0
10
1
10
2
Fig. 4.21 – Diagrama de Bode do Exemplo 4.7. No diagrama da Fig. 4.21 percebemos que o sistema apresenta duas freqüências de cruzamento de ganho e não possui margem de ganho, o que limita o uso das margens de ganho e fase.
Exercício Seja um sistema de controle em malha fechada que apresenta G (s) =
25 2600 K e H (s) = s + 25 s(s + 100s + 2600 ) 2
Pede-se: Utilizando o MATLAB trace o Lugar das Raízes do sistema e determine: a) O ponto de ruptura sobre o eixo real;
Sistemas de Controle
183
b) O valor de K que torna o sistema instável e as raízes do sistema em malha fechada para este valor de K; c) Determinar a C(s)/R(s) com ς = 0,5 para as raízes dominantes; d) Obtenha a resposta a degrau do sistema para a condição do item c. Obtenha o Diagrama de Bode do sistema para K = 11 e determine: e) As margens de fase e de ganho e as freqüências de cruzamento de ganho e de fase. f) O sistema é estável? g) Trace o Diagrama de Bode para K = 36,6. Observe o diagrama e diga em que condição o sistema se encontra.
Respostas. (a) - 9,15; (b) 36,6 ; ± j22,8 ; -62,5 ± j26 C(s)
23972(s + 25)
23972(s + 25)
(c) R(s) = (s + 6,57 − j11,4)(s + 6,57 + j11,4)(s + 55,9 + j18)(s + 55,9 + j18) = (s 2 + 13,14s + 173,12)(s 2 + 111,8s + 3450) (e) 46,9o ; 10,45 ; 9,9 ; 22,8; (f) Sim, as margens de fase e de ganho são positivas.
Sistemas de Controle
185
5. PROJETO DE SISTEMAS DE CONTROLE UTILIZANDO O LUGAR DAS RAÍZES E OS DIAGRAMAS DE BODE
5.1 Introdução O projeto clássico de sistemas de controle é geralmente realizado usando descrições por funções de transferência. As técnicas mais populares são o projeto com o lugar das raízes e com os Diagramas de Bode. As especificações de malha fechada são freqüentemente dadas em termos de erro de regime permanente e de parâmetros desejados do sistema na resposta a degrau como tempo de subida, tempo de pico, tempo de acomodação, sobresinal, etc. Os parâmetros de resposta a degrau são utilizados para derivar as características desejadas em malha aberta no domínio da freqüência de margem de ganho e de fase. Uma vantagem de usar o computador para assistir o projeto de sistemas de controle é que a resposta de malha fechada pode ser modelada e analisada, o que permite ajustar o projeto quando necessário. Há várias configurações que podem ser utilizadas para adequar a resposta de uma planta ou realizar a sua compensação. Os dois controladores mais comumente usados são o controlador proporcional-integral-derivativo e o avanço-atraso de fase.
5.2 Compensador em avanço de fase A forma mais comum e simples de compensação é um filtro com um zero e um pólo. A função de transferência geral para este compensador é GC ( s ) = K C
s+a s+b
Projeto de Sistemas de Controle Utilizando o Lugar das Raízes e os Diagramas de Bode
186
Se o zero ocorrer antes do pólo (0 < a < b), GC(s) é conhecido como compensador em avanço de fase; Se o pólo ocorrer antes do zero (a > b > 0), GC(s) é um compensador em atraso de fase. A contribuição máxima de fase ocorre em ω = a ⋅ b . O projetista saberá qual compensador usar de acordo com as especificações do sistema. Por exemplo, se uma certa freqüência de cruzamento de ganho ωG é desejada, um exame dos diagramas de Bode da planta determinará o tipo de compensador: se uma freqüência de cruzamento de ganho maior que a da planta for desejada, será necessário um compensador em avanço; se menor, um compensador em atraso. Ao utilizarmos as técnicas clássicas para a compensação, devemos lembrar que todos estes procedimentos assumem que a planta pode ser descrita por um par dominante de pólos. A resposta real em malha fechada variará um pouco em relação a predita no projeto. Sempre devemos fechar a malha, simular o sistema completo e, quando necessário, fazer ajustes. Todo o compensador afeta a estabilidade e o erro em regime permanente. A compensação em avanço, em geral, incrementa a estabilidade relativa pelo aumento da margem de fase e para um dado KC, incrementa o erro em regime. Isto ocorre porque como a < b, significa que KC(a/b) < KC. Para diminuir o erro de regime, um grande KC deve ser usado. Um compensador em avanço incrementa, também, a freqüência de cruzamento de ganho ωG, que por sua vez guarda uma relação com a freqüência natural ωn, conforme mostra a Fig. 5.1. Considerando o amortecimento constante, essa característica ocasiona uma diminuição do tempo de acomodação, uma vez que τ = 1 / ςωn.
Fig. 5.1 – Freqüência de cruzamento de ganho normalizada ωG/ωn versus coeficiente de amortecimento ς.
Sistemas de Controle
187
5.2.1 Projeto com o lugar das raízes O projeto com lugar nas raízes busca remodelar o lugar das raízes do sistema pela adição de pólos e zeros a planta, o que força o diagrama a passar através de um ponto desejado no plano complexo. Em nosso texto apresentaremos um método analítico que pode ser utilizado para projetar os compensadores em avanço e atraso. Aqui, representa-se o compensador por: G C (s) = K C
τzs + 1 τps + 1
(5.1)
Primeiro escolhe-se KC e o ponto s1 do plano s, a partir das especificações de erro de regime permanente e de resposta transitória. Para o ponto s1 pertencer ao lugar das raízes τ z s1 + 1 M G e jθG = 1e jπ τ p s1 + 1
G C (s 1 )G (s1 )H (s1 ) = K C
(5.2)
Como KC é conhecido, é preciso resolver a equação (5.2) para τz e τp. Se s1 é representado por s1 = Msejθs, resulta: Mse
j θs
τz + 1 =
1e jπ KC ⋅ MGe
jθ G
(
)
⋅ M s e jθs τ p + 1
(5.3)
Esta equação pode ser separada em partes real e imaginária, resultando em duas equações e duas incógnitas. A solução dessas equações é: τz =
sen θ s − K C M G sen(θ G − θ s ) K C M G M s sen θ G
(5.4)
e τp = −
K C M G sen θ s + sen(θ G + θ s ) M s sen θ G
(5.5)
Exemplo 5.1 – Dada a planta G ( s) =
400 s ( s + 30 s + 200) 2
Considerando realimentação unitária, o sistema apresenta as seguintes características: •
Pólos de malha fechada: -21,6; -4,2015 + j0,9320; -4,2015 - j0,9320;
Projeto de Sistemas de Controle Utilizando o Lugar das Raízes e os Diagramas de Bode
•
Freqüência de cruzamento de ganho: 1,95 rad/s;
•
Freqüência de cruzamento de fase: 14,1 rad/s;
•
Margem de ganho: 23,5 dB;
•
Margem de fase: 73,4o;
188
Como o coeficiente de amortecimento é ς = 0,9 (da Fig. 4.20 com γ = 73,4o) e ωn = 3,5 rad/s (da Fig. 5.1 com ς = 0,9), a resposta a degrau do sistema em malha fechada não apresenta sobre-sinal e o coeficiente de erro de velocidade estático KV é:
400 =2 s →0 s + 30 s + 200
KV = lim sG ( s) H ( s) = lim s →0
2
resultando em um erro em regime permanente a rampa unitária: e ss =
1 = 0,5 2
Obs.: ς e ωn podem ser obtidos também (com boa aproximação) através da eq. Característica de 2ª ordem, desde que cosideremos os pólos complexos e conjugados como dominantes.
Deseja-se, agora, alterar as especificações do sistema para: •
coeficiente de erro de velocidade estático KV = 10 ;
•
ς = 0,5 e ωn = 13,5 rad/s
Primeiro, calcula-se KC, como segue: K V = lim sG ( s ) H ( s ) = lim s →0
s →0
400 K C 2
s + 30s + 200
= 10
400 K C = 10 ⇒ K C = 5 200 Para atender as especificações de amortecimento e freqüência, resulta que: s1 = -ςωn + jωn 1 − ς 2 = - 6,75 + j11,69 = 13,49 e j120 = Ms e jθs Substituindo-se 13,49 e j120 em G(s), obtém-se G(s1) = 0,14 e j124,17 = MG e jθG. Substituindo –se KC, MG, MS, θG e θS em (5.4) e (5.5), resulta: τz = 0,11 e τp = 0,030.
Sistemas de Controle
189
Assim, o compensador que satisfaz as especificações é: GC = 5
0,11s + 1 0,030s + 1
A resposta ao degrau para o sistema em malha fechada antes e após a compensação é mostrada na Fig. 5.2. O sistema compensado possui um sobre-sinal de 15% e um tempo de acomodação ts2% de cerca de 0,6 s. Para efeito de comparação, foi traçada, na mesma figura, a resposta a degrau do sistema compensado apenas por um controlador proporcional KC = 5. Percebe-se que o compensador em avanço reduz o sobre-sinal e os tempos de resposta. O lugar das raízes para o sistema não compensado e compensado é mostrado na Fig. 5.3, onde podemos notar que o compensador em avanço de fase permite, .
ainda, incrementar o ganho do sistema em até 25 vezes (5 KC) contra 15 do sistema não compensado, aumentando a margem de estabilidade.
Resposta ao degrau 1.4
Sistema com compensador proporcional 1.2
Sistema compensado
1
0.8
Sistema não-compensado 0.6
0.4
0.2
0
0
0.5
1
t (s)
Fig. 5.2 – Resposta ao degrau do sistema do exemplo 5.1.
1.5
Projeto de Sistemas de Controle Utilizando o Lugar das Raízes e os Diagramas de Bode
190
Root Locus 40 System: sys Gain: 15.1 Pole: 0.024 + 14.2i Damping: -0.00169 Overshoot (%): 101 Frequency (rad/sec): 14.2
30
20
Imaginary Axis
10
0
-10
-20
-30
-40 -60
-50
-40
-30
-20
-10
0
10
20
Real Axis
Root Locus 80 System: sys Gain: 5.08 Pole: -0.0917 + 26.3i Damping: 0.00348 Overshoot (%): 98.9 Frequency (rad/sec): 26.3
60
40
Imaginary Axis
20
0
-20
-40
-60
-80 -100
-80
-60
-40
-20
0
20
40
Real Axis
Fig. 5.3 – Lugar das Raízes antes e após a compensação para o sistema do Exemplo 5.1.
Sistemas de Controle
191
)Usando o MATLAB para calcular os parâmetros do compensador Os parâmetros τz e τp podem ser obtidos no MATLAB, através da seguinte seqüência de comandos: >> s1 = -6.75 + 11.69i; >> ms = abs(s1) ms = 13.4988 >> ts = angle(s1) ts = 2.0944 >> num = 400; den = [1 30 200 0]; >> ds1 = polyval(den,s1) ds1 = -1.6231e+003 – 2.3961e+003i >> g = num/ds1 g = -0.075 + 0.1144i >> mg = abs(g) mg = 0.1382 >> tg = angle(g) tg = 2.1662 >> tauz = (sin(ts) – 5*mg*sin(tg – ts)) / (5*mg*ms*sin(tg)) tauz = 0.1057 >> taup = - (5*mg*sin(ts) + sin(tg + ts)) / (ms*sin(tg)) taup = 0.027
5.2.2 Projeto com o Diagrama de Bode A idéia básica do projeto com diagramas de Bode é modelar a forma da função de transferência de malha aberta tal que ela apresentará um ganho de baixa freqüência desejável, uma freqüência de cruzamento de ganho apropriada e uma margem de estabilidade adequada. É comum parametrizar o compensador como se apresenta em (5.6): GC ( s ) = K C
αTs + 1 Ts + 1
= K C K1 ( s )
(5.6)
Projeto de Sistemas de Controle Utilizando o Lugar das Raízes e os Diagramas de Bode
192
A Fig. 5.4 apresenta o diagrama de Bode de um compensador em avanço de fase com KC = 1, e α = 10. Abaixo, assinalam-se valores típicos de um compensador em avanço de fase. 20 15 db
10 5 0 60 40
0
( ) 20 0 0,01/T
0,1/T
10/T
1/T
100/T
ω (rad/s)
Fig. 5.4 – Diagrama de Bode de um compensador em avanço de fase. Ao empregar o método de Bode, escolhemos primeiro o ganho KC que satisfará aos requisitos de erro de regime. Após, satisfazemos os requisitos de margem de fase, atentos a freqüência de cruzamento de ganho ωG, atuando em K1(s). A fase do compensador em avanço é: ∠ K1 (jω) = arctg (αTω) - arctg(Tω) Para facilitar o projeto, geralmente tentamos adicionar o máximo avanço de fase possível em ω = ωG. A freqüência na qual esse avanço máximo de fase ocorre pode ser obtida da expressão acima por manipulação trigonométrica e é dada por:
ω máx = ω G =
1
(5.7)
αT
e a máxima fase que pode ser alcançada é: ∠ K1 (jωmáx) = ∠ K1 (jωG) = φ = arctg α − arctg Finalmente, a trigonometria mostra que:
1
α
Sistemas de Controle
193
sen φ =
α −1 α +1
e,
α= em ω máx =
1
αT
1 + sen φ 1 − sen φ
(5.8)
.
O módulo adicional proporcionado por K1(s) em dB em ω = ωmáx = ωG é: M = | K1 (jωmáx)|dB = 10 log α
(5.9)
Estas considerações nos levam ao seguinte procedimento para definir o compensador: 1. Selecione KC para alcançar a constante de erro requerida; 2. Desenhe o diagrama de Bode para KCG(jω) e determine a margem de fase; 3. Determine a fase adicional requerida, isto é, o φ de partida; 4. Adicione uns poucos graus, cerca de 5o, a fase recém determinada para encontrar o φ de trabalho. A razão para adicionar esses poucos graus ao avanço de fase necessário para se obter a margem de fase desejada é que o zero do compensador acrescentado causará um aumento na freqüência de cruzamento de ganho ωG. 5. Calcule α utilizando (5.8); 6. Encontre a freqüência na qual KCG(jω)= −10 log α. Esse valor será a freqüência ωG compensada. 7. Calcule T utilizando (5.7) e αT; 8. Desenhe o diagrama de Bode de GC(jω)G(jω) para conferir o projeto; 9. Finalmente, feche a malha e determine a resposta em malha fechada. É importante notar que com este procedimento de projeto não podemos predeterminar a ωG compensada. Caso ela seja inaceitável, teremos que ajustar a margem de fase ou o erro de regime requerido.
Projeto de Sistemas de Controle Utilizando o Lugar das Raízes e os Diagramas de Bode
194
EXEMPLO 5.2 – Dada a planta G ( s) =
400 s ( s + 30 s + 200) 2
Deseja-se, agora, alterar as especificações do sistema para: •
Coeficiente de erro de velocidade estático KV = 10;
•
Margem de fase: 45o;
Seguiremos os passos descriminados anteriormente: 1. KC é calculado como segue: K V = lim sG ( s ) H ( s ) = lim s →0
s →0
400 K C s 2 + 30s + 200
= 10
400 K C = 10 ⇒ K C = 5 200 2. O Diagrama de Bode de KCG(jω) é apresentado na Fig. 5.5. 40 20 0 -20 -40 -60 -1 10
10
0
10
1
10
2
-50 -100 -150 -200 -250 -1 10
10
0
10
1
2
10 log ω
Fig. 5.5 – Diagrama de Bode de módulo e fase de KCG(jω) obtido no MATLAB para o Exemplo 5.2. 3. A Fig. 5.5 indica que o a margem de fase é 33o. Como queremos 45o, o φ de partida será de aproximadamente 12o. 4. Adicionando 5o a esse valor obtemos φ = 17o.
Sistemas de Controle
195
5. Aplicando φ = 17o na expressão (5.8) obtemos α = 1,82. 6. Calcula-se -10 log α = -2,6 dB. Examinando a Fig. 5.5 verifica-se que esse ganho ocorre em ω = 9 rad/s. Esse valor será a ωG compensada. 7. Utilizando (5.7); calcule T =
1 1,82 ⋅ 9
= 0,082 ⇒ αT = 0,15
8. O Compensador será: GC ( s ) = 5 ⋅
0.15s + 1 0.082 s + 1
Assim, GC(jω)G(jω) = 5 ⋅
0.15s + 1 400 3659( s + 6,67) ⋅ = 2 0.082 s + 1 s ( s + 30 s + 200) s ( s + 12,2)( s + 10)( s + 20)
O Diagrama de Bode de GC(jω)G(jω) é apresentado na Fig. 5.6 e mostra uma nova margem de fase de 40o e uma freqüência de cruzamento de ganho ωG = 9 rad/s. Para obter uma margem de fase mais próxima a 45o deveríamos repetir o procedimento a partir do passo 4, aumentando a quantidade de graus adicionada. 40 20 0 -20 -40 -1 10
0
1
10
10
2
10
-50 -100 -150 -200 -250 -1 10
0
1
10
10
2
10
log ω
Fig. 5.6 – Diagrama de Bode de módulo e fase de GC(jω)G(jω) obtido no MATLAB para o Exemplo 5.2.
Projeto de Sistemas de Controle Utilizando o Lugar das Raízes e os Diagramas de Bode
196
9. A resposta ao degrau para o sistema em malha fechada é mostrada na Fig. 5.7, para o sistema antes e após a compensação. No sistema compensado verificamos um sobre-sinal de 29% e um tempo de acomodação tS2% = 1 s. Uma maneira de implementar o compensador em avanço de fase é mostrada na Fig.5.8. Pode ser mostrado (tente) que a função de transferência do circuito da Fig. 5.8 é: E 0 ( s ) R2 R4 R1C1 s + 1 αTs + 1 = ⋅ = KC ⋅ Ei ( s ) R1 R3 R2 C 2 s + 1 Ts + 1
(5.10)
Assim: KC ⋅ =
R2 R4 R1 R3
T = R2 C 2
Como αT = R1C1 , obtém-se:
α=
R1C1 R2 C 2
Da equação (5.10), percebe-se que esta rede será em avanço de fase caso R1C1 > R2C2 ou α > 1; caso R1C1 < R2C2 a rede será em atraso. 1.4
Compensado 1.2
1
0.8
0.6
0.4
0.2
0
0
0.2
0.4
0.6
0.8
1
1.2
1.4
1.6
1.8
2 s
Fig. 5.7 – Resposta ao degrau do sistema do exemplo 5.2.
Sistemas de Controle
197
C2 R4 R2
C1
Ei(s)
R3
R1
+
E0(s)
+
Fig.5.8 – Implementação de um compensador em avanço (ou atraso) de fase usando amplificadores operacionais.
5.3 Compensador em atraso de fase Em um compensador em atraso de fase, o polo é menor do que o zero. Porque a compensação em atraso adiciona um atraso de fase ao sistema, ela tende a desestabilizá-lo. Por esse motivo, ele não deve ser usado se a planta é instável ou apresenta pequenas margens de estabilidade relativa. Entretanto, a compensação em atraso pode algumas vezes ser usado para incrementar a estabilidade pela diminuição do ganho do sistema. A compensação em atraso de fase decresce o erro de regime. Na equação do compensador em avanço-atraso de fase G C (s) = K C atraso temos a > b e, assim, K C
s+a , no caso da compensação em s+b
a > KC, o que leva a um decréscimo do erro de regime b
permanente. A compensação em atraso de fase decresce a freqüência de cruzamento de ganho ωG, o que torna o sistema mais lento em resposta a um degrau. Em compensação, o decréscimo da largura de banda criada pelo compensador em atraso permite manter sinais espúrios fora da malha de controle.
5.3.1 Projeto com o lugar das raízes As equações de projeto são as mesmas apresentadas na seção 5.2.1, entretanto, neste caso τP > τz. O compensador em atraso é usado, via de regra, quando o lugar das raízes original é aceitável e o nosso objetivo é meramente diminuir o erro de regime.
Projeto de Sistemas de Controle Utilizando o Lugar das Raízes e os Diagramas de Bode
198
EXEMPLO 5.3 – Dada a planta G (s) =
10 s(s + 5)
Deseja-se alterar as especificações do sistema para: •
erro de regime a rampa menor que 5% ;
•
ς = 0,707 e ωn = 1,5 rad/s
Primeiro, calcula-se KC, como segue: 10K C 1 = s →0 (s + 5) 0,05
K V = lim sG (s)H (s) = lim s →0
10K C = 20 ⇒ K C = 10 5 Para atender as especificações de amortecimento e frequencia, resulta que: s1 = -ςωn + jωn 1 − ς 2 = - 1,06 + j1,06 = 1,5ej135 = Msejθs Substituindo-se 1,5ej135 em G(s), obtém-se G(s1) = 1,63e-j150 = MGejθG. Substituindo –se KC, MG, MS, θG e θS em (5.4) e (5.5), resulta τz = 1,232 e τp = 15,091. Assim, o compensador que satisfaz as especificações é: G C = 10
1,232s + 1 15,091s + 1
Os pólos do sistema em malha fechada são (-1,06 ± j1,06,-2,94) e o zero é (-0,81). A resposta a degrau unitário do sistema antes e após a compensação são mostrados na Fig. 5.9. O sistema compensado possui um sobre-sinal de 30% e um tempo de acomodação ts2% de cerca de 3,6 s. Este grande tempo de acomodação é devido ao pólo real. Como o compensador acrescenta um zero na planta, o sobre-sinal é maior que o esperado para ς = 0,707. Caso esse sobre-sinal não possa ser tolerado o zero do compensador deve ser, por “tentativa e erro” movido para a esquerda até cancelar o pólo real de malha fechada. Para efeito de comparação, foi traçada, na mesma figura, a resposta a degrau do sistema compensado apenas por um controlador proporcional KC = 10. Percebe-se que o compensador em atraso apesar de diminuir a velocidade de resposta reduz o sobre-sinal.
Sistemas de Controle
199
Resposta ao degrau 1.5
Sistema com Compensador Proporcional Sistema Compensado
1
Amplitude
Sistema não compensado
0.5
0 0
1
2
3
4
5
6
t (s)
Fig. 5.9 – Resposta ao degrau do sistema do exemplo 5.9. Aqui, é importante lembrar que quanto maior o amortecimento maior a margem de fase e menor a freqüência de cruzamento de ganho, o que leva a uma redução do ganho do sistema. Assim, conclui-se que o compensador em atraso de fase aumenta a margem de fase e diminui largura de banda em malha fechada.
5.3.2 Projeto com o Diagrama de Bode Nesta seção usaremos a forma usual da compensação em avanço-atraso de fase: GC ( s ) = K C
αTs + 1 = K C K1 ( s ) Ts + 1
α<1
(5.11)
Como na compensação em avanço, nós primeiro escolhemos um KC que satisfaça a especificação de erro de regime permanente. Os parâmetros α e T são encontrados, então, para satisfazer a especificação de margem de fase. A Fig. 5.10 apresenta o diagrama de Bode de um compensador em atraso de fase com KC = 1, e α = 0,1.
Projeto de Sistemas de Controle Utilizando o Lugar das Raízes e os Diagramas de Bode
200
0
-5
(dB)
-10
-15
-20 0
0
( )
-20
-40
-60 0.01/T
0.1/T
1/T
10/T
100/T
1000/T
ω (rad/sec)
Fig. 5.10 – Diagrama de Bode de um compensador em atraso de fase. Calculando-se o ganho do compensador no infinito pode-se mostrar que a máxima redução no ganho é 20 log α e que na freqüência ω = 10/(αT) há um contribuição mínima de fase por parte do compensador. Estes fatos nos levam a seguinte metodologia de projeto: 1. Determine o KC que satisfaça os requisitos de regime permanente; 2. Desenhe o diagrama de bode de KCG(jω); 3. Se a margem de fase é insuficiente, encontre a freqüência na qual a margem de fase é satisfeita (adicione 5o por segurança). Esta freqüência será a ωG compensada; 4. Encontre o ganho KCG(jω) em ω = ωG. Esta é a quantia de ganho que necessita ser reduzida pelo compensador, isto é: Redução de ganho (RG)= -| KCG(jωG)|dB = - 20 log α Æ α = 10-RG/20 5. Para minimizar a contribuição de fase do compensador, faça T=
10 αω G
6. Desenhe o Diagrama de Bode de GC(jω)G(jω) e confirme o projeto; 7. Simule o sistema em malha fechada.
Sistemas de Controle
201
EXEMPLO 5.4 – Considere a planta do exemplo 5.3. Projete um compensador em atraso de fase utilizando a metodologia de Bode. Iniciamos pelo passo 2, uma vez que KC já foi determinado. 2. Inicialmente traçamos o Diagrama de Bode de KCG(jω), conforme mostra a Fig. 5.11.
Diagrama de Bode 80 60 Modulo (dB)
40 20 0 Compensado -20 -40 -60 -100
Fase -120 (graus) -140 -160 -180 10
-2
10
-1
10
0
10
1
10
2
Frequencia (rad/sec)
Fig. 5.11 – Diagramas de Bode para o Exemplo 5.4. 3. Um amortecimento de 0,707 requer uma margem de fase γ = 70o (γ ≅ 100ς). Por segurança, acrescentamos 5o e examinamos o Diagrama de Bode para determinar a freqüência na qual a margem de fase especificada é satisfeita. O resultado é uma ωG compensada de 1,34 rad/s. 4. O ganho KCG(jωG) é 23,2 dB. Esta é a quantia de ganho que necessita ser reduzida pelo compensador, assim: α = 10-RG/20 = 10-23,2/20 = 0,069 5. Com α = 0,069 e uma ωG = 1,34 rad/s, resulta que
Projeto de Sistemas de Controle Utilizando o Lugar das Raízes e os Diagramas de Bode
T=
202
10 = 108,15 s αω G
6. O compensador terá com função de transferência: G C (s) = 10
7,46s + 1 108.15s + 1
O diagrama de Bode de GC(jω)G(jω), também é apresentado na Fig. 5.11. Observe que o atraso de fase introduzido pelo compensador ocorre em baixas freqüências para não afetar adversamente a margem de fase. A resposta a degrau do sistema compensado é mostrado na Fig. 5.12, onde percebemos um sobre-sinal de apenas 8% contra 43% do sistema compensado com um controlador proporcional (Fig. 5.9). Comparando os métodos de projeto por Root Locus e Bode, para a planta dos exemplos e especificações, o lugar das raízes nos dá uma resposta mais rápida e a técnica de Bode nos oferece um menor sobre-sinal. Assim, recomenda-se o uso das duas técnicas para escolher o compensador mais adequado a sua aplicação. Resposta ao degrau 1.4
1.2
Amplitude
1
0.8
0.6
0.4
0.2
0
0
2
4
6
8
10
tempo (sec)
Fig. 5.12 – Resposta ao degrau para o exemplo 5.4.
12
Sistemas de Controle
203
5.4 Controlador proporcional-integral-derivativo (PID) O controlador PID GC ( s ) = K p + K d s +
Ki s
pode assumir diversas formas: •
Proporcional com Kd = Ki = 0;
•
Proporcional-derivativo (PD) com Ki = 0;
•
Proporcional-integral (PI) com Kd = 0;
•
PID.
O esquema mais simples, o controlador somente com ação proporcional, permite que projetista satisfaça uma única especificação de malha fechada. A ação derivativa incrementa o amortecimento do sistema em malha fechada, conforme ilustra a Fig. 5.13; por sua vez, a ação integral incrementa o tipo de sistema, o que permite diminuir o erro de regime permanente. Por ser, geralmente, efetivo em atender muitas especificações, o controlador PID é largamente utilizado em processos industriais. Resposta ao degrau 1.4
1.2
1
0.8
Sistema com compensador PD 0.6
0.4
0.2
0 0
2
4
6
8
10
12
tempo (sec)
Fig. 5.13 – Resposta a degrau de um sistema de 2a ordem padrão com ς = 0,5 e ωn = 1 rad/s (linha cheia) e resposta a degrau do sistema com um compensador PD associado em cascata no ramo direto(linha tracejada), sendo Kd = 1 e Kp = 1.
Projeto de Sistemas de Controle Utilizando o Lugar das Raízes e os Diagramas de Bode
204
Porque há três parâmetros para serem ajustados no projeto de controladores PID, a técnica de projeto do Lugar das Raízes e de Bode não são empregada diretamente. Ziegler e Nichols desenvolveram um método para ajustar um controlador PID com os seguintes passos: Primeiro, faz-se Kd = Ki = 0 e aumenta-se o ganho proporcional até a condição de oscilação ( |KpG(jω)| = 1 e ∠ KpG(jω) = 180o). O ganho proporcional obtido é então multiplicado por 0,6 e os outros ganhos são calculados por K p = 0,6 K m
Kd =
πK p 4ω m
Ki =
K pω m
π
onde Km é o ganho no qual o sistema proporcional oscila e ωm é a freqüência da oscilação. Note que esta técnica não atende todas as especificações. Ela garante, segundo os autores, um bom comportamento dinâmico do sistema. Ambos os métodos podem ser empregados para obter Km e ωm. Quando utilizamos o método do Lugar das Raízes, obtém-se a função de transferência da planta. O ganho no qual o lugar das raízes cruza o eixo jω é Km e a freqüência sobre o eixo jω nos dá ωm. Por outro lado, ao utilizarmos os gráficos de Bode, determina-se a margem de ganho (MG) da planta na freqüência de cruzamento de fase ωφ e: K m = 10 MG 20
e ω m = ωφ
Exemplo 5.5 – Seja a planta do exemplo 5.1: G (s) =
400 s ( s 2 + 30 s + 200)
Como o uso de um controlador PID aumenta a ordem do sistema o erro de regime permanente para a rampa unitária será zero.
5.4.1 Projeto com Root Locus: A partir do Lugar das Raízes da Planta (Fig. 5.3) encontramos Km = 15 e ωm = 14 rad/s. Assim, K p = 0,6K m = 9
Kd =
πK p
4ω m
= 0,5
E o controlador será: G C (s) = 9 + 0,5s +
40 s
Ki =
K p ωm π
= 40
Sistemas de Controle
205
5.4.2 Projeto com Diagrama de Bode: A partir das características da planta obtemos: K m = 10 23 20 = 14,1 e ω m = 14,1
Assim, K p = 0,6 K m = 8,5
Kd =
πK p = 0,47 4ω m
Ki =
K pω m
π
= 38,1
E o controlador será: GC ( s ) = 8,5 + 0,47 s +
38,1 s
O diagrama de Bode de GC(s)G(s) para o controlador acima é apresentado na Fig. 5.14. Observe que a Margem de Fase obtida é de aproximadamente 25o o que resultará em um amortecimento pequeno e, conseqüentemente, um sobre-sinal muito elevado, conforme ilustra a Fig. 5.15. 100
50
0
-50 -1 10
10
0
10
1
10
2
-150
-160
-170
-180 -1 10
10
0
10
1
10
2
log ω
Fig. 5.14 – Diagrama de Bode da planta do Exemplo 5.5 com Kp = 8,5, Kd = 0,47 e Ki = 38,1. O método apresentado anteriormente não nos permite projetar um PID que nos possibilite obter um comportamento específico de malha fechada. Entretanto, uma técnica
analítica pode ser desenvolvida para determinar os parâmetros do PID a partir de especificações de erro de regime permanente e de desempenho transitório requeridas. O ganho de malha aberta de um sistema controlado por um PID é dado por:
Projeto de Sistemas de Controle Utilizando o Lugar das Raízes e os Diagramas de Bode
206
1.6 1.4
1.2
1
0.8 0.6
0.4
0.2
0
0
0.2
0.4
0.6
0.8
1
1.2
1.4
1.6
1.8
2
s
Fig. 5.15 – Resposta a degrau unitário do sistema de malha fechado do Exemplo 5.5. K ⎞ ⎛ ⎜ K p + K d s + i ⎟G (s ) s ⎠ ⎝ Se G(s) é uma planta do tipo n, o sistema compensado será do tipo n+1. A constante de erro é igual ao inverso do erro de regime permanente e é dada por: K n +1 = lim s n K i G ( s ) = s →0
1 ess
Para uma dada especificação de regime permanente, nós encontramos Ki da equação anterior. Das especificações do domínio do tempo tais como o sobre-sinal e o tempo de acomodação, nós determinamos o coeficiente de amortecimento ς e a freqüência natural ωn. Sabemos que a freqüência natural de malha fechada mantém uma relação com a freqüência de cruzamento de ganho de malha aberta (equação 4.26) e que a margem de fase desejada pode ser encontrada a partir do amortecimento (Fig. 4.20). Logo, em ω = ωG, o sistema compensado teria um ganho igual a 1 e uma fase θ(ωG) = -180o + γ. Com essa informação, lembrando que Ki é conhecido, podemos escrever que: ⎛ K ⎜⎜ K p + jω G K d + i jω G ⎝
⎞ ⎟⎟G ( jω G ) = 1e jθ (ωG ) ⎠
o qual leva a jK i 1e jθ (ωG ) K p + jω G K d = + = R + jX G ( jω G ) ω G
Sistemas de Controle
207
Da última expressão obtemos Kp = R e Kd = X/ωG. Este procedimento pode ser facilmente programado no MATLAB criando a função pid, como segue: function [kp,kd,nk,dk]=pid(ng,dg,ki,pm,wg) ngc=polyval(ng,j*wg); dgc=polyval(dg,j*wg); g=ngc/dgc; thetar=(pm-180)*3.141592/180; ejtheta=cos(thetar)+j*sin(thetar); sol=(ejtheta/g)+j*(ki/wg) x=imag(sol); r=real(sol); kp=r kd=x/wg if ki~=0, dk=[1 0]; nk=[kd kp ki]; else dk=1; nk=[kd kp]; end;
Exemplo 5.6 - Usando o procedimento analítico descrito, vamos reprojetar o controlador PID do Exemplo 5.5 para que o sistema atenda as seguintes especificações: •
Erro de regime permanente a parábola unitária – 0,1;
•
Sobre-sinal – 10%;
•
Tempo de acomodação tS2% = 2 s.
O coeficiente de erro de aceleração estático Ka é K a = lim s K i G ( s ) = 2 K i s →0
Como: 1 1 = = 10 ⇒ e ss 0,1
2K i =
Ki = 5
A partir das especificações desejadas determinamos ς e ωn como segue. −
MP = e tS2% =
π ⋅ς 1−ς 2
= 0,1 ⇒ ς ≅ 0,6
3,9 = 1 ⇒ ωn = 3,25 rad/s ς ⋅ω n
Com ς = 0,6 e ωn = 3,25 rad/s da Fig. 5.1 obtém-se ωG ≅ 2,3 rad/s.
Projeto de Sistemas de Controle Utilizando o Lugar das Raízes e os Diagramas de Bode
208
A partir da Fig. 4.20 com ς = 0,6 obtém-se a margem de fase γ = 60o. Usando a função pid desenvolvida para o MATLAB, resulta em Kp = 1,16 e Kd = 0,85. De posse desses dois últimos valores constrói-se o diagrama de Bode (Fig. 5.16) do sistema compensado, que evidencia três freqüências de cruzamento de ganho, sendo uma delas em ω ≅ 2,3 rad/s com margem de fase de 60o, conforme projeto. A resposta a degrau unitário do sistema compensado, apresentada na Fig. 5.17, indica um sobre-sinal e um tempo de acomodação maiores que o especificado (MP = 24%). Lembre que as equações que levam aos valores das figuras de mérito são obtidas para um sistema padrão de segunda-ordem, constituindo-se em valores de partida de projeto. Para melhorar a resposta transitória, vamos especificar a freqüência de cruzamento de ganho ωG em um valor entre a segunda e a terceira freqüência de cruzamento do diagrama de Bode da Fig. 5.16. Com Ki = 5, γ = 60o e ωG = 7,2 rad/s, a função pid retorna Kp = 4,25 e Kd = 0,38. Constrói-se o novo diagrama de Bode apresentado na Fig. 5.18, que indica a manutenção da margem de fase em 60o. A Fig. 5.19 indica um melhor desempenho da nova resposta a degrau unitário do sistema compensado, onde encontramos um sobre-sinal reduzido para cerca de 16% e um tempo de acomodação inferior a 2s. 60 40 20 0 -20 -40 -1 10
0
10
1
10
2
10
-50
-100
-150
-200 -1 10
0
10
1
10
2
10 log ω
Fig. 5.16 - Diagrama de Bode GC(s)G(s) para a planta do Exemplo 5.1 compensada por um controlador PID com Kp = 1,16 , Kd = 0,85 e Ki = 5.
Sistemas de Controle
209
1.4
1.2
1
0.8
0.6
0.4
0.2
0
0
1
2
3
4
5
6
s
Fig. 5.17 – Resposta a degrau de malha fechada para o sistema do Exemplo 5.6, com um controlador PID com Kp = 1,16; Kd = 0,85 e Ki = 5.
100
50
0
-50 10
-1
10
0
10
1
10
2
-100 -120 -140 -160 -180 -2 10
10
-1
10
0
10
1
2
10 log ω
Fig. 5.18 - Diagrama de Bode GC(s)G(s) para a planta do Exemplo 5.1 compensada por um controlador PID com Kp = 4,25, Kd = 0,38 e Ki = 5.
Uma maneira de implementar o compensador PID é mostrada na Fig.5.20. Pode ser mostrado (tente) que a função de transferência do circuito da Fig. 5.20 é: E 0 ( s ) R4 R2 ( R1C1 s + 1) ⋅ ( R2 C 2 s + 1) = ⋅ Ei ( s ) R3 R1 R2 C 2 s
Projeto de Sistemas de Controle Utilizando o Lugar das Raízes e os Diagramas de Bode
210
que mostra que o controlador PID apresenta dois zeros e um pólo. Rearranjando a expressão acima, obtém-se: E 0 ( s ) R4 ( R1C1 + R2 C 2 ) ⎡ R C ⋅R C 1 = ⋅ ⎢1 + + 1 1 2 2 Ei ( s ) R3 R1C1 ⎣ ( R1C1 + R2 C 2 ) s R1C1 + R2 C 2
⎤ s⎥ ⎦
(5.12)
Assim: KP =
R4 ( R1C1 + R2 C 2 ) R3 R1C1
Kd =
R4 R2 C1 R3
Ki =
R4 R3 R1C 2
1.4
1.2
1
0.8
0.6
0.4
0.2
0
0
0.2
0.4
0.6
0.8
1
1.2
1.4
1.6
1.8
2
s
Fig. 5.19 – Resposta a degrau de malha fechada para o sistema do Exemplo 5.6, com um controlador PID com Kp = 4,25, Kd = 0,38 e Ki = 5.5. C1
R4 R2 -
Ei(s) R1
C2 R3 -
+ +
Fig.5.20 – Compensador PID.
E0(s)
Sistemas de Controle
211
5.5 Compensação de um compensador abaixador (Buck) Seja a função de transferência do filtro de saída do conversor Buck obtida no capítulo II: FT = G ( s ) =
1 + sC 0 R SE
s L0 C 0 + s(( L0 + R L C 0 R SE ) R L ) + 1 2
Essa função de transferência possui dois pólos e um zero, com freqüências de canto calculadas da seguinte forma: 1
ω P1 = ω P 2 = ω 0 = ωZ =
L0 C 0
1 C 0 RSE
O diagrama de Bode típico da função de transferência anterior é apresentada na Fig. 5.21.
60 40 20 0 -20
20 db/dec
-40
ωP1=ωP2
40 db/dec
ωZ
0 -50 -100 -150 -200 10
0
10
1
10
2
10
3
10
4
10
5
log ω
Fig. 5.21 – Diagrama de Bode típico da função de transferência do filtro de saída de um conversor abaixador.
A compensação do conversor abaixador com controle por razão cíclica é implementada, via de regra, utilizando-se o compensador de 2 pólos e 2 zeros apresentado na Fig. 5.22, que possui como função de transferência:
Projeto de Sistemas de Controle Utilizando o Lugar das Raízes e os Diagramas de Bode
GC ( s ) =
R fz + 1 sC f
212
(5.13)
R ⋅ 1 sC i Rip + iz Riz + 1 sC i
que após algumas manipulações algébricas transforma-se em: GC ( s ) =
(1 + Riz C i s )(1 + R fz C f s ) Riz ⋅ Rip ( Riz + Rip )C f s(1 + Ci s ) Riz + Rip
ou ⎞ ⎞⎛ s + 1 R fz ⎛⎜ s + 1 ⎜ ⎟ Riz C i ⎠⎝ R fz C f ⎟⎠ ( s + ω Z 1 )( s + ω Z 2 ) ⎝ GC ( s ) = =K s( s + ω p 2 ) ⎞ ⎛ Riz ⋅ Rip Rip s⎜ s + 1 Ci ⎟ ⎜ Riz + Rip ⎟⎠ ⎝
(5.14)
Assim, os dois pólos e os dois zeros dessa função de transferência e o ganho K são calculados da seguinte forma: R fz
K=
Rip
ω Z1 =
1 Ci Riz
ωZ2 =
1 C f R fz
ω P1 = 0
ω P2 =
1 Riz ⋅ Rip Riz + Rip
= ω Z1 ⋅
Riz + Rip
Ci
Rip
Note que, como em freqüências elevadas os capacitores podem ser considerados como curto-circuitos, o ganho K representa o ganho para altas freqüências.
Ci Eo(s)
Rfz
Rip
-
Vref
Cf VC(s)
Riz +
Rref
Fig. 5.22 – Compensador de dois pólos e dois zeros.
Sistemas de Controle
213
Este compensador tem origem em um procedimento prático para garantir a estabilidade do sistema compensado. Esse procedimento tem como objetivo obter um sistema compensado com características semelhantes à rede de um único pólo, alcançando um alto ganho em baixas freqüências para uma melhor regulação CC, uma inclinação igual a –20 dB/dec com uma margem de fase em torno de 90o na freqüência de cruzamento de ganho. Uma alta freqüência de cruzamento de ganho fG melhora o desempenho dinâmico, assim para que a fonte tenha uma resposta rápida, deve-se projetar uma freqüência de cruzamento de ganho com o valor mais alto permitido. A teoria da amostragem mostra que não é possível transmitir informação em uma freqüência maior que a metade da freqüência de amostragem, em nosso caso a freqüência de comutação fS. Ainda, segundo a literatura, o sistema se torna instável se a freqüência de cruzamento de ganho fG excede um terço da freqüência de comutação. Para obter uma resposta dinâmica rápida sem risco de estabilidade adota-se, via de regra, fG = fS/4 O compensador apresenta um pólo na origem, que introduz um integrador na função de transferência de malha aberta, o que tornaria o erro de regime permanente nulo para uma entrada em degrau unitário. Na prática, o ganho não pode exceder o limite do amplificador de erro e esse pólo ocorre onde a curva de ganho intercepta esse limite, o que ocorre em uma freqüência abaixo de 1 rad/s ou 0,16 Hz. O segundo pólo é empregado para compensar o zero introduzido pelo capacitor de saída e sua resistência série. Os zeros são empregados para compensar a freqüência de ressonância do filtro LC e, geralmente, faz-se ωZ1 = ωZ2. Um diagrama de Bode do compensador de dois pólos e dois zeros, com ωZ1 = ωZ2, é apresentado na Fig. 5.23. Para projetar o compensador de dois pólos e dois zeros para um conversor abaixador sugere-se o seguinte procedimento: 1. Traçar o diagrama de Bode de G(s)H(s) e medir o ganho A em ω = ωS/4; 2. Situar os dois zeros de GC(s) na freqüência de ressonância ω0 do filtro de saída, o que nos fornece a relação 1 1 = = ω0 Ci Riz C f R fz
(5.15)
3. Situar o segundo pólo de GC(s) numa freqüência igual a 5 vezes a freqüência de ressonância ω0 do filtro de saída. Como
Projeto de Sistemas de Controle Utilizando o Lugar das Raízes e os Diagramas de Bode
214
60 50 40
Limite do amplificador de erro
ωP1
Ganho (db) 30 20
20 log K
10
ωZ1=ωZ2
ωP2
50 Fase o ( )
0
-50
-100 10
0
10
1
10
2
10
3
10
4
log ω
10
5
Fig. 5.23 – Diagrama de Bode do compensador de dois pólos e dois zeros com ωZ1 = ωZ2.
ω P 2 = ω Z1 ⋅ obtemos a relação
Riz + Rip Rip
Riz + Rip Rip
e ω Z1 = ω 0 ,
=5
ou Riz = 4 Rip
(5.16)
4. O ganho de alta freqüência K é obtido empregando-se o procedimento ilustrado pela Fig. 5.24. Assim: 20 log K = A + 20 log
ω P2 ωS 4
O que nos conduz a última relação R fz Rip
= 10
⎛ A ω ⎞ ⎜ +log P 2 ⎟⎟ ⎜ 20 ω S 4⎠ ⎝
(5.17)
Observe que obtendo-se o valor de K, podemos construir a função de transferência do compensador empregando (5.14)
Sistemas de Controle
215
5. A partir das expressões (5.51), (5.16) e (5.17), calcula-se os valores dos elementos do circuito de compensação. EXEMPLO 5.7 – Realize a compensação do conversor Buck apresentado na seção 3.4.1. Considere fS = 50 kHz (314159,3 rad/s). 20 10
+20db/dec
−20db/dec
GC(s) 20logK
A 0 db A −10 −20
G(s)H(s) −30 ω0
ωS/4 ωp2
Fig. 5.24 – Procedimento para o cálculo de K.
1. Traça-se o diagrama de Bode da função de transferência de malha aberta (Fig. 5.25). G ( s ) H ( s ) = 9,6 ⋅
( s + 10000) (1 ⋅ 10 −4 s + 1) ⋅ 0,5 = 2400 ⋅ 2 −7 2 −4 2 ⋅ 10 s + 3 ⋅ 10 s + 1 ( s + 1500s + 5000000)
Na freqüência ω = ωS/4 ≅ 78540 rad/s, A = 29,5 dB. 2. Situam-se os dois zeros do compensador ωZ1 e ωZ2 na freqüência de ressonância ω0 do filtro de saída. Assim: 1 1 = = 5000000 ≅ 2236rad / s C i Riz C f R fz
(I)
3. Com o 20 pólo do compensador situado em ωp2 = 5ω0 = 11180 rad/s vale a relação Riz = 4 Rip
( II )
4. Como ωp2 < ωS/4, a relação (5.17) não é valida para obtermos o ganho de alta freqüência. Uma análise da Fig. 5.24 nos mostra que nessa situação 20 log K = A ⇒ 20 log
R fz Rip
= 29,5 dB
Projeto de Sistemas de Controle Utilizando o Lugar das Raízes e os Diagramas de Bode
216
20
db
0
-20
-40 1 10
10
2
3
10 log w
10
4
10
5
0
graus
-50
-100
-150 1 10
10
2
3
10 log w
10
4
10
5
Fig. 5.25 – Diagrama de Bode da função de transferência de malha aberta do conversor abaixador do Exemplo 5.7.
ou K=
R fz Rip
= 10
29,5
20
= 29,85
( III )
Com a obtenção do valor de K fica definida a função de transferência do compensador: GC ( s ) = K
( s + ω Z 1 )( s + ω Z 2 ) ( s + 2236) 2 = 29,85 ⋅ s( s + ω p 2 ) s( s + 11180)
5. No cálculo dos parâmetros do compensador adotaremos valores comerciais. Com Rfz = 168 kΩ, a relação ( III ) nos dá Rip = 5,6 kΩ. Escolhendo Rip = 5,6 kΩ, a relação ( II ) conduz a Riz = 22 kΩ. Para Rfz = 168 kΩ e Riz = 22 kΩ, a relação ( I ) nos dá Ci = 22 nF e Cf = 2,7 nF. A Fig. 5.26 apresenta o diagrama de Bode do sistema compensado, onde visualizamos uma margem de fase de aproximadamente 90o e uma inclinação da curva de módulo de –20 dB/dec. A resposta de malha fechada do conversor a um degrau na referência para o sistema compensado e não compensado é mostrado na Fig.5.27, onde observamos uma grande melhoria no desempenho transitório do sistema, tanto no que tange ao sobre-sinal como nos tempos de resposta.
Sistemas de Controle
217
80 60
db
40 20 0 -20 1 10
10
2
3
10 log w
10
4
10
5
-40
graus
-60 -80 -100 -120 1 10
10
2
3
10 log w
10
4
10
5
Fig. 5.26 - Diagrama de Bode do sistema compensado para o Exemplo 5.7.
6 compensado
5
4 Vo 3
2
1
0
0
0,5
1
1,5
2,0
2,5 ms
3,0
3,5
4
4,5
5
Fig. 5.27 – Resposta a degrau do conversor abaixador do Exemplo 5.7.
Projeto de Sistemas de Controle Utilizando o Lugar das Raízes e os Diagramas de Bode
218
REFERÊNCIAS BIBLIOGRÁFICAS
D’AZZO, John. Análise e projeto de sistemas de controle lineares. Rio de Janeiro: Guanabara Dois, 1984. KUO, B. C. Sistemas de controle automático. 4a edição. Rio de Janeiro: Prentice/Hall do Brasil, 1985. OGATA, K. Engenharia de controle moderno. 3a edição. Rio de Janeiro: Prentice/Hall do Brasil, 1985. LABORATÓRIO DE ENGENHARIA ELÉTRICA DA UERJ. Apostila de Simulink.2.0. 1999. DORF, Richard. Modern Control Systems. 9a edição. Prentice/Hall, 2001.