link para o texto completo - Mestrado em Engenharia Elétrica
Transcrição
link para o texto completo - Mestrado em Engenharia Elétrica
INSTITUTO MILITAR DE ENGENHARIA Cap ADEMIR RODRIGUES PEREIRA CONTROLADORES ROBUSTOS COM INTERPOLAÇÃO DE GANHOS VIA LÓGICA DIFUSA - APLICAÇÃO EM VEÍCULOS AUTÔNOMOS NÃO TRIPULADOS Dissertação de Mestrado apresentada ao Curso de Mestrado em Engenharia Elétrica do Instituto Militar de Engenharia, como requisito parcial para a obtenção do título de Mestre em Ciências em Engenharia Elétrica. Orientador: Geraldo Magela Pinheiro Gomes – Dr.ENSAE Co-orientador: Alexandre Alves Santiago – M. Sc. MIT Rio de Janeiro 2001 INSTITUTO MILITAR DE ENGENHARIA Praça General Tibúrcio, 80 – Praia Vermelha Rio de Janeiro - RJ CEP: 22290-270 Este exemplar é de propriedade do Instituto Militar de Engenharia, que poderá incluí-lo em base de dados, armazenar em computador, microfilmar ou adotar qualquer forma de arquivamento. É permitida a menção, reprodução parcial ou integral e a transmissão entre bibliotecas deste trabalho, sem modificação de seu texto, em qualquer meio que esteja ou venha a ser fixado, para pesquisa acadêmica, comentários e citações, desde que sem finalidade comercial e que seja feita a referência bibliográfica completa. Os conceitos expressos neste trabalho são de responsabilidade do autor e do orientador. Pereira, Ademir Rodrigues Controladores robustos com interpolação de ganhos via lógica difusa – Aplicação em Veículos Autônomos Não Tripulados. – Rio de Janeiro: Instituto Militar de Engenharia, 2001. 139 f.: il., graf., tab. Dissertação (mestrado) - Instituto Militar de Engenharia, 2001. 1. Controle robusto. 2. LQG/LTR. 3. Tabelamento de ganhos. 4. Lógica Fuzzy 2 INSTITUTO MILITAR DE ENGENHARIA ADEMIR RODRIGUES PEREIRA CONTROLADORES ROBUSTOS COM INTERPOLAÇÃO DE GANHOS VIA LÓGICA DIFUSA – APLICAÇÃO EM VEÍCULOS AUTÔNOMOS NÃO TRIPULADOS Dissertação de Mestrado apresentada ao Curso de Mestrado em Engenharia Elétrica do Instituto Militar de Engenharia, como requisito parcial para a obtenção do título de Mestre em Ciências em Engenharia Elétrica. Orientador: Cel R/1 Geraldo Magela Pinheiro Gomes – Dr. ENSAE. Co-orientador: CF Alexandre Alves Santiago – M. Sc. MIT Aprovada em 20 de dezembro de 2001 pela seguinte Banca Examinadora: _______________________________________________________________ Cel R/1 Geraldo Magela Pinheiro Gomes – Dr.ENSAE, do IME - Presidente _______________________________________________________________ CF Alexandre Alves Santiago – M. Sc. MIT, do CIAW/Marinha do Brasil _______________________________________________________________ Mário César Mello Massa de Campos – Dr. ECP, do CENPES/Petrobrás. ________________________________________________________________ Maj Paulo César Pellanda – Dr. ENSAE, do IME. Rio de Janeiro 2001 3 A meus pais pelo esforço dedicado a minha formação. 4 AGRADECIMENTOS A Deus por sempre me guiar. A minha esposa Glaúcia e a meu filho Gabriel, pela compreensão, paciência e apoio, durante esta dissertação. Ao IME, em especial ao DE/3, pela oportunidade de realização do curso de pósgraduação. Ao meu orientador Professor Geraldo Magela Pinheiro Gomes, pelo interesse, dedicação e paciência no decorrer da dissertação. Ao meu co-orientador Comandante Alexandre Alves Santiago pelo apoio e esforço empenhados nesta dissertação. Ao Maj Paulo César Pellanda, pelas sugestões e orientações que contribuíram no aprimoramento deste trabalho. Ao Cap Roberto Ades, pelas inúmeras orientações prestadas. A todos os professores deste curso pela qualidade das aulas e empenho. Ao companheiro Fabiano de Oliveira Leitão pelas sugestões e apoio prestado. Ao Cel R/1 Ernesto Modesto Penna, Cap QEM José Cerdeira Gonzalez e 10 Ten QEM Jacy pelo apoio dado junto ao IPD. Ao Maj QEM Hélio de Assis Pegado, pelo apoio dado no Instituto Tecnológico da Aeronáutica. Ao Engenheiro Flávio Araripe, Maj Av Achyles pela colaboração prestada no CTA. Aos companheiros de mestrado Rodrigo Brandolt Sodré, Thiago Lacerda de La Vega e Fábio Sagaz pela amizade e cooperação. Ao Cap QEM Jorge Augusto Castedo Junior pelo esforço e apoio dedicados na fase inicial da minha jornada. A todos os funcionários do DE/3, pela ajuda nesses dois anos de convivência. 5 SUMÁRIO LISTA DE ILUSTRAÇÕES............................................................................................…..…08 LISTA DE TABELAS..........................................................................................................….12 LISTA DE ABREVIATURAS E SÍMBOLOS……………………………………………….13 1 INTRODUÇÃO GERAL…………………………………………………………..17 1.1 Motivação e posicionamento da dissertação………………………………………... 18 1.2 Objetivos e Escopo…………………………………………………………………..21 2 EMPREGO DE VEÍCULOS AÉREOS NÃO TRIPULADOS…………………. 23 2.1 Introdução................................................................................................................... 23 2.2 Arquitetura de controle autônomo...............................................................................25 2.3 Resumo histórico do emprego de VANT pelos EUA e outros países ........................29 2.4 Estágio atual de pesquisa e desenvolvimento de VANTS no âmbito do Exército Brasileiro ....................................................................................................................39 3 SUPORTE TEÓRICO UTILIZADO…………………………………………….. 42 3.1 Conceitos básicos sobre mecânica de vôo e controle de aeronaves............................42 3.1.1 Introdução…………………………………………………………………………... 42 3.1.2 Movimento da aeronave em torno de centro de gravidade…………………………. 43 3.1.3 Sistemas de coordenadas.............................................................................................44 3.1.4 Forças e momentos atuantes no avião.........................................................................48 3.1.5 Equações de movimento do corpo..............................................................................50 3.1.6 Considerações sobre sistemas de controle automático aeronaves..............................52 3.2 Técnica LQG/LTR......................................................................................................54 3.3 Tabelamento de ganhos via lógica difusa...................................................................62 3.4 Método de Otimização................................................................................................68 3.4.1 Método de Powell.......................................................................................................70 3.4.2 Método de busca unidimensional via aproximação quadrática..................................71 6 4 MODELAGEM MATEMÁTICA DA AERONAVE E LINEARIZAÇÃO........ 73 4.1 Modelo matemático da aeronave................................................................................ 73 4.2 Linearização........................................................................................................….... 77 4.3 Simulações em malha aberta ..........................................................……………….. 81 5 RESULTADOS DA DETERMINAÇÃO DE CONTROLADORES ROBUSTOS COM INTERPOLAÇÃO DE GANHOS VIA LÓGICA DIFUSA....................... 87 5.1 Descrição do problema................................................................................................ 87 5.2 Controle de atitude......................................................................................................88 5.3 Análise das variações paramétricas e aplicação de tabelamento de ganhos com interpolação via lógica difusa.....................................................................................98 5.4 Controle de trajetória e lei de guiagem.....................................................................123 5.4.1 Controle de altitude...................................................................................................124 5.4.2 Comando de ângulo de guinada................................................................................127 5.4.3 Geração de trajetória.................................................................................................130 6 CONCLUSÕES E SUGESTÕES……………………………………………….. 131 7 REFERÊNCIAS BIBLIOGRÁFICAS………………………………………….. 136 7 LISTA DE ILUSTRAÇÕES FIG. 2.1 Imagens geradas a partir de um VANT...........................................................23 FIG. 2.2 Arquitetura de controle baseada na decomposição hierárquica.......................26 FIG. 2.3 Ryan 147 “Lightning Bug” em missão de reconhecimento............................. 29 FIG. 2.4 Operação de destruição de baterias de mísseis sírias com o uso de VANT ... 30 FIG. 2.5 VANT Pioneer e estação de controle terrestre................................................31 FIG. 2.6 VTUAV Argus.................................................................................................32 FIG. 2.7 VTUAV Eagle Eye......................................................................................…32 FIG. 2.8 VTUAV Guardian...........................................................................................32 FIG. 2.9 RQ-1 Predator MAE UAV............................................................................. 33 FIG. 2.10 RQ-32A Dark Star...........................................................................................34 FIG. 2.11 Global Hawk....................................................................................................35 FIG. 2.12 Sistema de lançamento da aeronave não tripulada modelo CL-289...............36 FIG. 2.13 Sistema de lançamento da aeronave não tripulada modelo Brevel................. 37 FIG. 2.14 Aeronave não tripulada modelo Crecerelle(França) ...................................... 37 FIG. 2.15 Sistema de lançamento da aeronave não tripulada modelo Phoenix................ 38 FIG. 2.16 Seeker-Kentron (África do Sul) ..................................................................... 38 FIG. 2.17 VANT Acauã.................................................................................................. 39 FIG. 3.1 Movimentos de uma aeronave nos três eixos..................................................43 FIG. 3.2 Sistema de coordenadas locais e sistema de eixos aerodinâmicos.................. 45 FIG. 3.3 Sistema de coordenadas do veículo................................................................ 46 FIG. 3.4 Sistema de coordenadas do veículo e sistema de eixos aerodinâmicos, para guinada nula............................................................................................46 8 FIG. 3.5 Sistema de coordenadas do veículo e sistema de coordenada local............... 47 FIG. 3.6 Sistema de eixos aerodinâmicos e sistema de coordenadas do veículo...........48 FIG. 3.7 Diagrama de blocos do sistema....................................................................... 55 FIG. 3.8 Comportamento típico de eM(jω).....................................................................57 FIG. 3.9 Barreiras de robustez da estabilidade e do desempenho................................. 57 FIG. 3.10 Diagrama de blocos do sistema em malha fechada......................................... 58 FIG. 3.11 a) Sistema nominal em malha fechada; b) Sistema para ρ→ 0+..................... 59 FIG. 3.12 Arquitetura geral de controle fuzzy..................................................................65 FIG. 3.13 Função de pertinência trapezoidal aberta à esquerda...................................... 66 FIG. 3.14 Função de pertinência trapezoidal aberta à direita.......................................... 67 FIG. 3.15 Função de pertinência triangular..................................................................... 67 FIG. 3.16 Diagrama geral do sistema de otimização....................................................... 69 FIG. 3.17 Fluxograma do método de Powell...................................................................70 FIG. 3.18 Fluxograma do método de busca unidimensional por aproximação quadrática........................................................................................................ 72 FIG. 4.1 Resposta ao impulso na fração do empuxo máximo. ....................... 81 FIG. 4.2 Resposta ao impulso no profundor.................................................... 82 FIG. 4.3 Resposta ao impulso no leme......................................................... 82 FIG. 4.4 Resposta ao impulso no aileron........................................................ 83 FIG. 4.5 Resposta ao degrau unitário na fração do empuxo máximo........................... 84 FIG. 4.6 Resposta ao degrau unitário no profundor............ ..........................................84 FIG. 4.7 Resposta ao degrau unitário no leme...............................................................85 FIG. 4.8 Resposta ao degrau unitário no aileron........................................................... 85 FIG. 4.9 Resposta ao degrau de amplitude igual a 0.1 na fração do empuxo................86 FIG. 5.1 Resposta em freqüência da curva do erro de modelagem (1/eM(jω)) para aeronave.......................................................................................................... 89 9 FIG. 5.2 Curva do módulo em dB de uma perturbação externa....................................89 FIG. 5.3 Valores singulares de FIG. 5.4 modelagem(1/em(j ω)) para aeronave............................................................... 90 1 Valores singulares da malha objetivo e C ( jωI − A) −1 L ......................... 91 FIG. 5.5 Valores singulares da malha objetivo em malha fechada e FIG. 5.6 Valores singulares da malha objetivo GKF(jω) e de GN(jω)K(j ω)................... 93 FIG. 5.7 Valores singulares do sistema compensado em MF e de 1/eM(jω)................. 94 FIG. 5.8 Resposta ao degrau para o ângulo de trajetória.............................................. 96 FIG. 5.9 Resposta ao degrau para o ângulo de rolagem e variações em ψ, β, e p........ 97 FIG. 5.10 Região de estabilidade (M0 = 0.2 e γ0 = 0 graus)............................................ 99 FIG. 5.11 Região de estabilidade (M0 = 0.3 e γ0 = 0 graus)............................................ 99 FIG. 5.12 Região de estabilidade (M0 = 0.4 e γ0 = 0 graus)...........................................100 FIG. 5.13 Curva de custos J1 para cada variável de referência (M0 = 0.2)....................101 FIG. 5.14 Curva de custos J1 para cada variável de referência (M0 = 0.25)..................102 FIG. 5.15 Curva de custos J1 para cada variável de referência (M0 = 0.3)....................102 FIG. 5.16 Diagrama de estrutura de controle com tabelamento de ganhos................... 103 FIG. 5.17 Resposta ao degrau para ponto de operação em M0 = 0.22...........................105 FIG. 5.18 Curva objetivo para ponto de operação situado na região intermediária...... 106 FIG. 5.19 Funções de pertinência da variável lingüística NrMach................................109 FIG. 5.20 Funções de pertinência da variável g1........................................................... 110 FIG. 5.21 Variação dos ganhos g1, g2, e g2 de acordo com a variação do Nr de Mach..111 FIG. 5.22 Curvas dos custo J1(obj) e J1_FSi ......................................................................112 FIG. 5.23 Curvas de resposta ao degrau para o número de Mach................................. 113 FIG. 5.24 Evolução do custo J3..................................................................................... 115 1 µ C ( jωI − A) −1 L e curva do erro de µ 10 1 .............92 e M ( jω) FIG. 5.25 Funções de pertinência da variável lingüística NrMach................................115 FIG. 5.26 Funções de pertinência da variável de saída g1.............................................116 FIG. 5.27 Funções de pertinência da variável de saída g2............................................. 116 FIG. 5.28 Funções de pertinência da variável de saída g3............................................. 116 FIG. 5.29 Ganhos dos subcontroladores em função do Nr Mach..................................117 FIG. 5.30 Custos J2_FSo e J2_(obj) para variação do ponto de operação............................117 FIG. 5.31 Resposta temporal para número de Mach (M0 = 0.25)..................................118 FIG. 5.32 Resposta temporal para número de Mach (M0 = 0.21)................................. 119 FIG. 5.33 Curvas de J2 para as respostas ao degrau para ângulo de trajetória.............. 120 FIG. 5.34 Curvas de J2 para as respostas ao degrau para ângulo de deslizamento........120 FIG. 5.35 Curvas de J2 para as respostas ao degrau para ângulo de rolagem................120 FIG. 5.36 Resposta a degraus escalonados pré-filtrados............................................... 121 FIG. 5.37 Sinais dos atuadores no modo longitudinal...................................................122 FIG. 5.38 Curvas de ganhos dos sub-controladores...................................................... 122 FIG. 5.39 Diagrama de blocos incluindo sistema de guiagem...................................... 123 FIG. 5.40 Evolução do custo J4..................................................................................... 125 FIG. 5.41 Resposta para comando de altitude e variação do ângulo de trajetória.........125 FIG. 5.42 Variação do número de Mach e dos ganhos dos sub-controladores............. 126 FIG. 5.43 Sinais dos atuadores no modo longitudinal...................................................126 FIG. 5.44 Evolução do custo para o modo lateral..........................................................128 FIG. 5.45 Curvas de resposta para comando de rumo................................................... 128 FIG. 5.46 Deflexões do aileron e do leme..................................................................... 129 FIG. 5.47 Esquema da lei de guiagem........................................................................... 130 FIG. 5.48 ‘Way-points’ e trajetória da aeronave........................................................... 131 FIG. 5.49 Variações nos estados do modo lateral para mudança de direção................ 131 11 LISTA DE TABELAS TAB. 4.1 Pontos de operação para diferentes números de Mach.............................................79 TAB. 5.1 Diferença de custos.................................................................................................113 TAB. 5.2 Diferenças de custos...............................................................................................118 12 LISTA DE ABREVIATURAS E SÍMBOLOS ABREVIATURAS LQG/LTR : “Linear Quadratic Gaussian / Loop Transfer Recovery” LQG : “Linear Quadratic Gaussian” LQR : ”Linear Quadratic Regulator” MF : Malha fechada MA : Malha aberta VANT : Veículos Autônomos Não Tripulados SÍMBOLOS X : Vetor X ℜn : Conjunto dos vetores reais de ordem n AT : Matriz transposta da matriz A θ : Vetor paramétrico b∈C : b pertence a C ℜpxq : Conjunto das matrizes reais de ordem p x q In : Matriz identidade de ordem n A-1 : Matriz inversa da matriz A σ max (A ) : Maior valor singular da matriz A σ mim (A ) : Menor valor singular da matriz A A : Determinante da matriz A min ( ⋅ ) : Encontrar o valor mínimo da expressão variando A F( ⋅ ) : F é uma função objetivo do argumento F( ⋅ ) b : Módulo do valor da função objetivo do argumento : Envergadura [ft]; CD : Coeficiente de arrasto(drag); CL : Coeficiente de Sustentação(lift); A 13 Cl : Coeficiente de momento de rolagem (roll); Cm : Coeficiente de momento de arfagem (pitch); Cn : Coeficiente de Momento de Guinada (yaw); CY : Coeficiente c : Corda aerodinâmica média [ft]; g : Aceleração da gravidade [ft/sec2]; Ix, Iy, Iz : Momentos principais de inércia [ slug ft2]; M : Número de Mach; p, q, r : Velocidades angulares de rolagem, arfagem e guinada; S : Área de referência [ft2]; TM : Empuxo propulsivo máximo[lb]; T : Empuxo propulsivo [lb]; x, y, z : Coordenadas de posição da aeronave [ft]; α : Ângulo de ataque [graus]; β : Ângulo de deslizamento lateral [graus]; δa : Deflexão de aileron [graus]; δe : Deflexão de profundor (elevator)[graus]; δr : Deflexão de Leme Vertical(rudder) [graus]; η : Fração do empuxo máximo (T/TM); φ, θ, ψ : Ângulo de rolagem, de arfagem e de guinada(Heading) da aeronave [graus]; χ, γ, µ : Ângulos de orientação com relação aos eixos do vento[graus]. de Força Lateral; 14 RESUMO Esta dissertação apresenta um estudo de aplicação de controladores robustos tabelados através de lógica difusa no controle de aeronaves autônomas. Nesta dissertação propõe-se realizar um estudo de aplicação de controle robusto baseado em arquitetura hierárquica de gerenciamento autônomo de vôo para controle e guiagem de Veículos Aéreos Não Tripulados (VANT). Para a malha de controle de atitude são determinados controladores robustos, com base na técnica LQG/LTR (Linear Quadratic Gaussian/Loop Transfer Recovery) (DOYLE & STEIN, 1981), para vários pontos de operação. Para a região entre estes pontos de operação, os controladores são interpolados via lógica difusa (Fuzzy Gain Scheduling) (LING e EDGARD, 1992; ZHAO, 1993). Para um melhor desempenho do sistema em malha fechada, os parâmetros das funções de pertinência do interpolador de ganhos são ajustados utilizando-se um método de otimização de ordem zero. Na malha de guiagem, são utilizados controladores PID para gerar comandos de ângulos de trajetória e ângulos de rolagem, a fim de se atingir alturas e rumos fornecidos pelo gerador de trajetória. 15 ABSTRACT This dissertation presents a study about application of robust controllers with gain scheduled by fuzzy logic to control unmanned aircraft. A hierarchical design for the guidance and control of unmanned air vehicles is presented. The lowest level of hierarchy is the attitude control with robust controllers designed by LQG/LTR method in different operation points. Fuzzy gain scheduled is used to interpolate the controllers gains. An order zero optimization method is used to adjust of membership function parameters to improve performance of closed loop. The guidance layer consists of a PID controller to height and yaw control. Generation of desired positions required for autonomous execution is done by flight path controller. 16 1 INTRODUÇÃO GERAL Os avanços tecnológicos e científicos dos últimos anos propiciaram, de forma notável, mudanças significativas em todos os ramos do conhecimento humano. No meio militar, estas mudanças provocaram uma evolução no conceito de defesa, surgindo a chamada guerra moderna, citando como exemplo a que ocorreu no Oriente Médio (Guerra do Golfo em 1991). Além da utilização de todos os meios tecnológicos disponíveis, houve uma grande preocupação, por parte dos Estados Unidos e seus aliados, em reduzir o número de perdas de vidas humanas em ambos os lados da guerra, principalmente da população árabe civil, e com isto reduzir a repercussão negativa junto à opinião pública mundial. Exemplo de tal fato é a utilização maciça de mísseis cruzeiros Tomahawk para cumprir missões de destruição de alvos inimigos. Além disso, houve a utilização em larga escala de aeronaves não tripuladas para missões típicas de reconhecimento e espionagem em áreas de potencial risco para os pilotos aliados. A utilização de aeronaves não tripuladas e de mísseis do tipo cruzeiro é de tal importância que é considerado assunto estratégico para os países que detém esta tecnologia. Tanto assim que este assunto é atualmente foco de avançados estudos e pesquisas da comunidade científica mundial. Entretanto, a pesquisa científica realizada no Brasil nesta área está ainda em fase embrionária e os resultados no país são ainda bem modestos quando comparados ao estado da arte destas tecnologias nos países desenvolvidos. Tal fato se deve em grande parte aos altos custos decorrentes, ao número reduzido de profissionais que detém o conhecimento e da pouca vontade política no atual contexto de defesa nacional. Dentro desse enfoque, é necessário que se estabeleçam hoje determinadas prioridades a serem seguidas pelos órgãos de pesquisa e ensino a fim de se alcançar, a longo prazo, uma massa crítica suficiente para que se possa ter a maior probabilidade de sucesso no desenvolvimento, e até mesmo na aquisição, de sistemas autônomos de aeronaves não tripuladas, propiciando a inserção do Brasil no universo das nações que detém esta tecnologia de alto valor estratégico. O grande sucesso de mísseis do tipo cruzeiro e das aeronaves não tripuladas reflete o alto grau de evolução das técnicas de controle, guiagem e navegação. O meio científico vem desenvolvendo crescentes esforços nesta área. Recentemente, mais atenção tem sido dada ao problema de controle inteligente especialmente com os avanços em tecnologia de inteligência 17 artificial, tais como sistemas baseados em regras, lógica difusa, pesquisas em redes neurais, o que propicia grandes saltos evolutivos nas tarefas de planejamento e gerenciamento da missão. Um grande esforço tem sido feito para tornar as aeronaves não tripuladas mais capazes e com menos necessidade de instruções detalhadas do usuário. No entanto, o controle de mais baixo nível, que corresponde ao controle de atitude, é fundamentalmente necessário para aeronaves não tripuladas, não importa quão inteligentes estes veículos possam ser. 1.1 - MOTIVAÇÃO E POSICIONAMENTO DA DISSERTAÇÃO O desenvolvimento de Veículos Autônomos Não Tripulados (VANTs) e de sistemas de controle de vôo exige a solução de um grande número de problemas de engenharia que envolvem uma larga faixa de objetivos. Dentre estes, incluem-se limitações de peso e energia, portabilidade, fatores de risco, interferências eletrônicas, vibrações, entre outros. Além disso, o teste de novos algoritmos, pacotes de sensores e veículos geram um esforço multidisciplinar, envolvendo vários ramos da engenharia que incluem aeronáutica, elétrica, mecânica e engenharia de sistemas. Esse esforço é altamente custoso e envolve um grande potencial de risco, que impõe grandes prejuízos materiais e financeiros. Quando bem sucedido, entretanto, fornece informações, dados e conhecimentos práticos que não são disponíveis em outras fontes (HALLBERG, 1998). As dificuldades nos projetos de VANT estão também associadas com a modelagem e o controle de veículos aéreos de grande porte, e são somadas ao fato de que o comportamento dinâmico de uma aeronave em menor escala é consideravelmente diferente em determinadas situações de vôo (LAI et al., 2000). Diversos trabalhos têm sido realizados para levantar os diversos parâmetros e coeficientes aerodinâmicos de aeronaves não tripuladas (HOWARD, 1996, MOYER&TALBOT, 1994, HOWARD et al., 1991). Um problema fundamental para os projetistas de Sistemas de Controle de Vôo é a incerteza em caracterizar não somente o veículo aéreo, mas também o ambiente em que devem operar. Por causa destas variações das características e para assegurar que as leis de controle garantam estabilidade e desempenho, o tabelamento de ganhos é uma abordagem usual. No projeto de controle com tabelamento de ganhos, as leis de controle são concebidas 18 em um conjunto de pontos de operação e não garantem boas propriedades de estabilidade e desempenho nos pontos intermediários. Recentes avanços na teoria de controle têm originado um grande número de técnicas modernas de controle robusto (DORATO & YEDAVALLI, 1990) especificamente para lidar com as incertezas do modelo e variações paramétricas. Estas novas técnicas oferecem as seguintes vantagens para projetos de aeronaves: - Sistemas multivariáveis podem ser manipulados com procedimentos metódicos, reduzindo o esforço de projeto. - Leis de controle robusto, que cobrem maiores regiões do envelope de vôo em torno de um determinado ponto de operação, podem ser derivadas mais eficientemente. Com isto, reduz-se o número de pontos de projeto exigidos, simplificando o tabelamento de ganhos. As diversas técnicas de controle que podem ser aplicadas ao controle de aeronaves maiores, que variam desde o controle clássico e controle robusto até sistemas inteligentes, necessitam ser reconsideradas e modificadas para se adequar à estrutura de controle autônomo exigida por um VANT. Diversos trabalhos nesta área de controle e guiagem de VANT foram realizados, mas pouco difundidos até a década de 80, por ser um assunto tratado com certa reserva. A partir da década de 90, os trabalhos passaram a ter mais difusão no meio científico. Um dos primeiros trabalhos publicados nessa década (WHITE & PHELANT, 1991) descreve um sistema de controle LQR de melhoria de estabilidade para aparelho remotamente operado, que tinha a missão de fornecer capacidade de reconhecimento aéreo ao Marine Corps – EUA. KUECHENMEISTER (1993) descreve uma simulação não linear para uma aeronave autônoma não tripulada. FOLEY (1994) apresenta um projeto e avaliação de um controlador LQR para o veículo aéreo não tripulado denominado BlueBird. Em LOURTIE et al. (1995) foram realizadas a análise e a simulação de controle longitudinal de um veículo aéreo remotamente operado, utilizando-se a técnica de controle robusto H∞. Ainda em 1995, foi publicado um dos primeiros trabalhos que utiliza uma abordagem de controle inteligente, baseado em regras lingüísticas, para alcançar comando de atitude e guiagem para um helicóptero autônomo (SUGENO et al., 1995). Abordagens de controle similares a esta foram relatadas em JIANG et al. (1996) e CORBAN et al.(1998). FONTENROSE & HALL (1996) descrevem um projeto de sistema de controle baseado na teoria de realimentação quantitativa (Quantitative Feedback Theory) para melhorar as qualidades de pilotagem de um VANT com 19 estabilidade relaxada. KAMINER et al. (1998) apresenta uma metodologia para projeto integrado de sistemas de controle e de guiagem de veículos autônomos, baseada em tabelamento de ganhos e que produz um eficiente procedimento para projeto de controladores para VANTs com o objetivo de acompanhar precisamente trajetórias definidas em eixo de referência inercial. Um modelo de controle, via PID, de um sistema autônomo de busca e rastreamento de objeto terrestre, é apresentado em KOROBA (1999), que inclui a modelagem matemática da dinâmica e cinemática de busca, rastreamento e iluminação a laser a partir de um robô aéreo leve. PRASAD et al. (1999) descrevem uma síntese de controlador não linear adaptativo baseado na abordagem de redes neurais, inversão dinâmica e avaliação de teste de vôo em um helicóptero não tripulado. Em LAI et al. (2000) descreve-se um projeto hierárquico para guiagem e controle de um pequeno helicóptero autônomo, cujas exigências da missão eram especificadas por um gerenciador de navegação. KADMIRY et al. (2001) descrevem um controle de helicóptero não tripulado utilizando tabelamento de ganhos com lógica difusa. Nesta dissertação propõe-se realizar um estudo de aplicação de controle robusto baseado em arquitetura hierárquica de gerenciamento autônomo de vôo para controle e guiagem de VANTs. Para a malha de controle de atitude são determinados controladores robustos, com base na técnica LQG/LTR (Linear Quadratic Gaussian/Loop Transfer Recovery) (DOYLE & STEIN, 1981), para vários pontos de operação. Para a região entre estes pontos de operação, os controladores são interpolados via lógica difusa (Fuzzy Gain Scheduling) (LING & EDGARD, 1992; ZHAO, 1993). Para um melhor desempenho do sistema em malha fechada, os parâmetros das funções de pertinência do interpolador de ganhos são ajustados utilizandose um método de otimização de ordem zero. Na malha de guiagem, são utilizados controladores PID para gerar comandos de ângulos de trajetória e ângulos de rolagem, a fim de se atingir alturas e rumos fornecidos pelo gerador de trajetória proposto. Esta dissertação apresenta um estudo da aplicação de uma técnica de controle robusto já bem conhecida e que foi apresentada à comunidade científica por DOYLE & STEIN (1981). Trata-se da estrutura LQG com “Loop Transfer Recovery” (LQG/LTR), que permite tornar a estrutura LQG mais robusta face a incertezas não estruturadas. A estrutura LQG utiliza um Filtro de Kalman para estimar o vetor de estados com base no modelo matemático e no prévio conhecimento dos parâmetros estatísticos dos ruídos que atuam na planta e nos sensores. Considerando a grande dificuldade de obter modelos fiéis à dinâmica da planta física, o filtro perde as características de robustez já consagradas da malha 20 LQR. A fim de aperfeiçoar a robustez face às incertezas não estruturadas do LQG, surgiu o primeiro método desenvolvido por DOYLE & STEIN (1981), no qual, através de procedimento de ajuste no observador, o sistema controlado alcança assintoticamente a mesma função de transferência do sistema controlado pelo método LQR. Outros artigos tratam sobre este método, que tem como atrativos sua simplicidade conceitual e computacional (KAZEROONI & HOUPT, 1986; MOORE & TAY, 1989). Para permitir que o veículo opere em todo domínio do envelope de vôo com estabilidade e desempenho desejados, após ter alcançado controladores lineares multivariáveis robustos em torno de vários pontos de operação, é utilizada a abordagem do tabelamento de ganhos com interpolação via lógica difusa, com parâmetros das funções de pertinência otimizados. 1.2. OBJETIVOS E ESCOPO Os objetivos deste trabalho são: • Realizar estudos e pesquisas iniciais no âmbito do Departamento de Engenharia Elétrica do Instituto Militar de Engenharia (DE/3 – IME) sobre controle autônomo de aeronaves não tripuladas; • Determinar um conjunto de controladores robustos, através da técnica LQG/LTR, com a finalidade de atingir características de desempenho e estabilidade em diversos pontos de operação; • Aplicar a interpolação difusa de ganhos, com parâmetros otimizados das funções de pertinência, a fim de melhorar o desempenho do sistema durante as transições entre os pontos de operação; • Aplicar uma lei de navegação adequada com a finalidade de conduzir de modo autônomo a aeronave não tripulada em uma determinada trajetória. 21 No Capítulo 2 deste trabalho são apresentados os conceitos básicos sobre emprego e a arquitetura de controle de veículos autônomos. Além disso, um resumo sobre emprego de VANT pelos EUA e outros países é apresentado. Descreve-se ainda os esforços na pesquisa e aplicação de aeronaves não tripuladas pelo Exército Brasileiro e pela Força Aérea Brasileira. O Capítulo 3 apresenta os conceitos básicos sobre dinâmica de vôo e controle automático de aeronaves. Além disso, apresenta um resumo da técnica de controle LQG/LTR. Também são comentados os assuntos relacionados ao tabelamento de ganhos, lógica fuzzy e método de otimização de ordem zero, mais especificamente o método de Powell. O Capítulo 4 apresenta a modelagem de uma aeronave a partir das equações diferenciais não lineares e de seus coeficientes aerodinâmicos. Além disso, o modelo linearizado é determinado, bem como é apresentado o método de obtenção das condições iniciais e de equilíbrio. Diversas simulações em malha aberta são realizadas tanto para o modelo não linear como para o modelo linearizado a fim de se verificar a validade da aproximação. O Capítulo 5 apresenta os resultados do procedimento e da aplicação da técnica LQG/LTR na determinação de controladores robustos em diversos pontos de operação da aeronave, nos modos longitudinal e lateral. São mostrados os resultados do tabelamento de ganhos com interpolação difusa realizada, com parâmetros das funções de pertinência otimizados via método de Powell, bem com seus resultados em face de variações do modelo planta. São apresentados os resultados do controle de trajetória, através de controladores PID. Além disso, é apresentada a lei de navegação utilizada, bem como os resultados de sua aplicação em uma trajetória pré-determinada. No Capítulo 6, são apresentadas as conclusões e algumas sugestões para desenvolvimento de trabalhos futuros. 22 2 EMPREGO DE VEÍCULOS AÉREOS NÃO TRIPULADOS 2.1 INTRODUÇÃO Nos últimos trinta anos, houve um aumento muito grande na utilização de VANTs pelas forças armadas norte-americanas e de outros países. Estes veículos têm sido usados desde a década de 50, por ocasião da Guerra da Coréia e durante os conflitos mais significativos até então, como, por exemplo, a Guerra do Vietnã, as Guerras Árabe-Israelenses, a Guerra do Golfo, a Guerra da Bósnia e mais recentemente a Guerra do Afeganistão. Estas aeronaves têm se tornado uma parte integrante da guerra moderna, devido à sua capacidade de realizar missões tais como: - Reconhecimento e vigilância (marítimo, aéreo e terrestre); - Reconhecimento e neutralização de estações antiaéreas inimigas; - Guerra eletrônica, espionagem em altas altitudes; - Transmissão de imagens e dados de inteligência em tempo real; - Retransmissão de comunicações; - Guerra química (detecção de presença de agentes químicos no ar); - Análise e localização de alvos (FIG.2.1); FIG. 2.1. Imagens geradas a partir de um VANT. 23 - Designação a laser de objetivos; - Desativação de explosivos e minas; - Acompanhamento da movimentação tática/estratégica do inimigo; - Designação de alvos para ataques aéreos; - Verificação de danos provocados após os ataques; - Ajuste de tiro da artilharia. Estes veículos têm funções civis e governamentais, além das militares acima citadas, como: - Controle de áreas sujeitas a atividades ilegais; - Reconhecimento e controle de áreas suspeitas de atividades de narcotráfico; - Vigilância de itinerários e locais de reuniões de altas autoridades; - Controle de áreas com contaminação química ou nuclear; - Reconhecimento de áreas afetadas por fenômenos naturais (enchentes, terremotos etc.); - Busca e localização de falhas em linhas de transmissão, gasodutos, oleodutos, etc.; - Monitoramento e controle ambiental e ecológico (controle do desmatamento, das queimadas, das atividades de pesca e garimpo clandestinos etc.) - Emprego agrícola (controle de pragas, pulverização de agrotóxicos, etc.) Em suma, os veículos não tripulados são capazes de substituir o homem no desenvolvimento de atividades perigosas, de altíssimo risco, realizar tarefas em áreas de difícil acesso e condições ambientais desfavoráveis. As aeronaves não tripuladas têm as seguintes vantagens básicas em relação aos sistemas tripulados: manobrabilidade maior, tendo em vista a ausência de piloto e suas limitações de resistência a altas acelerações; custo reduzido; detecção por radar reduzida, em virtude de seu pequeno porte oferecer reduzida reflexão aos sinais de radar; possuem emissão de infravermelho extremamente baixa e níveis de ruídos bem inferiores aos dos sistemas tripulados; resistência maior; menos risco para o homem. Estes veículos transportam diversos equipamentos (carga útil, ou, em inglês, ‘payload’), que variam de acordo com sua missão, tais como câmaras fotográficas e de vídeo, retransmissores de comunicações, equipamentos de guerra eletrônica, laser para designação de alvos, radar, armamento, pulverizadores de agrotóxicos ou de armas químicas, sensores infravermelhos etc. 24 2.2 ARQUITETURA DE CONTROLE AUTÔNOMO Os veículos não tripulados podem ser classificados de acordo com seu nível de autonomia, ou seja, de acordo com sua capacidade de reagir ao ambiente, em três classes: - Autônomos - Semi-autônomos - Remotamente controlados Os veículos autônomos devem ser capazes de reagir ao seu ambiente de uma maneira inteligente. Esta inteligência pode estar junto ao veículo ou pode ser remotamente comunicada através de link no espaço livre. De qualquer modo, a área de interesse básico é o controle de vôo e suas diversas funções relativas que devem ser realizadas por um VANT a fim de cumprir sua missão com resultados favoráveis. As principais funções são as seguintes: - Navegação; - Guiagem; - Estabilidade e controle; - Comunicações; - Inteligência remota; - Tolerância a falhas. A navegação terá de ser realizada sob condições subsônicas com alta manobrabilidade ou até mesmo em condições supersônicas. O computador de bordo e sensores terão que permitir com precisão suficiente que o VANT alcance no tempo certo o ponto no espaço para que cumpra efetivamente a missão que lhe foi imposta. Para isto, a unidade de navegação inercial deve incluir acelerômetros e giroscópios para fornecer acelerações e velocidades angulares de seus três eixos ortogonais, que em conjunto com um receptor GPS fornecerá as informações para o sistema de controle e estabilidade da aeronave. Fundamental para o sistema de controle de vôo é o desenvolvimento das leis de controle, que tanto podem ser derivadas da teoria de controle clássico ou controle moderno, como teoria de controle não linear ou sistemas baseados no conhecimento. O VANT deve ser capaz de receber e enviar dados que incluem a posição atual, especificações da missão, coordenadas de engajamento de áreas e reconfiguração da missão. A inteligência desta aeronave deve ser robusta a fim de permitir continuar a missão até 25 mesmo sob determinadas falhas de sistemas de bordo. A confiabilidade de componentes é o primeiro nível de segurança que possibilita que a missão seja cumprida, além disso, a robustez se configura pela redundância, auto-reparo e realocação de recursos. Somente com a implantação deste nível extra de inteligência nos computadores de bordo da aeronave é que se possibilitará que uma missão seja cumprida sem a intervenção humana (MEYROWITZ et al., 1996). Sob situações de mal-funcionamento ou danos, sistemas de auto-reparo terão que ser capazes de realocar suas funções de prioridade para subsistemas redundantes ou fontes alternativas. Realocação de tarefas críticas (por exemplo, controle de atitude) para recursos redundantes (processadores reservas) permitirão que a missão continue com mínima degradação de seu desempenho. Por outro lado, se os recursos redundantes não estão disponíveis, tarefas críticas poderão suplantar outras menos críticas, mesmo que haja maior degradação do desempenho, sendo que poderá resultar ainda no sucesso da missão. Para que se atinja este nível de inteligência é necessária toda uma arquitetura de controle que permita a realização destas tarefas. A arquitetura de sistemas da maioria dos veículos autônomos inteligentes é baseada hierarquicamente ou funcionalmente (FRASER, 1990), ou pode ser definida paralelamente ou comportamentalmente. As formas hierárquicas freqüentemente possuem três ou mais camadas de abstração. Neste tipo de abordagem há uma decomposição hierárquica do problema principal em problemas menores e mais fáceis de serem resolvidos (CHANDLER & PACHTER, 1998). A arquitetura hierárquica é composta basicamente de quatro camadas, como mostra a FIG. 2.2. PLANEJAMENTO DA MISSÃO NAVEGAÇÃ0 CONTROLE DE TRAJETÓRIA CONTROLE DE ATITUDE OBJETIVOS DA MISSÃO E LIMITAÇÕES AERONAVE FIG. 2.2. Arquitetura de controle baseada na decomposição hierárquica. 26 Na camada mais alta da arquitetura de controle, funciona o planejamento/gerenciamento da missão, que opera segundo especificações globais da missão, produzindo objetivos secundários ou tarefas para alcançar um certo objetivo. Na camada imediatamente inferior está o módulo de navegação local, que utiliza um mapa detalhado para avaliar uma trajetória livre de obstáculos, definindo para onde a aeronave deve ir. As informações sobre altitude e orientação determinadas no módulo de navegação são fundamentais para o módulo de controle de trajetória, pois permitem a determinação do erro em relação às referências desejadas. Tipicamente, essas referências são especificadas via waypoints (pontos com altitude e orientação desejadas para o veículo) (SANDI et al., 1998). Trajetórias de vôo ideais para operações militares devem levar em conta diversos parâmetros que incluem limitações da aeronave e minimização da exposição a ameaças inimigas. Deste modo, trajetórias são funções das exigências da missão (tempo de chegada, ponto de chegada, etc.), limitações de desempenho da aeronave (quantidade de combustível, limites de potência, etc.) e ambiente hostil. Com isso, é necessário fazer uma otimização prévia de trajetórias, utilizando funções custo que inclui efeitos do tempo, riscos e posição final (VIAN et al, 1988). Planejamento de trajetória para veículos autônomos é um problema fundamental e esforços extensivos de pesquisa têm sido feitos na direção deste assunto (LATOMBE, 1991; HWANG & NARENDRA, 1992). Um dos primeiros métodos mais utilizados é a abordagem de campo potencial (KHATIB, 1986). A característica principal deste método é seu campo potencial escalar que representa tanto a força repulsiva para obstáculos como a força atrativa para os objetivos. O advento do sistema de posicionamento global (Global Posistionig System - GPS) forneceu uma poderosa ferramenta para obter dados acurados de navegação que propicia acompanhamento preciso de trajetórias inerciais preestabelecidas (KAMINER et al, 1998). Tradicionalmente, os sistemas de guiagem e navegação são projetados separadamente, usando bem estabelecidos métodos de projeto para controle e estratégias simples como linha de visada (‘line of sight – LOS’) para guiagem. LIN (1991) contém estudos interessantes sobre este tema. Durante a fase de projeto, o sistema de controle é usualmente projetado com largura de banda suficientemente grande para acompanhar os comandos que são esperados do sistema de guiagem. Em KAMINER et al. (1998) é proposta uma nova metodologia em que os sistemas de guiagem e sistema de controle são projetados simultaneamente. 27 No próximo nível, a tarefa de manter a altitude e rumo desejado é responsabilidade do controle de trajetória. Este módulo tem a função de processar dados de trajetória produzidos pelo sistema de navegação e compará-los com os dados da aeronave, gerando os sinais de erros correspondentes e transformando-os em comandos de altitude e direção desejados. Basicamente, os sistemas de guiagem de veículos autônomos são de dois tipos (HARRIS & CHARNLEY, 1992): - Tipo trajetória contínua (TC), que controla o veículo para seguir uma linha contínua; - Método ponto a ponto (PP), que controla o veículo para seguir um ponto objetivo intermediário. A principal vantagem do tipo TC sobre o método PP é que a aeronave estabelece um ponto corrente na trajetória através de transições suaves, isto é, evita grandes transições oriundas de comutação e grandes acelerações associadas de um segmento de trajetória para outro. O nível mais interno da arquitetura baseada na decomposição hierárquica compreende o controle de atitude e é responsável por manter a estabilidade da aeronave de maneira ótima, através de ação das superfícies de controle. Embora cada um destes níveis seja importante na operação do sistema global, este trabalho focalizará mais extensivamente na camada correspondente ao controle de atitude do veículo, a fim de estudar a abordagem de projeto de controladores robustos com tabelamento de ganhos. HARRIS & CHARNLEY (1992) relata que, para que uma determinada arquitetura de controle propicie o cumprimento das missões pretendidas, é de fundamental importância que o veículo autônomo seja capaz de: - Sensoriar seu ambiente tão bem quanto seus estados internos; - Interpretar esta informação sensorial para refinar seu vetor de estado. VANTs utilizam uma larga faixa de sensores, que inclui vídeo, eletro-óticos, infravermelho, ultra-sônicos, laser, rádio-freqüência, inerciais GPS, etc. Quaisquer que sejam os sensores usados, é essencial modelar precisamente o sensor e seus ruídos e conhecer as suas capacidades bem como suas limitações para as tarefas de medição exigidas. Em BARSHAN & DURRANT-WHYTE (1995) encontra-se um estudo extensivo da utilização de sensores inerciais, girômetros e acelerômetros, em robótica móvel. 28 2.3 RESUMO HISTÓRICO DO EMPREGO DE VANT PELOS EUA E OUTROS PAÍSES Nos Estados Unidos, aeronaves não tripuladas são utilizados há mais de cinqüenta anos. Do uso inicial como robôs-alvos e veículos remotamente pilotados, os EUA empregaram VANTs para reconhecimento durante a Guerra da Coréia (1950) e durante o conflito do Sudeste da Ásia. A marinha norte-americana tem estudado a viabilidade de operação de aeronaves de asas móveis desde 1960, como por exemplo, o robô aéreo lançador de torpedo QH-50 Gyrodyne. Entretanto, os altos custos e a imaturidade tecnológica adiaram o desenvolvimento destes sistemas de decolagem e aterrissagem vertical. Durante a Guerra do Vietnã (1965-1973), aeronaves não tripuladas de asa fixa, denominadas Lightning Bug (FIG.2.3), estenderam as suas missões além de simples de reconhecimento via fotografia para outras missões, como transmissão de imagens em tempo quase real, inteligência eletrônica (que aumentou a segurança de aviões tripulados durante o vôo sobre áreas hostis), contra-medidas eletrônicas, inteligência de comunicações em tempo real e avaliação de danos de batalha (para confirmar se um determinado alvo foi atingido). FIG. 2.3. Ryan 147 “Lightning Bug” em missão de reconhecimento. Apesar da diversidade de missões executadas por estas aeronaves, havia uma série de problemas operacionais a serem solucionados, tais como curto alcance das missões, perda de 29 link, baixa qualidade da imagem de vídeo, falta de aterrissagem automática, falha na recuperação da aeronave etc, que muitas vezes acarretava a perda das informações colhidas. Na Guerra do Yom Kippur (1973), houve a utilização drones (robôs aéreos) com bastante sucesso de pelas Forças Armadas de Israel para reconhecimento das defesas antiaéreas inimigas. Estas defesas constavam basicamente de baterias de mísseis antiaéreos soviéticos, que funcionavam como um ‘guarda-chuva’ de proteção para os exércitos egípcios e sírios face aos ataques aéreos judeus. Em 1982, no Vale do Bekaa (Líbano), novamente foram empregados com grande êxito na destruição de baterias de mísseis sírios. A FIG. 2.4 ilustra a ação destas aeronaves com emprego de inteligência eletrônica. FIG. 2.4. Operação de destruição de baterias de mísseis sírias com o uso de VANT para reconhecimento e isca para os mísseis antiaéreos. Por causa do sucesso israelense com VANTs, houve um aumento de interesse por parte dos norte-americanos em continuar desenvolvendo sistemas não tripulados mais confiáveis e robustos. Com isso, surgiu o sistema Pioneer, de iniciativa da Marinha Americana. Este programa teve início em 1985 e foi projetado para fornecer inteligência de imagem para comandos táticos na terra e no mar. Este tipo de aeronave foi utilizado na Guerra do Golfo Pérsico (1990-1991) em mais de 300 missões de reconhecimento, vigilância, comunicações, localização de minas terrestres, etc. Após estas operações, desde 1994, esta aeronave têm cumprido sua missões com sucesso na Bósnia, Haiti e Somália (JONES, 1997). 30 FIG. 2.5. VANT Pioneer e estação de controle terrestre Apesar do grande sucesso nestas operações, o Pioneer (FIG. 2.5) tinha suas limitações operacionais, tais como: - Ausência de decolagem e aterrissagem automática; - Razoável taxa de acidentes; - Problemas de telemetria, que influía na disseminação de dados para as unidades que necessitavam; - Desempenho desfavorável em caso de mau tempo. Apesar disso, o sucesso em grande parte de suas missões notabilizou as grandes potencialidades de VANTs e impulsionou de modo determinante o esforço norte-americano em prosseguir os projetos de aeronaves autônomas. Este impulso também motivou o desenvolvimento de sistemas de veículos de aterrissagem e decolagem vertical (Vertical Take-off and Landing Tatical Unmanned Aerial Vehicles – VTUAV) pela marinha norte-americana. O sistema VTUAV são usados a bordo de unidades navais e em terra pelos fuzileiros navais para fornecer dados e imagens em tempo quase real de reconhecimento, vigilância e de inteligência. Estes sistemas substituem o sistema Pioneer em todos os escalões táticos e são capazes de executar operações não tripuladas partindo de qualquer embarcação em que seja possível o pouso e decolagem de helicópteros, incluindo veículos anfíbios, cruzadores e destróieres. Adicionalmente, o VTUAV traz um aperfeiçoamento na capacidade dos sensores para a artilharia naval, especialmente para o sistema de munições guiadas de longo alcance e mísseis 31 de ataque terrestre. Há vários tipos de VTUAV sendo desenvolvidos, como mostram as FIG. 2.6, 2.7 e 2.8. FIG. 2.6. VTUAV Argus FIG. 2.7 VTUAV Eagle Eye FIG. 2.8. VTUAV Guardian A partir 1994, houve o desenvolvimento do sistema de aeronave não tripulada de asa fixa denominado Predator para satisfazer exigências de missões de reconhecimento vigilância e aquisição de alvos. O Predator tem um alcance aproximado de 500 milhas e tem capacidade de fornecer informações de dados e imagens em tempo próximo do real. A sua atividade operacional teve início no cenário internacional com vôos diurnos realizados partindo de bases na Albânia e, mais tarde, da Hungria. A partir de novembro de 1998, os vôos foram realizados sobre a Bósnia, partindo da Hungria. Em 1999, foram realizadas missões sobre a Bósnia e Kosovo, apoiando as forças da Otan que operam nos Bálcãs. Partindo do Kuwait, realizou missões de apoio às operações aliadas de proibição de vôos sobre a zona de exclusão ao sul do Iraque. Em Outubro de 2001, o Predator foi empregado no Afeganistão para 32 fornecer informações de inteligência para as forças lideradas pelos EUA na Operação Liberdade Duradoura. FIG. 2.9. RQ-1 Predator MAE UAV. Cada sistema Predator consiste de quatro aeronaves RQ-1A Predator (FIG.2.9), uma estação de controle de terra e um sistema de comunicações via satélite. O Predator é um avião leve (cerca de uma tonelada como todos os equipamentos e tanque de combustível completo), com 8,22 m de comprimento e 14,8 m de envergadura, que pode permanecer no ar por aproximadamente 24 horas, voando a uma distância de até 750 km do seu ponto de lançamento, e que pode alcançar um teto de 7 620 m, com uma velocidade de cruzeiro de 160 km/h. A carga útil (payload) pesa cerca de 200 kg e incluem câmeras de televisão e sensores infravermelhos e eletro-óticos, assim como um radar de abertura sintética para observar através das nuvens. O Predator é capaz de enviar imagens em tempo real a uma estação terrestre localizada em linha de visão direta até uns 240 km a uma velocidade de 30 imagens por segundo. Através de transmissão via satélite, pode se comunicar com uma estação mais longínqua, enviando 15 imagens por segundo, quase em tempo real. A melhoria significativa das capacidades do Predator em relação ao seu antecessor (Pioneer) deveu-se à revolução da eletrônica, que habilitou a este tipo de aeronave realizar a maioria, se não todas, das missões de reconhecimento do campo de batalha. A eletrônica atual, microprocessadores e redes de comunicações permitiram ao Predator, usando navegação auxiliada pelo GPS, a voar autonomamente ou ser reconfigurado dinamicamente em vôo, a sobrevoar uma área de interesse por até 24 horas enquanto coleta imagens de alta qualidade via sensores eletro-óticos, infravermelho, e então transmitir estas imagens através de satélites para aviões de guerra em todos os escalões de comando (JONES, 1997). 33 A partir de 1994, os Estados Unidos começaram a desenvolver dois sistemas de aeronave não tripulada para altas altitudes e de longa duração (‘High Altitude Endurance - HAE UAV’), Dark Star e Global Hawk, para cumprir as seguintes missões: - Capacidade prolongada de reconhecimento e vigilância; - Capacidade de cobertura ampla de imagens em grandes áreas; - Recepção assegurada de dados e imagens para forças táticas. O sistema Dark Star (FIG.2.10) tem a capacidade de penetrar e sobreviver em áreas altamente defendidas, devido às suas características de baixa observabilidade, que minimiza a detectabilidade de radares inimigos. Ele poderá operar com um alcance de 500 milhas náuticas e será capaz de sobrevoar uma área-alvo por mais de 8 horas em uma altitude de 45.000 pés. FIG. 2.10. RQ-32A Dark Star O Global Hawk foi projetado para fornecer capacidade de reconhecimento estendida para o comando de forças tarefas, que consiste na capacidade de fornecer dados ou imagens para qualquer lugar dentro do território inimigo, em quaisquer condições de tempo, através de link com satélites ou visada direta. 34 As operações do Global Hawk (FIG.2.11) tem um alcance de até 3.000 milhas náuticas com capacidade de sobrevoar a área objetivo acima de 24 horas em altitudes maiores do que 60.000 pés. FIG. 2.11. Global Hawk De acordo com um artigo na edição de 03 de julho de 1996 de “Jane’s Defence Weekly”, a Força Aérea norte-americana e a Força Aérea Real do Reino Unido têm avaliado a possibilidade de aeronaves de combate não tripuladas. Isto mostra claramente que tanto os governos quanto à população destes países estão cada vez mais sensíveis à potencial perda de vidas humanas para se alcançar objetivos militares. Os mísseis Tomahawk, usados extensivamente na Guerra do Golfo, ofereceram uma solução parcial para a necessidade de destruir alvos sem perda ou captura de pilotos. Embora os resultados alcançados com os mísseis do tipo cruzeiro sejam bastante favoráveis, o custo de um milhão de dólares por unidade é uma limitação significante para o uso maciço destas armas. Por outro lado, caçasbombardeiros tripulados podem executar seus ataques com um custo bem menor (aproximadamente de 1.000 a 15.000 dólares cada munição lançada). Uma aeronave de combate não tripulada pode cumprir suas missões de ataque com um custo efetivo que se encontra entre os custos dos mísseis Tomahawk e caças tripulados. O ponto de partida seria adaptar uma plataforma existente, como o F-16, para testar tecnologias existentes e a doutrina operacional. Caso a Força Aérea modifique um avião de linha, este poderia operar tanto no modo tripulado como no modo não tripulado, dependendo do alvo e do tipo de ameaças a serem enfrentadas (JONES, 1997). Desde os anos 70, Alemanha, França, Itália, Grã-Bretanha e Bélgica destacam-se pela utilização de sistemas muito elementares - simples aviões remotamente controlados -, mas de 35 uma década para cá se introduziram notáveis avanços tecnológicos, que melhoraram consideravelmente os sistemas, não apenas no que se refere a aviões e sistemas de lançamento, mas também a estações de controle e recepção de dados e processamento de imagens. Esses avanços, por sua vez, provocaram uma maior demanda de VANT e uma maior experimentação dos mesmos. Na operação Tempestade no Deserto (Guerra do Golfo), os franceses utilizaram o VANT MART em missões de vigilância, reconhecimento, aquisição de alvos e controle de tiro. O exército britânico por sua vez já contava com informações um dia antes de sua chegada no teatro de operações, fornecidas pelo seu sistema de VANT CL-289. Na Europa, a recente utilização de VANT no conflito de Kosovo foi a melhor indicação de que esses sistemas estão alcançando certo amadurecimento, e sua utilização está se estendendo entre os principais exércitos europeus. Cerca de 15 países daquele continente já possuem em serviço diferentes tipos de VANT, e outros países já se mostraram interessados na sua aquisição. FIG. 2.12. Sistema de lançamento da aeronave não tripulada modelo CL-289 A Alemanha tem alcançado um excelente estágio no desenvolvimento de VANT de curto alcance para utilização tática por parte das forças terrestres, e sua indústria oferece no mercado internacional a gama mais ampla de opções. As forças armadas alemãs dispõem atualmente de 11 sistemas CL-289 (FIG.2.12), que, em breve, serão equipados com radares Sword de abertura sintética. O CL-289 é um projeto conjunto da Alemanha, França e Canadá, que entrou em serviço em 1990. Atinge os 740 km/h, tem um raio de ação de 180 a 200 km e pode operar a uma altitude de 600 m. Para missões de reconhecimento e designação de 36 objetivos, o Exército alemão iniciou a aquisição de oito sistemas Brevel (FIG. 2.13), da Eurodrone, equipados com câmeras infravermelhas, o primeiro dos quais entrou em serviço recentemente. O Eurodrone Brevel tem uma autonomia de vôo de dez horas e atinge velocidades entre 120 e 200 km/h. FIG. 2.13. Sistema de lançamento da aeronave não tripulada modelo Brevel A França vem desenvolvendo o programa Piver, pelo qual foram adquiridos quatro sistemas CL-289, que, na França, são fabricados pela Aerospatiale, equipados com câmeras óticas e sensores infravermelhos, e estão sendo avaliados outros sistemas. Junto com a Alemanha, tem participado também no desenvolvimento do Brevel. Além destes, a França possui VANT de reconhecimento denominado Crecerelle (FIG.2.14). FIG. 2.14. Aeronave não tripulada modelo Crecerelle (França). O Crecerelle pode transmitir informações até uma faixa de 75 km e tem capacidade de vôo para 5 horas. A idéia de desenvolver VANT de combate está sendo considerada na França, e a Dassault Aviation, junto com o ONERA (‘Office Nationale d’Etudes et Researches Aeroespatiales’) e a Força Aérea, está desenvolvendo um programa para possibilitar que 37 UAV armados e caça-bombardeiros tripulados troquem informações e operem de forma coordenada. A Grã-Bretanha possui sistema de VANT de reconhecimento e observação para o Exército. Trata-se de 20 sistemas Phoenix (FIG. 2.15) com 200 aviões, desenvolvido pela Marconi. FIG. 2.15. Sistema de lançamento da aeronave não tripulada modelo Phoenix Israel é, fora a Europa e os Estados Unidos, a grande potência no desenvolvimento de UAV desde 1974. Em 1988, foi criada IAI MALAT Division, especializada no projeto, integração e fabricação de VANT. Outros países fora do eixo EUA-Europa que estâo desenvolvendo sistemas de aeronaves não tripuladas são a África do Sul (Seeker-Kentron – FIG.2.16), Iraque (Conversão de L-29 em VANT visando ataque com lançamento de agentes químicos), Austrália (Mark 103B, Vindicator), China (Observer 1, Chang Hong 1, ASN-206, DP-4 RD), Coréia do Sul (ARCH50), Turquia (Annasnas, Kirlangic, Dogan, Firefly, UAV-X1), Japão(Cranfield A3), Índia (Nishant RPV), Paquistão (Bravo), entre outros. FIG. 2.16. Seeker-Kentron (África do Sul) 38 2.4. ESTÁGIO DA PESQUISA E DESENVOLVIMENTO DE VANTS NO EXÉRCITO BRASILEIRO No Centro Tecnológico da Aeronáutica (CTA), a partir da década de 80, foram realizados os primeiros estudos sobre aeronaves não tripuladas, inclusive com a construção de protótipo (aeronave Acauã, FIG. 2.17). A aeronave foi desenvolvida pelo CTA e tem raio de ação de 150 km. Pertence à Classe “Pioneer” Israelense. Os primeiros ensaios em vôo tinham o objetivo de obter capacitação na área de VANT. O projeto de VANT foi desativado parcialmente em 1991 e o protótipo foi repassado para o Instituto de Pesquisa e Desenvolvimento(IPD), uma vez que o Exército Brasileiro mostrou interesse no desenvolvimento de aeronaves não tripuladas. No IPD, no ano de 1999, foi criada uma linha de pesquisa visando o emprego de VANT pelo Exército Brasileiro(EB), através da reativação do projeto de veículo aéreo não tripulado de asa fixa, cedido pela Força Aérea Brasileira (FAB), tendo em vista que, pelas suas características, mostra-se adequado às missões de emprego tático do EB FIG. 2.17. VANT Acauã A Linha de Pesquisa em Veículos Não Tripulados tem os seguintes objetivos: - Dominar tecnologias empregadas em veículos controlados remotamente destinados a aplicações militares; - Capacitação de recursos humanos na área de VANT e de sistemas inerciais; - Gerar novas tecnologias de emprego civil e militar; - Formar parcerias com outras instituições. 39 Como resultado da cooperação entre o IPD e o Instituto Militar de Engenharia(IME), foram realizados diversos estudos em áreas técnicas específicas e foi realizado o primeiro vôo da plataforma de testes LANU-1,no ano 2000, com transmissão de imagens em tempo real. Atualmente, a linha de pesquisa em VANT do IPD está desenvolvendo trabalhos conjuntos com o CTA, visando à recuperação da plataforma de testes ACAUÃ, para que ensaios em vôo possam ser realizados na área do Centro Tecnológico do Exército (CTEx). Paralelamente, estão sendo feitos estudos na área de navegação por GPS e link de comunicações. No âmbito do Instituto Militar de Engenharia, o interesse por aeronaves não tripuladas teve início no ano de 2000, quando foi realizado o Curso de Veículos Autônomos Inteligentes (Sikorsky). Após este evento, visando atender os interesses do IPD, o curso de Pós-Graduação em Sistemas de Controle do Departamento de Engenharia Elétrica do IME inicia, com este trabalho, um ciclo de capacitação de engenheiros militares em modelagem, controle e guiagem de veículos autônomos não tripulados. No Departamento de Engenharia Mecânica e de Materiais (DE/4), do Instituto Militar de Engenharia (IME), como Projeto de Final de Curso (PFC) para o ano de 2001 do 10 Ten Ricardo Souza Ferreira de MELLO, desenvolve-se um trabalho que viabilizará numa etapa posterior a construir e inscrever uma aeronave remotamente controlada em uma competição da SAE Aerodesign, realizada todos os anos entre as faculdades de engenharia do Brasil. Este PFC é continuação de esforço anterior, como projeto de Iniciação à Pesquisa (IP), em 2000, onde foi feito um anteprojeto de uma aeronave remotamente controlada, cujo perfil operacional está contido nos requisitos impostos pela SAE. No Instituto Tecnológico da Aeronaútica (ITA), no ano de 2000, foi feito um dos primeiros trabalhos acadêmicos na área de VANT por um Oficial do Exército Brasileiro (Márcio Amberget Rosa). Este trabalho, cujo título é Análise Conceitual de uma Aeronave não-tripulada de Reconhecimento (Trabalho de Graduação), tem por finalidade fazer a análise conceitual de uma aeronave não tripulada para cumprir missões de reconhecimento. Neste trabalho, são analisados diversos aspectos da aeronave, tais como peso, aerodinâmica, propulsão, desempenho, estabilidade e controle e custos.Esta análise baseou-se nas técnicas de projeto apresentadas no livro “Aircraft Design: A Conceptual Approach”, de Daniel P. Raymer. Neste ano de 2001, um trabalho está sendo realizado, em fase inicial, por outro oficial do Exército Brasileiro (Cap Eliézer), que atualmente está no 40Ano de Graduação em Engenharia Aeronáutica, no Instituto Tecnológico da Aeronáutica (ITA), constando entre 40 outras atividades o cálculo de todos os coeficientes derivativos do VANT construído pelo CTA. Estes coeficientes derivativos serão calculados por um software de análise e projeto de aeronaves adquirido por aquele centro. Estes valores calculados são de fundamental importância para a modelagem da aeronave, o que contribuirá em muito o projeto que está sendo desenvolvido pelo IPD. Na Escola de Aperfeiçoamento de Oficiais (EsAO), está em andamento um trabalho onde se visualiza o emprego de aeronaves não tripuladas como um novo meio de observação e reconhecimento. A introdução de VANT como sistemas táticos de reconhecimento aéreo antevê uma grande repercussão na verificação e avaliação da doutrina, tendo em vista que uma vasta gama de informações reais e consistentes serão obtidas em tempo quase-real, auxiliando no processo decisório, permitindo o emprego mais eficaz dos modernos sistemas de armas e o emprego de tropas em locais e momentos oportunos. O aumento da participação de VANT em conflitos já é uma realidade. A implantação de VANT nas Forças Armadas Brasileiras se torna uma necessidade. Um programa de desenvolvimento de aeronaves não tripuladas, mesmo que em quantidades reduzidas, como demonstradores de tecnologia, mostra-se perfeitamente factível, ainda mais se levando em consideração a participação das organizações de pesquisa e desenvolvimento do Ministério da Defesa (Instituto de Pesquisas da Marinha (IpqM) – Marinha, IPD – Exército, CTA-FAB). 41 3 SUPORTE TEÓRICO UTILIZADO 3.1. CONCEITOS BÁSICOS SOBRE MECÂNICA DE VÔO E CONTROLE DE AERONAVES 3.1.1. INTRODUÇÃO O estudo da mecânica de vôo trata do movimento da aeronave e se divide normalmente em duas partes: estudo do desempenho e o estudo da estabilidade e controle. No estudo do desempenho de uma aeronave é analisada a capacidade desta em realizar determinadas manobras de vôo, tais como velocidade de trajetória (velocidade mínima, velocidade máxima, velocidade de cruzeiro), distâncias percorridas, ângulo de subida e descida. No estudo da estabilidade e do controle se analisa o movimento do avião em torno do centro de gravidade devido ao aparecimento de momentos de origem aerodinâmicas e/ou inerciais. Esse movimento pode ser originado por perturbações atmosféricas (rajadas de vento, turbulência) ou por modificações nas posições das superfícies de controle. Em termos práticos, quando se refere à estabilidade e o controle, preocupa-se com a capacidade de um aeroplano ser capaz de alcançar um vôo reto e nivelado, mesmo após ter sofrido perturbação externa, sem interferência do piloto, e com a possibilidade de manobrar a aeronave ao longo de uma trajetória de vôo escolhida. Para realizar manobras o avião deve possuir mecanismos de controle propulsivos e aerodinâmicos adequados. O estudo das qualidades de vôo de uma aeronave envolve a descrição do movimento de uma massa sujeita a forças de inércia, forças propulsivas e aerodinâmicas. Basicamente requer o desenvolvimento de: • Equações de forças: relacionando translações da massa total com as forças externas aplicadas (propulsão, forças aerodinâmicas e atração gravitacional); • Equações de momento: relacionando seus movimentos angulares (aceleração e velocidade) aos momentos envolvidos pela interação com forças externas. 42 • Equações elásticas: relacionando os efeitos das deformações da estrutura ao carregamento imposto sobre ela. • Equações cinemáticas: relacionando seus movimentos rotacionais em relação ao referencial inercial. O projeto de uma aeronave moderna segue basicamente a seguinte seqüência: • Estudo do comportamento de uma aeronave através de análise definida em termos de sistemas de equações matemáticas determinadas pela teoria; • Levantamento dos vários parâmetros e coeficientes aerodinâmicos em túneis de vento; • Realização de simulações computacionais com todos os parâmetros levantados; • Ensaio rigoroso da aeronave em vôo para: verificar as qualidades de vôo esperadas, para eliminar imperfeições ou apontar possíveis áreas de melhoria no projeto. 3.1.2. MOVIMENTO DA AERONAVE EM TORNO DE CENTRO DE GRAVIDADE Os movimentos de um avião se realizam sobre três eixos. A FIG. 3.1 abaixo ilustra esses movimentos: FIG. 3.1. Movimentos de uma aeronave nos três eixos. A rotação em torno de eixo longitudinal é chamada de movimento de rolamento (roll) e é afetado pela atuação do aileron. 43 A rotação em torno de eixo lateral é chamada de movimento de arfagem (pitch) e é afetado pela atuação do profundor. A rotação em torno de eixo vertical é chamada de movimento de guinada (yaw) e é afetado pela atuação do leme. A ação de controle é o conjunto de forças de acionamento capaz de fazer o avião seguir uma determinada trajetória. Movendo-se as superfícies de controle, modifica-se o fluxo de ar da superfície do avião, dando origem a variações no equilíbrio das forças atuantes, fazendo com que ocorram mudanças de atitude durante o vôo. É usual na literatura clássica, durante o estudo de estabilidade da aeronave, separar os movimentos em dois modos: longitudinal e látero-direcional, pois desta maneira as equações do movimento são simplificadas, facilitando a análise dos resultados. No estudo do movimento longitudinal, somente o movimento de arfagem é considerado e supõe-se que a velocidade está alinhada no plano de simetria da aeronave. No modo látero-direcional, os movimentos de guinada e rolamento são estudados em conjunto, considerando que o vetor velocidade não está mais alinhado com o plano de simetria. O estudo da estabilidade latero-direcional envolve as interações existentes entre os movimentos de guinada e rolamento. Quando a aeronave guina em relação a uma certa trajetória, aparecem momentos tanto de guinada como de rolamento, ocorrendo o mesmo quando a aeronave está sujeita a um rolamento. Um estudo detalhado da estabilidade e controle de aeronaves consta da literatura clássica da área (ETKINS, 1972; ROSKAM, 1979; NELSON, 1989; BLAKELOCK, 1991). 3.1.3. SISTEMAS DE COORDENADAS Basicamente, trabalha-se com três sistemas de coordenadas: • Sistema de coordenadas locais; • Sistema de eixos aerodinâmicos; • Sistema de coordenadas do veículo. O sistema de coordenadas local está referenciado à Terra, suposta plana e não girante, com sua origem em algum ponto na superfície. O eixo Ozo está na direção vertical, 44 apontando para o centro do planeta. O eixo Oyo e o eixo Oxo estão contidos no plano horizontal. O eixo Oxo está apontado no sentido do movimento. O sistema de eixos aerodinâmicos (Gxayaza) tem sua origem no centro de gravidade (G) da aeronave, com Gxa coincidindo com a direção do vetor velocidade. O eixo Gza é normal a Oxa e se situa no plano de simetria da aeronave, com o eixo Gya completando o sistema dextrógero. O ângulo que o vetor velocidade forma com o plano horizontal é denominado por γ e é denominado ângulo de trajetória de vôo. A FIG.3.2 mostra o sistema de eixos aerodinâmicos juntamente com o sistema de coordenadas locais. FIG. 3.2. Sistema de coordenadas locais e sistema de eixos aerodinâmicos. 45 O sistema de coordenadas do veículo (Gxyz) é um conjunto de três eixos ortogonais fixos na estrutura do veículo e tem sua origem centro de gravidade (G) da aeronave, com Gx e Gz situados no plano de simetria da aeronave, com o eixo Gx ao longo do eixo longitudinal (positivo na direção da nacete do avião) e o eixo Gz apontando na direção do ventre do avião. O eixo Gy forma o sistema dextrógero, ou seja, está orientado positivamente à direita do piloto. A FIG. 3.3 ilustra este sistema. FIG. 3.3. Sistema de coordenadas do veículo O ângulo entre Gxa e Gx, ângulo entre a velocidade e a direção de referência do avião, é o ângulo de ataque α. O ângulo entre os eixos Gx e Gxo , que relaciona a posição do avião com relação à Terra ( e portanto com relação à vertical local) é o ângulo de arfagem θ. Estes dois ângulos podem ser melhor visualizados na FIG. 3.4. FIG. 3.4. Sistema de coordenadas do veículo e sistema de eixos aerodinâmicos, para guinada nula 46 A relação entre os sistemas de coordenadas do veículo e o sistema de coordenadas local é obtida através dos ângulos de Euler (θ,φ,ψ), que estão representados na FIG.3.5 e são denominados respectivamente por ângulo de arfagem θ (‘pitch’), ângulo de rolamento φ (‘roll’) e ângulo de azimute ψ. FIG. 3.5. Sistema de coordenadas do veículo e o sistema de coordenadas local No caso de guinada, o ângulo que o vetor velocidade forma com o plano de simetria da aeronave é chamado de ângulo de deslizamento lateral(β). 47 A relação entre o sistema de coordenadas do veículo e o sistema de eixos aerodinâmicos é obtida em função destes dois ângulos (α e β). A FIG.3.6 apresenta a relação entre estes dois sistemas de coordenadas. FIG. 3.6. Sistema de eixos aerodinâmicos e sistema de coordenadas do veículo. 3.1.4. FORÇAS E MOMENTOS ATUANTES NO AVIÃO A principais forças e momentos que atuam sobre a aeronave são a força gravitacional, as forças e os momentos aerodinâmicos e a força e o momento de propulsão. A força peso está aplicada no centro de gravidade da aeronave e está alinhada com o eixo Gz0. O ângulo entre a vertical Gzo e o eixo Gza é o ângulo de trajetória γ. Com isso, as componentes do peso no sistema aerodinâmico são: - sobre Gxa : -mg sen γ - sobre Gya : 0 - sobre Gza : mg cos γ As forças aerodinâmicas são o arrasto (D), a força lateral (FY) e a sustentação (L), e são calculadas por meio de coeficientes aerodinâmicos. Estes coeficientes são levantados 48 através de ensaios em túneis de vento e são representados como funções do ângulo de ataque α, ângulo de deslizamento β e deflexões das superfícies de controle. São as seguintes equações que definem os módulos das forças aerodinâmicas: D= 1 ρSVT 2 C D 2 EQ 3.1 L= 1 ρSVT 2 C L 2 EQ 3.2 FY = 1 ρSVT 2 CY 2 EQ 3.3 onde ρ é a densidade atmosférica S é a área de referência VT é a módulo da velocidade total da aeronave CD, CL, CY são os coeficientes de arrasto, de sustentação e de força lateral, respectivamente. No sistema de eixos aerodinâmicos, estas forças são componentes do vetor força resultante e são representadas por: → → → → F = − D i + FY j − L k EQ 3.4 Os momentos devido à aerodinâmica da aeronave são determinados por meio de coeficientes de momento, que por hipótese atuam no centro aerodinâmico da asa e do corpo. Estes coeficientes dependem do ângulo de deslizamento β, das velocidades angulares p, q e r, do número de Mach e das deflexões das superfícies de controle. As componentes do momento aerodinâmico no sistema do avião são dados por: → → → → M a = l i + m j+ n k EQ 3.5 sendo l denominado momento de rolamento, m de momento de arfagem e n de momento de guinada, cujos módulos são calculados por : l= 1 ρSV 2 cC l 2 EQ 3.6 m= 1 ρSV 2 cC m 2 EQ 3.7 n= 1 ρSV 2 cC n 2 EQ 3.8 onde c é a corda aerodinâmica média da asa e Cl, Cm, Cn são os coeficientes de momento de rolamento, de momento de arfagem e de momento de guinada, respectivamente. 49 A força propulsiva é fornecida pelo motor da aeronave e a componente na direção GY não é considerada para fins de estudo mais simplificado. Os momentos devidos a esta força também são, na maioria dos casos estudados, considerados nulos. Um dos casos em que os momentos devido à força propulsiva são considerados é quando aparece algum desalinhamento ou pane nos motores. De um modo geral, supõe-se que esta força depende: da posição da manete de combustível, da altitude e da velocidade. 3.1.5. EQUAÇÕES DE MOVIMENTO DO CORPO As equações do movimento de uma aeronave são obtidas a partir da segunda lei de Newton. Esta lei estabelece que a soma de todas as forças externas atuantes no corpo é igual à derivada em relação ao tempo do momento do corpo, e que a soma dos momentos externos atuantes no corpo é igual à derivada de seus momentos angulares. As derivadas são referidas ao espaço inercial. A segunda lei de Newton pode ser expressa pelas seguintes equações vetoriais: → → d ∑ F = dt (mV ) → → d ∑ M = dt (m H ) EQ 3.9 EQ 3.10 Para a derivação das EQ 3.9 e EQ 3.10, foram feitas as seguintes hipóteses básicas: - A massa da aeronave permanece constante durante a análise dinâmica; - A aeronave é considerada um corpo rígido; - A Terra é considerada um referencial inercial. - A Terra é considerada plana; - As propriedades da atmosfera são consideradas independentes da altitude; Como a massa é considerada constante, as EQ 3.9 e 3.10 tornam-se → ∑F = m → d → V dt EQ 3.11 d → H dt EQ 3.12 ∑M = m 50 Procedendo ao desenvolvimento destas equações de modo semelhante a BLAKELOCK (1991), obtém as seguintes expressões para o movimento linear: . ∑F = m(U + WQ − VR) x ∑F EQ 3.13 . y = m(V + UR − WP) z = m(W + VP − UQ) EQ 3.14 . ∑F EQ 3.15 onde → Fx, Fy, Fz são as componentes de F nos eixos do corpo x, y, z → U, V, W são as componentes de V T nos eixos do corpo x, y, z → P, Q, R são componentes da velocidade angular ω nos eixos do corpo x, y, z As equações de movimento angular são . ∑ L = PI . x − R J xz + QR( I z − I y ) − PQJ xz EQ 3.16 + PR ( I x − I z ) + ( P 2 − R 2 ) J xz EQ 3.17 . ∑ M = QI . y . ∑ N = RI z − P J xz + PQ( I y − I x ) − QRJ xz EQ 3.18 No sistema aerodinâmico, as equações referentes a α , β e a magnitude da velocidade total VT são necessárias, onde VT = U 2 + V 2 + W 2 . Procedendo de modo similar ao que consta em BLAKELOCK (1991), obtém-se as seguintes equações: q SC D q SCY T cos β + g x + V&T = + g x cos α + g z sen α − m m m sen β q SC L T − m + g x sen α + g z cos α − m + Q − ( R sen α + P cos α ) EQ 3.19 α& = 1 VT cos β β& = q SC D q SCY 1 T sen β + g x + cos β + P sen α − R cos α + g x cos α + g z sen α − VT m m m EQ 3.20 EQ 3.21 onde T é o empuxo do motor, q é a pressão aerodinâmica e gx, gy, gz são as componentes da força da gravidade ao longo dos eixos da corpo da aeronave e são definidas pelas seguintes expressões: g x = −mg sen θ 51 EQ 3.22 g y = mg cos θ sen φ EQ 3.23 g z = mg cosθ cos φ EQ 3.24 A fim de descrever o movimento da aeronave em relação à Terra, é necessário especificar a orientação de um sistema de eixos em relação ao outro. Isto pode ser feito através dos denominados ângulos de Euler, já discutido na seção 3.1.3. Transformando as componentes das velocidades angulares da aeronave do sistema de coordenadas local para o sistema de coordenadas do veículo, obtém-se P = φ& − ψ& sen θ EQ 3.25 Q = φ& cos φ − ψ& cosθ sen φ EQ 3.26 R = −φ& sen φ − ψ& cosθ cos φ EQ 3.27 3.1.6. CONSIDERAÇÕES SOBRE SISTEMAS DE CONTROLE DE VÔO A análise clássica da dinâmica de uma aeronave é realizada decompondo-a em dinâmica longitudinal e dinâmica lateral. Os modos característicos da dinâmica longitudinal, para a maior parte das aeronaves, são representados por duas oscilações (dois pares de pólos complexos conjugados): uma de curto período, com amortecimento relativamente alto (modo fugóide) e outra com período mais longo, com muito pouco amortecimento (modo de curto período)(BLAKELOCK, 1991, p.40). A dinâmica lateral na maioria das aeronaves é identificada pelos seguintes modos: rolamento Dutch (devido a pólos complexos conjugados), subsidência de rolamento, ou em inglês, roll subsidence (devido a um pólo estável) e divergência em espiral (devido a um pólo instável bem próximo da origem). O amortecimento do modo de rolamento Dutch varia com o tipo de aeronave e condições de vôo e de modo geral se caracterizam pelo coeficiente de amortecimento alto. O modo subsidência de rolamento é a resposta de rolamento da aeronave para uma entrada no aileron. A divergência em espiral não é muito considerada visto que possui constante de tempo muito alta.(BLAKELOCK, 1991, p.124). Os modos de uma aeronave podem ser classificados de acordo com os graus de liberdade no movimento de rotação e movimento de translação. Os modos que são afetados pelos movimentos de rotação em torno dos eixos são: o curto período, subsidência de rolamento e 52 rolamento Dutch. As suas freqüências naturais são determinadas pelos momentos de inércia da aeronave e pelos momentos gerados pelas superfícies aerodinâmicas. O amortecimento é determinado pelos momentos aerodinâmicos. Já os modos fugóide e espiral envolvem mudanças na trajetória e são mais lentos. O modo fugóide envolve mudanças na translação e é dependente das forças aerodinâmicas de arrasto e sustentação. O modo espiral depende de momentos aerodinâmicos. A capacidade de resposta de uma aeronave para comandos é caracterizada pela velocidade dos modos rotacionais. As freqüências destes modos são geralmente altas, dificultando o controle da aeronave caso estes modos não sejam amortecidos ou estabilizados. Portanto, é necessário aplicar técnicas de controle para dar a estes modos amortecimentos e freqüências naturais adequadas (STEVENS & LEWIS, 1991). Um sistema de controle usado em vôo, ou piloto automático, possui basicamente funções relativas ao controle de atitude e à guiagem. O controle de atitude caracteriza-se pelo desenvolvimento e aplicação de forças e momentos nas superfícies de atuação aerodinâmicas e propulsivas visando a estabelecer um estado de equilíbrio (ponto de operação) de forma a sempre retornar a este estado após uma perturbação. A guiagem se preocupa em manter o centro de gravidade da aeronave sobre uma determinada trajetória. O sistema de controle de vôo realiza estas duas funções em duas malhas distintas: uma malha mais interna, que se ocupa com o controle de atitude, e outra externa responsável pela guiagem. A malha de controle interna é fundamental em todos os tipos de sistemas de controle automático de vôo e é responsável pela estabilização da aeronave. Basicamente, possui os seguintes componentes: sensores de atitude (giroscópios, girômetros e acelerômetros), detector de erro, controlador (processa o sinal de erro e converte em comando do servo– atuador) e servo-mecanismos (para converter o sinal processado em movimento dos atuadores da aeronave). A malha de controle externa processa os sinais de guiagem, oriundos dos sensores de navegação. Os modos de operação, onde o controle é baseado na malha externa, são os modos látero-direcionais (modo de manutenção de proa, modo de navegação, modo de aproximação etc.) e os modos verticais (modo de subida, modo de descida, modo de aproximação, modo de manutenção de altitude, modo de pré-seleção de altitude etc.). 53 3.2. TÉCNICA LQG/LTR As equações diferenciais não-lineares descritas no item 3.1 são consideradas apenas uma aproximação para a real dinâmica de uma aeronave. Dinâmicas não modeladas de altas freqüências são desprezadas, como por exemplo, os modos flexíveis, e podem até levar o sistema à instabilidade, em determinadas condições de vôo. Os efeitos em baixa freqüência, como por exemplo, mudanças das condições de vôo em equilíbrio, assim como outras variações paramétricas, podem também atuar e desestabilizar a aeronave. Para compensar estas variações, uma das várias alternativas é utilizar técnicas de controle com tabelamento de ganhos, para cobrir todo o envelope de vôo. É essencial que o controlador calculado em cada ponto de equilíbrio garanta estabilidade nos pontos imediatamente adjacentes. Assim o importante é projetar controladores que satisfaçam o requisito da robustez em estabilidade, que é a capacidade de fornecer estabilidade a despeito dos erros de modelagem devido às dinâmicas não modeladas e às variações paramétricas. Perturbações externas (rajadas de vento, turbulências etc) e ruídos dos sensores de medida causam freqüentemente degradação do desempenho. Assim, no projeto de controladores, é fundamental que também seja atendida uma certa robustez em desempenho. Uma abordagem bem conhecida para o projeto de controladores robustos, a uma determinada classe de incertezas, é o método LQG/LTR. Esta técnica é bem conhecida na literatura corrente e tem sido bastante utilizada em projeto de sistemas de controle de vôo. Dentre as características principais desta técnica cita-se: - Garante boa robustez em face de determinada classe de erros de modelagem; - É uma técnica bem apropriada para aplicações multivariáveis; - O procedimento de projeto é de natureza sistemática; - A abordagem freqüêncial da metodologia aplica-se a sistemas lineares e invariantes no tempo; - O número de parâmetros de projeto é relativamente pequeno. O estudo da técnica em questão baseou-se nos trabalhos de DOYLE & STEIN (1981), KAZEROONI & HOUPT (1986), MOORE & TAY, (1989) e CRUZ (1993). Esta técnica visa aperfeiçoar a robustez do projeto LQG através de procedimento recuperação da malha objetivo (‘Loop Transfer Recovery’). 54 O estudo dos fundamentos da técnica LQG/LTR requer a análise da estrutura em malha fechada apresentada no diagrama a seguir (FIG. 3.7): d (s) r (s) + e (s) K(s) - u (s) GN(s + + y (s) + n (s) + FIG. 3.7. Diagrama de blocos do sistema. Os sinais representados na FIG. 3.7 estão no domínio de Laplace e são descritos como: r(s) ∈Cm é o sinal de referência (o sistema dispõe de m entradas); e(s) ∈Cm é o sinal de erro de acompanhamento do sinal de referência; u(s) ∈Cm é o sinal de controle; d(s) ∈Cm é o sinal da perturbação refletido na saída da planta y(s) ∈Cm é o sinal de saída( o sistema possui m saídas); Definem-se as seguintes matrizes de funções de transferência: K(s) ∈Cmxm é a matriz de funções de transferência do controlador; GN(s) ∈Cmxm é a matriz de funções de transferência da planta; GN(s)K(s) ∈Cmxm é a matriz de funções de transferência de malha (‘loop transfer function’) para abertura da malha na saída da planta ou matriz de funções de transferência do ramo direto; I+GN(s)K(s) ∈Cmxm é a matriz de funções de transferência diferença de retorno; C(s)=[I+GN(s)K(s)] -1GN(s)K(s) ∈ Cmxm é a matriz de funções de transferência de malha fechada. As especificações de desempenho a serem atendidas pelo projeto são as seguintes: - Acompanhamento de sinais de referência; - Rejeição de perturbações externas; - Insensibilidade a variações na planta; - Rejeição do erro de medida; Com relação à estabilidade, o controlador deverá ser tal que toda a classe de sistemas reais resulte estável. 55 A sistemática geral do projeto baseado na técnica LQG/LTR pode ser resumida nas seguintes etapas: • Obtenção de modelo linearizado da planta; • Avaliação do erro de modelagem, com a obtenção das barreiras de robustez de desempenho e de estabilidade; • Adição de integradores ou outros tipos de compensadores na entrada da planta; • Aplicação da técnica LQG/LTR: a) Definição de uma malha objetivo, onde se procura dar forma aos valores singulares (‘Loop shaping’), de modo se atendam as especificações de projeto; b) Recuperação assintótica, através de ajuste de parâmetros livre do compensador, da resposta em freqüência da malha objetivo. O objetivo geral do projeto é assegurar a estabilidade do sistema real (GR(s)). Sendo assim, é necessário avaliar a representação do erro de modelagem. A representação adotada do erro de modelagem é do tipo multiplicativa, representada por ε M ( s) = [G R ( s ) − G N ( s )]G N −1 ( s) EQ 3.28 Pela equação acima resulta que G R ( s ) = [ I + ε M ( s)]G N ( s ) EQ 3.29 Como o projetista geralmente não dispõe da matriz εM(s), supõe-se que ele seja capaz de estimar um limite superior para o erro de modelagem como uma função da freqüência. Esse limite, denominado por eM, será obtido utilizando-se a norma espectral de εM(s) como medida da magnitude do erro(ATHANS, 1986): ε M ( jω ) ≤ e M (ω ) (∀ω ∈ R) EQ 3.30 Considera-se assim a pior direção para definir o limite de erro. Essa medida de erro será tão mais efetiva quanto mais próximos estiverem de si os valores singulares máximos(σM(jω)) e os valores singulares mínimos(σm(jω)) da planta. 56 O comportamento típico da função eM(ω) é ilustrado na FIG. 3.8. eM(ω) 1 ω FIG. 3.8. Comportamento típico de eM(jω). Conforme se vê na FIG 3.8, o comportamento típico de eM(ω) retrata que os modelos são fiéis em baixas freqüências e grosseiros em altas(ATHANS,1984). Os erros de modelagem estão associados, por exemplo, a dinâmicas desprezadas de atuadores, sensores ou outros elementos de efeitos relevantes em altas freqüências (indutâncias e capacitâncias parasitas, flexibilidades), redução de modelos, etc. Com base nas curvas estimadas do erro de modelagem e perturbações externas, determinam-se as barreiras de robustez em estabilidade e de robustez em desempenho, conforme se vê na FIG 3.9. Com isto, estabelecem-se as duas condições: a de robustez em estabilidade e a de robustez em desempenho. dB σ [G(jω)K(jω)] M BARREIRA DE ROBUSTEZ DE ESTABILIDADE ωo ω BARREIRA DE ROBUSTEZ DE DESEMPENHO σ [G(jω)K(jω)] m FIG. 3.9. Barreiras de robustez da estabilidade e do desempenho. 57 A condição de robustez em estabilidade é garantida, na região de freqüências onde eM(ω)>>1, se σ M (G ( jω ) K ( jω ) < 1 em (ω ) EQ 3.31 onde σM representa o maior valor singular em determinada freqüência. O desempenho será garantido se σ m (G ( jω ) K ( jω ) ≥ p (ω ) 1 − em (ω ) EQ 3.32 onde σm representa o menor valor singular em determinada freqüência e p(ω) é estimado. O objetivo do projeto é deste modo obter um compensador K(s) de maneira que garanta a estabilidade do sistema nominal em malha fechada que respeite as barreiras de robustez em estabilidade e de robustez em desempenho. A estrutura básica da técnica LQG pode ser disposta como se vê na FIG. 3.10. B r(s) + + -I - H y(s) + + (sI-A)-1 G G (s) N - C K(s) FIG 3.10. Diagrama de blocos do sistema em malha fechada Com base nesta estrutura, a função de transferência do controlador é determinada pelas seguintes equações: K ( s ) = G ( sI − A + BG + HC ) −1 H G= 1 ρ BT K EQ 3.33 , ρ > 0 e 0 = − KA − AT K − C T C + 1 ρ KBB T K EQ. 3.34 H= 1 µ ΣC T , µ > 0 e 0 = − AΣ − ΣAT − LLT + onde A, B, C, D são matrizes de espaço de estado do sistema nominal 58 1 µ ΣC T CΣ EQ. 3.35 H é a matriz de ganhos do observador G é a matriz de ganhos de realimentação de estados L é a matriz de ‘loop shaping’ Mostra-se em DOYLE & STEIN (1981) que [ −1 ] −1 lim K ( s ) = C (sI − A) B C ( sI − A) −1 H ρ →0 + EQ 3.36 Este é o resultado fundamental LTR, que mostra que o controlador K(s) inverte a planta. Utilizando o diagrama de bloco da FIG 3.11, o resultado acima pode ser visualizado da seguinte forma: o sistema nominal em malha fechada da FIG 3.11(a), quando ρ → 0+ ,se aproxima ponto a ponto em s, daquele representado na FIG 3.11b). Na prática o problema de projeto se resume em escolher convenientemente a matriz L, e por conseqüência a matriz H, e fazer o valor de ρ suficientemente pequeno de modo que o sistema compensado em malha fechada se aproxime adequadamente da malha objetivo e atenda os requisitos de estabilidade e desempenho(CRUZ,1993). K(s) C(sI-A)-1H GN(s) (a) (b) FIG 3.11. a) Sistema nominal em malha fechada; b) Sistema para ρ→ 0+. Um dos requisitos deste projeto é exigir que o sistema apresente erro de estado estacionário nulo. Para isto, serão incluídos integradores nos canais de entrada da planta. Com isto teremos as seguintes matrizes de estado da planta aumentada: 0 A= Bp 0 I , B= , C= [0 Cp ] Ap 0 EQ 3.37 onde Ap, Bp, Cp são as matrizes de espaço de estado da planta nominal. Estas matrizes da planta aumentada é que serão utilizadas para projetar a malha objetivo. Ou seja, para o procedimento do projeto, o bloco de integradores será considerado como parte da matriz de transferência nominal. No entanto, a implementação física fará parte do controlador. 59 Além de eliminar o erro de estado estacionário, a inclusão de integradores resulta na introdução de graus de liberdade adicionais no processo, através da adequada escolha da matriz L, tornando possível realizar o casamento dos valores singulares em baixas e altas freqüências. Com isso, as velocidades de resposta serão aproximadamente as mesmas em todos os canais do sistema. Com isso, considerando que L L= L LH EQ 3.38 LL= − (C p A p−1 B p ) −1 EQ 3.39 LH= A p−1 B p LL EQ 3.40 e escolhendo Com Obtém-se C ( sI − A) −1 L = I s EQ 3.41 o que resulta em σ i = [C ( jωI − A) −1 L] = 1 ω EQ 3.42 Portanto, todos os valores singulares são iguais em todas as freqüências, com declividade de –20db/década. O procedimento LQG/LTR é constituído dos seguintes passos (CRUZ, 1993): Passo 1 (Loop Shaping): 1 a) escolher µ e L e, através do gráfico de σ i C ( jωI − A) −1 L , verificar se as curvas µ correspondentes obedeçem as barreiras de desempenho e de estabilidade; Passo 2 (Determinação da Malha Objetivo) a) Resolver a equação algébrica de Riccati 0 = − AΣ − ΣA´− LL'+ 1 µ ΣC ' C Σ EQ 3.43 b) Calcular a matriz de ganhos de Kalman H= 1 µ EQ 3.44 ΣC ' 60 c) Fazer o gráfico de σ i [G KF ( jω )] , onde GKF = C(jωI – A)-1H EQ 3.45 que, para as freqüências distantes da de cruzamento, devem ser próximos daqueles obtidos no passo 1b); d) Plotar σ i {[ I + G KF ( jω )] −1 G KF ( jω )}, e 1/eM(ω) e verificar se vale a Condição de Robustez da Estabilidade: σ i {[ I + G KF ( jω )]−1 G KF ( jω )} <1/eM(ω)( ∀ω ) EQ 3.46 se não retornar ao passo 1a) . Passo 3 (Recuperação da Malha Objetivo ou ‘Loop Transfer Recovery – LTR’) a) Calcular os zeros de GN(s) e verificar se eles se localizam no semiplano esquerdo (SPE); b) Resolver a equação algébrica de Riccati 0 = − KA − A´K − C ' C + 1 ρ KBB ' K EQ 3.47 para algum valor de ρ > 0 e calcular a matriz de ganhos de realimentação de estados G= 1 ρ EQ 3.48 B´K c) Calcular a matriz de funções de transferência do compensador K ( s ) = G ( sI − A + BG + HC ) −1 H EQ 3.49 d) Calcular a matriz de funções de transferência do ramo direto GN(s)K(s), onde GN(s) contém os eventuais integradores adicionados para zerar o erro de estado estacionário; e) Plotar σ i [(G N ( jω ) K ( jω )] f) Comparar σ i [(G N ( jω ) K ( jω )] com σ i [G KF ( jω )] obtidos no passo 2c); se a proximidade for satisfatória, prosseguir no passo 3g); caso contrário, reduzir ρ e repetir os passos 3b) e 3f); g) Plotar σ i [C N ( jω )] e 1/eM(ω) e verificar se a Condição de Robustez de Estabilidade σ M [ I + G ( jω ) K ( jω )]−1 G ( jω ) K ( jω ) < 1 , ∀ω em (ω ) EQ 3.50 é obedecida; se não reduzir ρ e retornar ao passo 3b). No final do procedimento, obtém-se o compensador K(s). Se a planta é de fase mínima (com zeros estáveis), a abordagem LQG/LTR geralmente dá bons resultados. Por outro lado, se a planta for de fase não-mínima ou se tiver zeros estáveis 61 com grandes constantes de tempo, a abordagem não é adequada. No entanto, quando os zeros de fase não-mínima estão situados em freqüências superiores a do cross-over, espera-se que o procedimento de recuperação dê resultados satisfatórios. Se existem um ou mais zeros de fase não-mínima na região de baixas freqüências, então é de se esperar que os σ i [(G N ( jω ) K ( jω )] não se aproximem dos σ i [G KF ( jω )] nessas freqüências e , portanto, que o desempenho do sistema de controle resulte comprometido (CRUZ,1993). Em STEIN & ATHANS (1987) outras considerações sobre zeros de fase não-mínima são encontradas. 3.3 TABELAMENTO DE GANHOS VIA LÓGICA DIFUSA Tabelamento de ganhos tem sido uma metodologia de projeto eficiente em diversas aplicações de engenharia. É usado para projetar controladores em sistemas cujas dinâmicas mudam com as condições de operação e para os quais um simples modelo linear e invariante no tempo é insuficiente. A idéia é selecionar vários pontos de operação que cubram a extensão da dinâmica da planta e para cada um destes pontos fazer uma aproximação linear e invariante no tempo. Com base em cada aproximação linear, deve-se projetar um compensador linear. Nas regiões entre os pontos de operação, os ganhos dos controladores são interpolados, ou tabelados, resultando assim em um compensador global. Para melhor visualizar a metodologia do tabelamento de ganhos, considera-se a seguinte planta: x& = f ( x(t ), u (t ), v(t )) y = g ( x(t ), u (t ), v(t )) EQ 3.51 onde x(t ) ∈ ℜ n é o vetor de estados, u (t ) ∈ ℜ m é o vetor de entrada, y (t ) ∈ ℜ p é o vetor de saída e v(t ) ∈ ℜ q é o vetor de variáveis de tabelamento, representando as condições de operação. O objetivo do tabelamento de ganhos é aproximar uma lei de controle não-linear u (t ) = U ( x(t ), v(t )) EQ 3.52 por uma série de leis de controle linear com ganhos tabelados derivados em vários pontos de operação. 62 Um procedimento de projeto de controle com tabelamento convencional de ganhos envolve os seguintes passos: 1) Seleção de variáveis de tabelamento. Identificar o vetor v(t) de variáveis de tabelamento que correlaciona bem com as mudanças na dinâmica da planta. 2) Seleção de pontos de operação Selecionar vários pontos de operação vi (i=1,..., l) que cobrem a extensão da dinâmica da planta. 3) Construção de modelos lineares e invariantes no tempo. Construir aproximação linear e invariante no tempo no i-ésimo ponto de operação e projetar um compensador linear para cada um destes pontos. 4) Definir a lei de tabelamento de ganhos As leis de controle para condições de operação intermediárias são interpoladas ou tabeladas de acordo com algoritmo adequado. Em (TAN et al., 1997) descreve-se que uma das principais vantagens do controle com tabelamento de ganhos é que métodos de projeto linear são aplicados para sistemas linearizados em cada ponto de operação, permitindo assim uma larga extensão de aplicação de técnicas de controle linear já bem conhecidas. Outra vantagem é sua rápida resposta para mudanças nas condições de operações, pelo fato de que nenhuma estimação de parâmetros é necessária visto que os parâmetros do controlador estão tabelados de uma maneira préprogramada. Além disso, um sistema de controle com tabelamento de ganhos é fácil de implementar e é mais prático do que o controle adaptativo em grande parte das situações práticas (ASTROM et al., 1992). Algumas desvantagens do controle com tabelamento de ganhos convencional se relacionam com aspectos de modelagem e partição das regiões de operação do projeto, que exigem suficiente entendimento da dinâmica da planta. É também relativamente difícil selecionar adequadas variáveis de tabelamento mensuráveis. Usualmente esta seleção é guiada por regras práticas e básicas como, por exemplo, a variável de tabelamento deve variar lentamente e deve representar bem as não-linearidades da planta (SHAMMA & ATHANS, 1990; RUGH, 1991). Com isso, o desempenho do sistema projetado deve ser verificado por extensivas simulações, tornando o projeto demorado. Adicionalmente, o controle por tabelamento de ganhos pode mudar abruptamente os parâmetros do controlador, o que pode resultar em desempenho insatisfatório ou até mesmo levar à instabilidade através das regiões 63 de transição. Para plantas cujas não-linearidades são mais suaves de modo que a perda no desempenho é aceitável, este tipo de controle pode ser aceito. Quando as não-linearidades tornam-se mais severas, o espaço de estados da planta terá que ser dividido em mais regiões de operações, e com isso mais controladores lineares devem ser projetados em mais regiões de operação, aumentando a complexidade do projeto. Leis de controle robusto que cobrem maiores regiões em torno de um determinado ponto de operação reduzem o número de pontos de projeto exigidos, simplificando o tabelamento de ganhos. Isto porque, à medida que a extensão dinâmica torna-se muito grande, um controlador robusto sozinho pode não ser suficiente para fornecer adequado desempenho sobre a extensão da dinâmica como um todo. Deste modo, o desenvolvimento de lei de tabelamento de ganhos é crucial para o desempenho do sistema não linear controlado por esta técnica. Porém, em projetos práticos, obter uma expressão matemática que represente bem as de leis de tabelamento é razoavelmente difícil. Uma solução visando obter uma lei de transição adequada é adotar técnicas baseadas na lógica fuzzy para determinar os parâmetros (ganhos) dos controladores (LING & EDGAR,1992; ZHAO et al.,1993). A experiência humana em projeto de controle linear e o convencional método de tabelamento de ganhos são usados para melhor interpolar os ganhos do controlador nas regiões de transição. Uma das diferenças do tabelamento de ganhos via lógica difusa para o tabelamento convencional é que as regiões de operação são associadas a funções de pertinência de conjuntos fuzzy definidos no espaço das variáveis de tabelamento. Outra diferença é usar o mecanismo de inferência fuzzy para interpolar dinamicamente os parâmetros do controlador em torno dos limites da região baseados nos parâmetros do controlador local conhecido. Um típico procedimento de projeto com tabelamento de ganhos via lógica difusa segue os mesmos passos de 1 a 3 do procedimento para tabelamento de ganhos convencional. O quarto passo é substituído pela interpolação usando a técnica difusa. Especificamente, o modelo fuzzy Sugeno (TAKAGI & SUGENO, 1985) é empregado em tabelamento de ganhos via lógica difusa em LIN &EDGAR (1992). O modelo fuzzy de Mandani foi utilizado em ZHAO et al.(1993). Problemas de estabilidade global também são discutidos nestes dois últimos trabalhos citados. 64 O algoritmo de interpolação de ganhos dos controladores via lógica fuzzy obedece de maneira geral a arquitetura de um sistema de inferência fuzzy básico, conforme se vê na FIG. 5.17. Os principais componentes são a interface de codificação, a base de conhecimentos, o módulo de raciocínio fuzzy e a interface de decodificação. BASE DE CONHECIMENTO VARIÁVEL LINGUÍSTICA CODIFICAÇÃO COMANDO LINGUÍSTICO RACIOCÍNIO FUZZY DECODIFICAÇÃO PROCESSO AÇÃO DE COMANDO RESPOSTA DO SISTEMA FIG. 3.12. Arquitetura geral de controle fuzzy A primeira fase para a elaboração de um controle fuzzy é definir a interface de codificação. Nesta fase, são definidos: cada variável controlada, seu universo de referência e número de valores lingüísticos necessários. Cada valor lingüístico deve ser definido pela sua função de pertinência. Na fase de operação, as medidas do processo são convertidas em variáveis lingüísticas adequadas através de um operador de codificação, que calcula o valor da função de pertinência, em uma faixa de 0 a 1, de todos os valores desta variável lingüística. A base de conhecimento compreende as informações a respeito do domínio da aplicação e dos objetivos de controle desejados. Ela contém as regras que associam as variáveis lingüísticas de entrada com as de saída. Os conhecimentos do processo podem ser expressos como um conjunto de regras que associam as variáveis lingüísticas de entrada e as variáveis de saída. Utilizando o sistema de inferência fuzzy conhecido como do tipo Mandani, as regras são dispostas da seguinte forma: R1 : SE {V1 é S11} e {V2 é S12} ENTÃO {U é A1} R2 : SE {V1 é S21} e {V2 é S22} ENTÃO {U é A2} Onde V1, V2 são as variáveis lingüísticas de entrada 65 U é a variável de saída Sij são subconjuntos fuzzy que representam partições dos valores para a variável Vi Ai representam as partições da variável U Uma regra de controle fuzzy é uma declaração condicional em que o antecedente é uma condição sobre o seu domínio de aplicação e o conseqüente representa uma ação de controle para o processo. Na fase de raciocínio fuzzy, as regras são utilizadas na presença de entradas medidas no processo e geram resultados intermediários (A1, A2). Com os resultados intermediários gerados por cada uma das regras, calcula-se a ação de controle correspondente, a partir da aplicação de um método de decodificação apropriado. Para a aplicação em tabelamento de ganhos, o resultado final do processo do raciocínio fuzzy explicitado através do conjunto de regras entre as variáveis de entrada e variáveis de saída deve ser convertido em um sinal de ponderação representado pelo vetor de ganhos dos sub-controladores. Por isto, deve ser aplicado um método de decodificação para obtenção dos valores físicos que melhor representam o valor fuzzy da variável de saída lingüística. Existem diferentes tipos de métodos de decodificação. O método utilizados nesta dissertação é o método Centro dos Máximos (CoM) , que calcula o valor físico de saída como uma média ponderada dos valores máximos assumidos para cada termo de uma FP. Nesta dissertação, são adotadas funções de pertinência do tipo trapezoidal aberta à esquerda ou à direita e do tipo triangular. A função de pertinência trapezoidal aberta à esquerda (FIG. 3.13) é definida através de dois parâmetros {a1 ,d1 } e é representada pela seguinte expressão: d −x ,0 Trap_abert a_esq(a 1 , d 1 , x) = max min 1, 1 d a − 1 1 µ 1 a1 d1 FIG. 3.13. Função de pertinência trapezoidal aberta à esquerda 66 EQ 3.53 A função de pertinência trapezoidal aberta à direita é definida através de dois parâmetros {e3,a3} e é representada pela seguinte expressão: x − e3 Trap_abert a_dir(e 3 , a 3 , x) = max min a 3 − e3 ,1,0 EQ 3.54 µ 1 e3 a3 FIG. 3.14. Função de pertinência trapezoidal aberta à direita A função de pertinência triangular (FIG. 3.15) é definida através de três parâmetros {e,f,g} e é representada pela seguinte expressão: x − e2 d 2 − x ,0 Triangular (e 2 , a 2 , d 2 , x) = max min , a e d a − − 2 2 2 2 EQ 3.55 µ 1 e2 a2 d2 FIG. 3.15. Função de pertinência triangular Apesar da abordagem fuzzy não produzir controle ótimo, ele é intuitivamente atraente e o algoritmo usado é relativamente simples. Entretanto, o desempenho de projeto de tabelamento de ganhos via lógica difusa é baseado nas regras fuzzy empregadas e nas funções de pertinência definidas. A escolha de regras fuzzy e de funções de pertinência é usualmente 67 subjetiva e até um certo grau heurística, ou até mesmo baseada em tentativa e erro, dependendo da experiência e do conhecimento do projetista. Com isso, a seleção de um apropriado conjunto de regras e funções de pertinência é difícil e demorada. Freqüentemente exige conhecimento e experiência de especialista em controle na área correlata, além de extensivas simulações no computador. 3.4 MÉTODO DE OTIMIZAÇÃO O problema de ajuste dos parâmetros das funções de pertinência pode ser resolvido via método de otimização, onde se enquadraria na seguinte classe de problemas de programação não linear: Minimizar F(X) sujeito a g i (X) ≤ 0 para i = 1, L , m h j (X) = 0 para j = 1,L , p onde F( ⋅ ) é uma função normalmente chamada de função objetivo ou função custo, gi (⋅ ) e hi (⋅ ) são funções que representam as restrições de desigualdade e igualdade do problema, respectivamente, e X ∈ ℜ n é o vetor de variáveis de projeto que deve satisfazer as restrições e minimizar a função objetivo. Define-se variáveis de projetos como parâmetros de construção ou variáveis de construção. Um vetor de variáveis de projeto que satisfaz todas as restrições é dito uma solução viável para o problema. A coleção de todas as soluções viável forma a região de viabilidade. O problema de programação não linear é determinar um ponto X* tal que F(X*) ≤ F(X) para qualquer ponto viável X. O ponto X* é denominado uma solução ótima ou solução do problema. Para atingir o ponto X* que minimiza a função objetivo desta dissertação será usado o método de otimização de Powell (FOX, 1971) conjuntamente com o método de busca unidimensional via aproximação quadrática. Devido à natureza não convexa do problema aqui tratado não é possível garantir que se atinja o mínimo global após o processo de otimização. Com isso, as soluções encontradas 68 garantem o valor mínimo da função somente em suas respectivas vizinhanças e, por isso serão denominadas mínimos locais. O sistema de otimização utilizado neste trabalho é dividido em três partes principais: programa principal, rotinas de otimização e simulador. A FIG 3.16 mostra o diagrama deste sistema. PROGRAMA PRINCIPAL X0 Xótimo ROTINAS DE OTIMIZAÇÃO Xq , Sq MÉTODO DE OTIMIZAÇÃO * α Min F (⋅) Xq ROTINA DE BUSCA UNIDIMENSIONAL Min α ∈ℜ J Xq F( Xq + αSq) J SIMULADOR| J = F ( Xq ) FIG. 3.16. Diagrama geral do sistema de otimização. No programa principal consta a definição do problema, os valores das constantes e parâmetros empregados, bem como fornece para as rotinas de otimização o valor inicial de projeto X0. Com este valor inicial, o método de otimização determina uma direção de busca Sq. Tanto este valor de direção como o valor de projeto são fornecidos para a rotina de busca unidimensional. Esta por sua vez retorna um valor de passo αq tal que αq = Min F ( X q + αS q ) α∈ℜ EQ. 3.57 O método de otimização com o valor de αq calcula Xq+1= Xq + αqSq e a partir daí determina a nova direção Sq+1.Para o cálculo da função objetivo, que é usado tanto pelo método de otimização quanto pela rotina de busca unidimensional, há o simulador, que com o valor de Xq determina o valor de custo.Este procedimento acima descrito é repetido até que um determinado critério de parada é obedecido. O critério mais usual é o que faz a comparação entre dois valores da função objetivo em dois projetos consecutivos e é expresso por | F(Xq) - F(Xq-1)| ≤ ε EQ. 3.58 Após o atendimento desta condição, o método de otimização retornará para o programa principal o último valor de Xq calculado. Este valor de projeto será considerado a solução ótima do problema. 69 3.4.1. MÉTODO DE POWELL O método de Powell (FOX, 1971)ou método das direções conjugadas é um eficiente método para encontrar o mínimo de uma função de várias variáveis sem que seja necessário calcular a derivada da função objetivo. Neste método, parte-se de um conjunto de direções, nas quais se busca unidimensionalmente o valor mínimo da função objetivo. Após percorrer o conjunto de direções iniciais, determina-se uma direção formada pelo ponto final deste processo e pelo ponto inicial X0. Esta direção conjugada substitui uma das direções do conjunto anterior. INÍCIO A ← In x n J←1 q←0 L←1 q←q +1 J←J J<n A( : , L ) ← Xq – X0 L←L+1 J←1 Xq ← X0 N S Xq+1 ← Xq+ α*S S ← A( : , J ) N S L>n L←1 N CONVERGIU? S * Calcula α = α que minimiza F( Xq + αS ) Xótimo ← Xq FIM FIG. 3.17. Fluxograma do método de Powell Neste novo conjunto de direções, o processo de busca unidimensional do valor mínimo da função objetivo será repetido. Após o final deste ciclo, será calculada uma nova direção conjugada, formada pelos pontos inicial e final do referido ciclo. Este processo será repetido até que seja atendido o critério proposto de parada. A FIG. 3.17 ilustra na forma de diagramas de bloco o algoritmo do método de Powell. Nesta figura, a matriz A contém o conjunto inicial de direções, J é o contador de direções dentro de cada conjunto de direções, L é contador de ciclos executados, S é a direção corrente pesquisada na rotina de busca unidimensional, X0 é o valor de projeto inicial e α* é o passo calculado na busca unidimensional. 70 3.4.2 MÉTODO DE BUSCA UNIDIMENSIONAL VIA APROXIMAÇÃO QUADRÁTICA O problema da busca unidimensional consiste na determinação do valor α= α * escalar, de maneira que F( X q + α S q ) seja o mínimo na direção Sq considerada, isto é: Min F(Xq + α. Sq) α ∈ℜ EQ 3.59 O método de busca unidimensional via aproximação quadrática consiste em determinar este valor escalar considerando a função quadrática H(α) H(α) = a + bα + cα2 EQ 3.60 como uma boa aproximação de F(⋅). O mínimo da função H(α) ocorre em: dH = b + 2cα = 0 dα α = α* = − b 2c EQ 3.61 EQ 3.62 onde a, b e c ∈ ℜ , que são calculados atribuindo-se valores a F̂(α) em três pontos distintos α1, α2 e α3 e resolvendo as seguintes equações: ∆ F(α1) = f1 = a + bα1 + cα12 ∆ F(α2) = f 2 = a + bα 2 + cα 22 EQ 3.63 ∆ F(α3) = f 3 = a + bα 3 + cα 32 Se F(α) em α1 = 0 é conhecida, somente duas avaliações são necessárias. Considerando α2 = t e α3 = 2t. Assim, tem-se f1 = a f2 = a + bt + ct2 EQ 3.64 f3 = a + 2bt + 4ct2 Resolvendo as equações, chega-se a: 4 f 2 − 3 f1 − f 3 2t f 3 + f1 − 2 f 2 c= 2t 2 b= 71 EQ 3.65 e pela EQ 3.64: α* = 4f 2 − 3f1 − f 3 .t 4f 2 − 2f 3 − 2f 1 EQ 3.66 A seguinte condição deve ser atendida para que haja o mínimo em H(α): EQ 3.67 2f2 < f3 + f1 O algoritmo utilizado para a busca unidimensional via aproximação quadrática está ilustrado na FIG. 3.18. Nesta figura, M é o número de tentativas, S é a direção de busca, α é o passo inicial, X é o ponto inicial e α * é o passo que leva ao suposto mínimo na direção S. INÍCIO f 1 ← F(X ) f 2 ← F( X + αS) f 3 ← F(X + 2αS) J ←1 α ← α incial 2f 2 ≥ f 1 + f 3 N e J≤M α ← 2α S f2 ← f3 f 3 ← F( X + 2αS) J ← J +1 2f 2 < f 1 + f 3 S α* ← 4f 2 − 3f 1 − f 3 α 4f 2 − 2f 3 − 2f 1 f 4 ← F(X + α * S) N N S f 3 < f1 N f 4 < f1 S α* ← 0 f 2 < f1 N S * α * ← 2α α ←α FIM α* ← 0 FIG. 3.18. Fluxograma do método de busca unidimensional por aproximação quadrática. 72 4 MODELAGEM MATEMÁTICA DA AERONAVE E LINEARIZAÇÃO 4.1. MODELO MATEMÁTICO Modelos matemáticos de aeronaves não tripuladas, representados por equações diferenciais não lineares e por curvas de coeficientes aerodinâmicos, são de difícil acesso, tendo em vista o alto grau de reserva que ainda envolve este tema. Os resultados da pesquisa realizada por este autor, tanto via internet como em bibliotecas, não foram satisfatórios tendo em vista que a totalidade dos trabalhos omite parcialmente as propriedades básicas destas aeronaves bem como as suas propriedades aerodinâmicas. A alternativa a esta dificuldade foi buscar um modelo não linear completo de aeronave qualquer, pois as equações diferenciais relacionadas ao modelo são semelhantes e a técnica de controle a ser aplicada não se difere. Um dos modelos completos obtidos é de um caça F-16 encontrado em NGUYEN et al. (1979). No entanto, não foi utilizado neste trabalho tendo em vista ser necessário fazer todo um estudo de modelagem para determinação das curvas dos coeficientes aerodinâmicos e das condições de equilíbrio, o que exigiria disponibilidade de tempo, além de maiores conhecimentos de aerodinâmica e mecânica de vôo. Um outro modelo matemático obtido foi de um caça de alto desempenho (F/A-18 HARV) (FAN et al., 1995) e forças e momentos aerodinâmicos associados relativos à configuração para pouso. Este modelo foi utilizado tendo em vista que todos os coeficientes aerodinâmicos estão sob a forma de curvas, já em função das variáveis de estado e dos sinais de controle, e contém todas as propriedades básicas da aeronave. Foram utilizados três sistemas de coordenadas já descritos na seção 3.1.3. A seguinte nomenclatura será utilizada no trabalho: b Envergadura [ft]; CD Coeficiente de arrasto(drag); CL Coeficiente de Sustentação(lift); Cl Coeficiente de momento de rolagem (roll); Cm Coeficiente de momento de arfagem (pitch); Cn Coeficiente de Momento de Guinada (yaw); CY Coeficiente de Força Lateral; c Corda aerodinâmica média [ft]; g Aceleração da gravidade [ft/sec2]; 73 Ix, Iy, Iz Momentos principais de inércia [ slug ft2]; M Número de Mach; p, q, r Velocidades angulares de rolagem, arfagem e guinada; S Área de referência [ft2]; TM Empuxo propulsivo máximo[lb]; T Empuxo propulsivo [lb]; x, y, z Coordenadas de posição da aeronave [ft]; α Ângulo de ataque [graus]; β Ângulo de deslizamento lateral [graus]; δa Deflexão de aileron [graus]; δe Deflexão de profundor (elevator)[graus]; δr Deflexão de Leme Vertical(rudder) [graus]; η Fração do empuxo máximo (T/TM); φ, θ, ψ Ângulo de rolagem, de arfagem e de proa(Heading) da aeronave [graus]; χ, γ, µ Ângulos de orientação com relação aos eixos do vento[graus]. As propriedades básicas da aeronave na configuração de combate são as seguintes: S = 400 ft2 m = 1036 slug b = 37.42 ft Ix = 23000 slug ft2 c = 11.52 ft Iy = 151293 slug ft2 TM = 11200 lb Iz = 169945 slug ft2 g = 32.174 ft/sec2 A densidade atmosférica pode ser aproximada pela função ρ = ρo e-β(h-h0), onde ρo = 2.378x10-3 slug/ft3, ho = 0ft e β = 4.6x10-5 ft-1. Neste trabalho, a densidade atmosférica é calculada para uma altura de 2500 ft e considerada constante. O número de Mach representa a relação entre a velocidade total da aeronave e a velocidade do som ( VT = vs M ) A velocidade do som ao nível do mar é definida por vS = 1117 ft/sec. 74 O modelo dinâmico da aeronave é representado pelas seguintes equações: 1 1 M& = TM η cos α − C D ρv S2 M 2 S − mg ( sinθ cos α − cosθ cos φsinα ) cos β + mv S 2 + 1 mv S α& = q − − 1 2 2 CY 2 ρv S M S − mg cosθsinφ ) sinβ EQ 4.1 1 ( p cos α + rsinα )sinβ − cos β 1 1 2 2 TM ηsinα + C L ρv S M S − mg ( sinθsinα + cosθ cos φ cos α mv S M cos β 2 EQ 4.2 β& = 1 mv S M 1 2 − TM η cos α + C D 2 ρ (v S M ) S + mg ( sinθ cos α − cosθ cos φsinα ) sinβ + 1 1 2 2 psinα − r cos α − CY ρv S M S − mg cosθsinφ ) cos β EQ 4.3 mv S M 2 p& = IY − I Z 1 qr + ρv S2 M 2 S ⋅ b ⋅ C l IX 2I X EQ 4.4 q& = IZ − IX 1 pr + ρv S2 M 2 S ⋅ c ⋅ C m IY 2I Y EQ 4.5 r& = I X − IY 1 pq + ρv S2 M 2 S ⋅ b ⋅ C n IZ 2I Z EQ 4.6 φ& = p + qsinφ tan θ + r cos φ tan θ EQ 4.7 θ& = q cos φ − rsinφ EQ 4.8 ψ& = ( q sin φ + r cosφ ) secθ EQ 4.9 x& = v S M cos γ cos χ EQ 4.10 y& = v S M cos γ ⋅ sinχ EQ 4.11 z& = −v S Msinγ EQ 4.12 Os ângulos que descrevem a trajetória da aeronave por meio da direção do vetor velocidade absoluta, em relação ao espaço inercial, são representados em função dos ângulos de ataque, do deslizamento lateral e da atitude do veículo, cujas relações são: γ = arcsin[cos α cos βsinθ − sinβsinφ cosθ − sinα cos β cos φ cosθ ] 1 cos α cos β cosθsinψ + sinβ (sinφsinθsinψ − cos φ cosψ ) + K χ = arcsin cos γ K + sinα cos β (cos φsinθsinψ − sinφ cosψ ) 1 (sinθ cosαsinβ + sinφ cosθ cos β − sinαsinβ cos φ cosθ ) cos γ µ = arcsin 75 EQ 4.13 O modelo matemático em questão é válido para ângulos de ataque na faixa de α∈(-10o, +900) e ângulos de deslizamento lateral β∈(-20o, +20o). Os coeficientes aerodinâmicos foram obtidos por meio de regressões dos dados experimentais nas seguintes condições: - faixa de velocidade M=0.2 ao nível do mar; - flaps do bordo de ataque em 17,6o; - flaps do bordo de fuga em 45o; - ailerons esquerdo e direito para baixo em 42o; - trem de pouso arriado. De posse das condições acima e das regressões efetuadas com auxílio do banco de dados do caça F/A-18 HARV, as curvas dos coeficientes aerodinâmicos forma levantadas em FAN et al.( 1995), como se vê abaixo pelas expressões: Coeficiente de Arrasto: 0.0013α 2 − 0.00438α + 0.1423 − 5 o ≤ α ≤ 20 o CD = − 0.0000348α 2 + 0.0473α − 0.3580 20 o ≤ α ≤ 40 o EQ 4.14 Coeficiente de Força Lateral: δa EQ 4.15 0.0751α + 0.0144δ e + 0.732 − 5 o ≤ α ≤ 10 o CL = − 0.00148α 2 + 0.106α + 0.0144δ e + 0.569 10 o ≤ α ≤ 40 o EQ 4.16 25 ( −.00227 α + 0.039) + δr . ) ( −0.00265 α + 0141 CY = −0.0186 β + 30 Coeficiente de Sustentação: Coeficiente de momento de rolagem: δa Cl (α , β ) − 0.0315 p + 0.0126 r + 25 ( 0.00121 α − 0.0628) −K Cl = K− δ r ( 0.000351 α − 0.0124) 30 EQ 4.17 onde: ( −0.00012 α − 0.00092)β , − 5o ≤ α ≤ 15o Cl (α , β ) = 0 o ( 0.00022 α − 0.006)β , 15 ≤ α ≤ 25 EQ 4.18 Coeficiente de momento de arfagem (pitch) : EQ 4.19 C m = −0.00437α − 0.0196δ e − 0.123q − 0.1885 Coeficiente de Momento de Guinada (yaw)_ : Cn = Cn (α , β ) − 0.0142 r + δa 25 ( 0.000213 α + 0.00128) + 76 δr 30 ( 0.000804 α + 0.0474) EQ 4.20 onde: 0.00125 β , − 5o ≤ α ≤ 10o Cn (α , β ) = ( −0.00022 α + 0.00342)β , 10o ≤ α ≤ 25o o o −0.00201 β , 25 ≤ α ≤ 35 EQ 4.21 As seguintes restrições dos sinais de controle estão presentes no modelo e só foram consideradas para efeito de simulações com o modelo não linear: η (t ) ∈ [0.0,+ 1.0] δ e (t ) ∈ [− 24 o ,+ 10.5 o ] δ r (t ) ∈ [− 30 o ,+ 30 o ] δ a (t ) ∈ [− 25 o ,+ 25 o ] EQ 4.22 Existem ainda as seguintes limitações (não consideradas) quanto à velocidade de atuação de controle: η& (t ) ≤ 0.55 / s δ&e (t ) ≤ 40 o / s EQ 4.23 δ&r (t ) ≤ 56 o / s δ&a (t ) ≤ 100 o / s Como restrições adicionais de atitude (também não consideradas), tem-se que: φ ( t ) ≤ 30o β ( t ) ≤ 6o EQ 4.24 4.2 LINEARIZAÇÃO Para efeito de aplicação de técnicas de controle linear é necessário a linearização das equações diferenciais não lineares que descrevem a dinâmica da aeronave. Assim, a dinâmica da aeronave é representada por equações de espaço de estados na forma geral linear x& = Ax + Bu y = Cx + Du EQ 4.25 Na teoria de sistemas não-lineares (VIDYASAGAR, 1978) é introduzido o conceito de ponto singular ou de equilíbrio de um sistema invariante no tempo e autônomo (nenhuma 77 entrada de controle externa). As coordenadas do ponto singular são dadas pela solução vetorial, X=Xe, que satisfaz f ( X& , X ,U ) = 0 , com X& ≡ 0 ; U ≡ 0 ou constante EQ 4.25 O sistema está em repouso quando todas as derivativas são identicamente nulas, e podese examinar o comportamento do sistema nas proximidades do ponto de equilíbrio por meio de pequena perturbação das variáveis. Vôo em estado estacionário de uma aeronave pode ser definido como uma condição em que todas as variáveis de movimento são constantes ou nulas. Isto é, as componentes da velocidade angular e da velocidade linear são constantes ou nulas todas as componentes de aceleração são iguais a zero. Tendo em vista que o ângulo de guinada(ψ) e as coordenadas de posição não entram na composição das demais equações diferenciais relativas ao modelo, estas variáveis podem ser retiradas. Portanto, as condições de estado estacionário podem ser definidas em temos das oito variáveis de estado restantes da seguinte forma: M& = α& = β& = p& = q& = r& = θ& = φ& = 0 β = p = q = r =φ = 0 EQ 4.26 M, α, θ, e U são constantes. Sendo que as componentes de vetor de variáveis de controle do sistema são: U = [η , δ e , δ r , δ a ] T EQ 4.27 Procedendo a retirada das variáveis relacionadas ao rumo e às coordenadas de posição, faz-se uma redução do modelo matemático para calcular o controlador linear. Assim, o vetor das variáveis de estado do modelo linearizado torna-se o seguinte: ∆X = [∆M , ∆α , ∆β , ∆p, ∆q, ∆r , ∆φ , ∆θ ] T EQ 4.28 As variáveis retiradas são levadas em conta para a determinação das trajetórias através de simples integração. Para se obter as condições de estado estacionário, aplica-se as condições da EQ 4.26 nas equações EQ 4.1 a EQ 4.12. Procedendo deste modo, obtém-se as seguintes equações: 1 ρ (v S M )2 S − mg sen γ 0 = 0 2 1 2 TM ηsinα + C L ρ (v S M ) S − mg cos γ 0 = 0 2 − 0.00437α − 0.0196δ e − 0.1885 = 0 TM η cos α − C D 78 EQ 4.29 As condições de equilíbrio são obtidas da EQ 4.29 para um valor nominal de M igual a 0.2 e γ0 igual 0. Para o estudo em questão, os valores de número de Mach são extrapolados entre 0.17 e 0.41. Para resolver o sistema resultante de três equações a três variáveis(α, η,δe), adotou-se um método numérico para calcular a solução. Deste modo, obtém-se os valores constantes na TAB. 4.1 TAB. 4.1. Pontos de operação para diferentes números de Mach M α(graus) 0.17 21.2430 0.18 η η δe(graus) M α(graus) 0.8827 -14.3537 0.30 1.4340 0.6160 -9.9371 17.7870 0.7735 -13.5831 0.31 0.8380 0.6357 -9.8042 0.19 15.0020 0.6994 -12.9622 0.32 0.2950 0.6582 -9.6831 0.20 12.7370 0.6497 -12.4572 0.33 -0.2000 0.6834 -9.5728 0.21 10.8720 0.6173 -12.0414 0.34 -0.6520 0.7111 -9.4720 0.22 9.2720 0.5954 -11.6846 0.35 -1.0660 0.7412 -9.3797 0.23 7.8720 0.5811 -11.3725 0.36 -1.4470 0.7736 -9.2947 0.24 6.6250 0.5726 -11.0945 0.37 -1.7980 0.8081 -9.2165 0.25 5.5120 0.5693 -10.8463 0.38 -2.1210 0.8447 -9.1445 0.26 4.5160 0.5707 -10.6242 0.39 -2.4200 0.8833 -9.0778 0.27 3.6220 0.5765 -10.4249 0.40 -2.6970 0.9237 -9.0160 0.28 2.8170 0.5861 -10.2454 0.41 -2.9540 0.9661 -8.9587 0.29 2.0910 0.5994 -10.0836 δe(graus) Conforme se vê pelos valores da Tab. 4.1, os valores de número de Mach determinam os valores das outras variáveis, sugerindo ser uma boa escolha para variável de tabelamento de ganhos. Nesta dissertação é realizada a linearização numérica através de uma função do MATLAB. As matrizes de espaço de estados A0,B0,C0,D0 são obtidas pela expressão EQ 4.30 [ A0, B0, C0, D0 ] = linmod (‘modnlin’) onde linmod é a função do MATLAB que realiza a linearização numérica modnlin é o modelo do sistema em forma de diagramas de bloco, criado no ambiente do Simulink (MATLAB), que contém as equações diferenciais não lineares representativas da dinâmica da aeronave. 79 Para um número de Mach igual a 0.2 e γ0 igual 0, temos as seguintes matrizes de espaço de estados: 0 0 0 0 0 - 0.00050 - 0.06133 0.00002 - 1.37086 - 0.00678 0 0 1 0 0 0 0 0 - 0.00170 0.22048 0 - 0.97539 0.00245 0 0 0 - 0.08428 - 1.08430 0 0.43372 0 0 EQ 4.31 A0 = 0 - 0.00704 0 0 - 0.19815 0 0 0 0 0 0.0029 0 0 - 0.06615 0 0 0 0 0 1 0 0.22600 0 0 0 0 0 0 1 0 0 0 0 0 0 0.00944 − 0.01067 − 0.00132 0 0 0 0 0.00033 0.00004 0 0 0.00908 − 0.06525 B0 = 0 0 0 − 0.03158 0 0 − 0.00577 0.00074 0 0 0 0 0 0 0 0 EQ 4.32 Examinando as matrizes das EQ 4.31 e 4.32, verifica-se que o procedimento de linearização naturalmente faz o desacoplamento dos modos longitudinal e lateral, ou seja, as variações das variáveis relacionadas ao modo longitudinal ( M, α, q, θ) não fazem parte da composição das equações relacionadas com as variações das variáveis do modo lateral(β, p, r, φ) e vice-versa. Deste modo, pode-se tratar o sistema linearizado mais facilmente e tratá-lo tanto de maneira acoplada como desacopladamente. 80 4.3. SIMULAÇÕES EM MALHA ABERTA Nesta seção serão apresentadas diversas simulações temporais em malha aberta, executadas tanto para o modelo linearizado como para o modelo não linear, a fim de se verificar a validade da aproximação linear obtida e prever possíveis problemas relacionados aos modos não lineares desprezados pela linearização. As simulações foram realizadas com entradas de referência nas quatro superfícies de controle, uma de cada vez. Como entradas de referência, foram utilizados o impulso unitário, para o modelo linearizado, e o pulso de área unitária para o modelo não linear e a entrada em degrau unitário. Aplicando-se um impulso unitário em cada um dos sinais de controle do modelo linearizado em um ponto de operação correspondente a Mach 0.2 e, posteriormente, um pulso de área unitária para o modelo não linear, obtém-se as curvas relativas às variações em torno do ponto de equilíbrio conforme se vê nas FIG. 4.1 a FIG. 4.4. -3 x 10 0.05 Alfa ( graus ) Nr Mach 10 5 0 4 100 200 300 Tempo(seg) -3 x 10 0 100 200 300 Tempo(seg) -0.1 100 200 300 Tempo(seg) 400 100 200 300 Tempo(seg) 400 0.15 2 -2 0 -0.05 -0.15 0 400 Teta ( graus ) Taxa de pitch ( graus ) -5 0 0 400 0.1 0.05 0 -0.05 0 FIG. 4.1. Resposta ao impulso na fração do empuxo máximo. (Linha contínua - modelo linearizado; tracejado – modelo não linear) 81 -4 8 x 10 0.05 Alfa ( graus ) Nr Mach 6 4 2 0 -0.05 -0.1 0 100 200 300 Tempo(seg) -0.15 0 400 0.01 0 -0.01 -0.02 400 100 200 300 Tempo(seg) 400 0 -0.05 -0.1 -0.03 -0.04 0 100 200 300 Tempo(seg) 0.05 Teta ( graus ) Taxa de pitch ( graus ) -2 0 100 200 300 Tempo(seg) -0.15 0 400 FIG. 4.2. Resposta ao impulso no profundor (Linha contínua - modelo linearizado; tracejado – modelo não linear) Taxa de Roll ( graus) 10 0.03 0.02 0.01 0 2 x 10 100 200 300 Tempo(seg) -3 0 -2 -4 -6 0 100 200 300 Tempo(seg) 400 x 10 -3 5 0 -5 400 Roll angle ( graus ) -0.01 0 Taxa de Yaw ( graus ) Beta ( graus ) 0.04 0 100 200 300 Tempo(seg) 400 0 100 200 300 Tempo(seg) 400 0.05 0 -0.05 -0.1 -0.15 FIG. 4.3. Resposta ao impulso no leme (Linha contínua - modelo linearizado; tracejado – modelo não linear) 82 -3 Taxa de Roll ( graus ) 5 x 10 β ( graus ) 0 -5 -10 -15 10 100 200 300 Tempo(seg) -4 x 10 0 100 200 300 Tempo(seg) -0.02 -0.04 -0.06 100 200 300 Tempo(seg) 400 100 200 300 Tempo(seg) 400 0 5 -5 0 0 -0.08 0 400 φ ( graus) Taxa de Yaw ( graus) -20 0 0.02 -0.02 -0.04 -0.06 0 400 FIG. 4.4. Resposta ao impulso no aileron. (Linha contínua - modelo linearizado; tracejado – modelo não linear) Conforme mostram as FIG. 4.1 a 4.4, as respostas dos sistemas linearizado e não lineares em malha abertas às entradas impulsivas nos sinais de controle são praticamente coincidentes. 83 Aplicando-se uma entrada tipo degrau para cada uma dos sinais de controle do modelo 0.15 2 0.1 0 α ( graus ) Nr Mach linear e do modelo não linear, obtém-se as curvas das FIG. 4.5 a FIG. 4.8. 0.05 -2 0 -4 -0.05 -6 200 400 Tempo(seg) 600 0.15 0 200 400 Tempo(seg) 600 0 200 400 Tempo(seg) 600 25 20 0.1 θ ( graus ) Taxa de pitch ( graus ) 0 15 0.05 10 0 5 -0.05 0 0 200 400 Tempo(seg) 600 FIG. 4.5. Resposta ao degrau unitário na fração do empuxo máximo. 0.04 0 0.03 -1 α ( graus ) Nr Mach (Linha contínua - modelo linearizado; tracejado – modelo não linear ) -2 0.02 -3 0.01 0 200 400 Tempo(seg) 600 -5 0 0.05 200 400 Tempo(seg) 600 200 400 Tempo(seg) 600 0 -1 0 θ ( graus ) Taxa de pitch ( graus ) 0 -4 -2 -0.05 -3 -0.1 -4 -0.15 0 200 400 Tempo(seg) 600 -5 0 FIG. 4.6. Resposta ao degrau unitário no profundor (Linha contínua - modelo linearizado; tracejado – modelo não linear) 84 Taxa de Roll ( graus ) 1.5 β ( graus ) 1 0.5 0 -0.5 500 1000 Tempo(seg) 0 -0.05 -0.1 -0.15 0 1500 0 -0.05 -0.1 1500 500 1000 Tempo(seg) 1500 0 -20 -0.15 -0.2 0 500 1000 Tempo(seg) 20 φ ( graus ) Taxa de Yaw ( graus ) -1 0 0.05 -40 500 1000 Tempo(seg) -60 0 1500 FIG. 4.7. Resposta ao degrau unitário no leme Taxa de Roll ( graus ) (Linha contínua - modelo linearizado; tracejado – modelo não linear) 0 -0.5 -1 Taxa de Yaw ( graus ) -1.5 0 500 1000 Tempo(seg) 1500 0.02 0 -0.02 -0.04 -0.06 0 0.02 0 0 -5 φ ( graus ) β ( graus ) 0.5 -0.02 -0.04 -0.06 0 500 1000 Tempo(seg) 1500 500 1000 Tempo(seg) 1500 -10 -15 500 1000 Tempo(seg) 1500 -20 0 FIG. 4.8. Resposta ao degrau unitário no aileron. Linha contínua - modelo linearizado; tracejado – modelo não linear 85 Analisando as FIG. 4.6 a 4.8, pode-se observar que as respostas ao degrau unitário dos modelos linearizado e não linear se aproximaram razoavelmente. Isto ocorreu devido à amplitude do degrau dado como entrada de referência não ser suficientemente pequena e ter excitado as não linearidades existentes no modelo. Aplicando um degrau de amplitude igual a 0.1 na fração do empuxo máximo as respostas serão praticamente coincidentes como mostra a FIG. 4.9. Este fato ocorre de forma semelhante em todos os outros canais de controle. -3 15 x 10 0.2 α ( graus ) Nr Mach 10 5 -0.2 0 -0.4 -5 0 200 400 Tempo(seg) -0.6 600 x 10 10 200 400 Tempo(seg) 600 0 200 400 Tempo(seg) 600 1.5 5 0 -5 0 0 2 θ ( graus ) Taxa de pitch ( graus ) -3 15 0 200 400 Tempo(seg) 1 0.5 0 600 FIG. 4.9. Resposta ao degrau de amplitude igual a 0.1 na fração do empuxo. Linha contínua - modelo linearizado; tracejado – modelo não linear Conclui-se que o processo de linearização forneceu uma aproximação satisfatória do modelo não linear para pequenas perturbações. Para maiores perturbações o modelo linearizado oferece aproximações razoáveis. Dependendo da magnitude destas perturbações, as conseqüências serão vistas quando se compararem as respostas dos sistemas compensados em malha fechada. No modo lateral, deverá haver um maior comprometimento no desempenho do sistema compensado em malha fechada tendo em vista que se exigirá maiores ângulos de rolamento φ para determinar mudanças maiores para rumos desejados. 86 5 RESULTADOS DA DETERMINAÇÃO DE CONTROLADORES ROBUSTOS COM INTERPOLAÇÃO DE GANHOS VIA LÓGICA DIFUSA 5.1. DESCRIÇÃO DO PROBLEMA A proposta deste capítulo é realizar um estudo baseado em arquitetura hierárquica de gerenciamento autônomo de vôo para controle e guiagem de Veículos Aéreos Não Tripulados (VANT). Dentro do enfoque da arquitetura hierárquica de controle autônomo, o projeto terá como uma primeira fase a determinação dos parâmetros da malha mais interna, que é responsável pelo controle de atitude da aeronave. A estrutura da malha mais interna é uma estrutura típica com realimentação, composta pelo controlador em série com o modelo da planta. A análise será dividida nos modos longitudinal e lateral. No entanto, os controladores serão determinados, através da técnica LQG/LTR, considerando o modelo linearizado sem separálo nesses dois modos. Serão calculados controladores para diversos pontos de operação e em seguida, a fim de atender à região entre os pontos de projeto, será utilizado tabelamento de ganhos com interpolação via lógica difusa, com os parâmetros otimizados das funções de pertinência. A malha imediatamente superior é a malha de guiagem e utilizará controladores do tipo proporcional-integral-derivativo (PID) para seguir comandos de referência em altura e em rumo desejados. Estes comandos serão gerados na malha mais externa por um módulo de navegação baseado numa trajetória determinada pelo método ponto a ponto, que determina o rumo e altitude desejada com base nas coordenadas atuais e coordenadas dos way-points. O modelo matemático utilizado é o descrito no Cap. 4. A configuração para a qual foi modelado é a de aproximação para o pouso e com um número de Mach igual a 0.2. Esta configuração se caracteriza por valores elevados de coeficientes de arrasto e de sustentação e por outras características próprias nos coeficientes que afetam o modo lateral. No entanto, este modelo será utilizado neste trabalho para análise de variações de velocidade e para simular uma trajetória pré-definida, tendo em vista não se dispor de modelos não lineares completos para outras configurações. 87 5.2. CONTROLE DE ATITUDE No modo longitudinal, para realizar mudanças na altitude serão dados comandos em ângulos de trajetória (γ), que pode ser descrito como sendo a diferença entre o ângulo de arfagem (θ) e o ângulo de ataque(α). Para controle de velocidade será utilizada como entrada de referência um determinado número de Mach próximo ao valor de equilíbrio. No modo lateral, para modificar o rumo da aeronave será adotada a sistemática de giro coordenado, onde se comanda um ângulo de rolagem φ para se determinar uma mudança no ângulo de guinada enquanto se mantém o ângulo de deslizamento lateral β igual a zero. Deste modo, define-se a matriz de saída da planta como 1 0 0 − 1 Cp = 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 0 0 0 0 0 0 0 0 0 1 0 EQ 5.1 Para se obter o controlador LQG/LTR, segue-se a sistemática geral do procedimento LQG/LTR descrita na seção 3.2., cuja primeira etapa é a obtenção do modelo linearizado da planta no ponto de operação correspondente a um determinado número de Mach. A próxima etapa é a avaliação do erro de modelagem, com a obtenção das barreiras de robustez de desempenho e de estabilidade. O objetivo geral do projeto é assegurar a estabilidade do sistema real. Sendo assim, é necessário avaliar a representação do erro de modelagem. Em STEVENS & LEWIS (1991) se descreve uma representação do erro de modelagem em que se considera apenas o limite de altas freqüências e se assume que o modelo da aeronave é preciso até uma freqüência de 2 rad/s, após o qual cresce sem limite a uma taxa de 20 dB/década. Este comportamento é modelado pela seguinte expressão e M ( jω ) = jω + 2 20 EQ 5.2 onde eM(ω) é considerado um limite superior, adotando-se um erro do tipo multiplicativo. Para a robustez de estabilidade, o ganho de malha referida à saída deve satisfazer σ M (G ( jω ) K ( jω )) < 1 20 = e M ( jω ) jω + 2 EQ 5.3 quando 1/eM(jω)<<1. 88 A Figura 5.1 mostra curva representativa do erro de modelagem 1/eM(jω). 100 80 60 Módulo (dB) 40 20 0 -20 -40 -60 -80 -100 -3 10 -2 10 10 -1 0 10 10 1 2 3 10 10 Freqüência FIG 5.1 Resposta em freqüência da curva do erro de modelagem (1/eM(jω)) para aeronave. Em relação à barreira de baixa freqüência, o sistema deve ser robusto, por exemplo, a rajadas de vento. Conforme STEVENS & LEWIS (1991), a rajada de vento tem uma densidade espectral na forma: 2 Φ w (ω ) = 2 LT σ 2 onde σ é a 1 + 3LT ω 2 EQ 5.4 2 (1 + LT ω 2 ) 2 intensidade da turbulência e LT é a extensão da turbulência dividida pela velocidade do fluxo de ar verdadeiro Considerando σ = 10 ft/s e LT = 3,49 s, obtém-se o gráfico do módulo em dB da rajada conforme FIG 5.2. 100 80 60 Módulo (dB) 40 20 0 -20 -40 -60 -80 -100 -3 10 10 -2 10 -1 10 0 Freqüência (rad/s) 10 1 10 2 3 10 FIG 5.2. Curva do módulo em dB de uma perturbação externa. 89 A fim de reduzir o erro de estado de estado estacionário, realiza-se a inclusão de integradores nos canais de controle da planta. Conforme está descrito na seção 3.2, este procedimento resulta na introdução de graus de liberdade adicionais no processo, que permite uma adequada escolha da matriz L(matriz de ‘loop shaping’), tornando possível realizar o casamento dos valores singulares em baixas e altas freqüências. O primeiro passo do procedimento LQG/LTR descrito na seção 3.2 é o cálculo da matriz L conforme as EQ 3.38, 3.39, 3.40, utilizando as matrizes de estado da planta aumentada devido à inclusão de integradores nos canais de entrada da planta. Escolhendo um valor de µ 1 C ( jωI − A) −1 L , observa-se igual a 10-1 e fazendo o gráfico dos valores singulares de σ i µ na FIG. 5.3 que as curvas relacionadas aos valores singulares máximos e mínimos obedecem as condições de desempenho e estabilidade descritos pelas EQ 3.28 e 3.29. 80 60 Módulo (dB) 40 20 0 -20 1 C ( jωI − A) −1 L µ -40 σi -60 1 e M ( jω ) -80 -3 10 -2 -1 10 FIG 5.3. Valores singulares de 10 1 µ 0 1 10 10 Freqüência (rad/s) 2 10 3 10 C ( jωI − A) −1 L e curva do erro de modelagem(1/em(jω)) para aeronave 90 Com a matriz L já calculada, parte-se para o passo 2 do procedimento, que é a determinação da malha objetivo (GKF = C(jωI – A)-1H), através do cálculo da matriz H de ganhos do observador, dado pela EQ 3.32. 1 C ( jωI − A) −1 L conforme FIG. 5.4, Fazendo o gráfico de σ i [G KF ( jω )] e σ i µ verifica-se que estes valores são coincidentes para todas as freqüências e portanto satisfaz a letra c) do passo 2 do procedimento LQG/LTR descrito na seção 3.2. 80 60 Módulo (dB) 40 20 0 -20 -40 -60 -80 -3 10 -2 10 -1 10 0 10 Freqüência 1 FIG 5.4. Valores singulares da malha objetivo e 91 2 10 10 1 µ 3 10 C ( jωI − A) −1 L Analisando as curvas de σ i {[ I + G KF ( jω )] −1 G KF ( jω )} e 1/eM(jω), como mostra a FIG.5.5, verifica-se que a Condição de Robustez da Estabilidade em malha fechada é satisfeita, ou seja, verifica-se que σ i {[ I + G KF ( jω )]−1 G KF ( jω )} < 1/eM(jω) , ( ∀ω ). 80 60 Módulo (dB) 40 20 0 -20 -40 -60 -80 -3 10 ____ σ i {[ I + GKF ]−1 GKF ------ 1 e M ( jω ) -2 10 -1 10 0 1 10 10 Freqüência (rad/s) 2 3 10 FIG 5.5. Valores singulares da malha objetivo em malha fechada e 10 1 e M ( jω ) Continuando no passo 3 do procedimento LQG/LTR (Recuperação da Malha Objetivo ou ‘Loop Transfer Recovery – LTR’), calculam-se os zeros de GN(s) e constata-se que um deles se localiza no SPD, ou seja, a planta é de fase não-mínima. Os valores encontrados para os zeros de transmissão foram os seguintes: -17.6376, 0.3234 e -0.5216. Em seguida, calcula-se a matriz de ganhos de realimentação de estados G = 1 ρ BT K com valor para ρ igual a 10-5, onde K é solução da equação algébrica de Riccati, conforme se mostra na EQ 3.44. Com os valores das matrizes G e H calculados determina-se a função de transferência do controlador conforme a EQ. 3.49. . 92 Em seguida , com auxílio do gráfico da FIG. 5.6, compara-se σ i [(G N ( jω ) K ( jω )] com σ i [G KF ( jω )] obtidos. Nesta figura, são mostradas as curvas correspondentes a valores de ρ iguais a 10 e 10-3 para ilustrar a recuperação. A análise gráfica revela que a proximidade entre as curvas é razoavelmente satisfatória para ρ igual a 10-3. Esta distância poderia ser diminuída para valores menores de ρ, no entanto, com a diminuição deste valor, exige-se um esforço maior dos atuadores. Assim, o valor determinado deve indicar um compromisso entre a proximidade e o esforço de controle exigido. Além disso, como há um zero de transmissão no SPD localizado na região de baixas freqüências, para um valor limite de ρ, os σ i [(G N ( jω ) K ( jω )] não se aproximam mais dos σ i [G KF ( jω )] . 80 _ 60 σ i [GKF ( jω )] ρ = 10-3 σ i [GN ( jω ) K ( jω )] , ρ = 10 σ i [GN ( jω ) K ( jω )] , Módulo (dB) 40 20 0 -20 -40 -60 -80 -3 10 -2 10 -1 0 10 1 2 3 10 10 10 10 Freqüência FIG 5.6. Valores singulares da malha objetivo GKF(j ω) e de GN(jω)K(jω) Em seguida, prossegue-se no passo 3.g) do procedimento LQG/LTR da seção 3.2, que verifica se a seguinte Condição de Robustez de Estabilidade para o sistema compensado em malha fechada é satisfeita σ M [ I + G ( jω ) K ( jω )]−1 G ( jω ) K ( jω ) < 93 1 , em ( jω ) ∀ω EQ 5.5 Conforme se vê na FIG. 5.7, o sistema satisfaz esta condição. 80 60 Módulo (dB) 40 20 0 -20 -40 ____ -60 ------ -80 -3 10 σ i {[ I + GN ( jω ) K ( jω )]−1 GN ( jω ) K ( jω ) 1 e M ( jω ) -2 10 -1 10 0 1 10 10 Freqüência (rad/s) 2 10 3 10 FIG 5.7. Valores singulares do sistema compensado em MF e de 1/eM(jω) 94 Percorrido todos os passos do procedimento, chega-se ao controlador K(s) calculado para M0 = 0.2, representado pela seguinte expressão: K ( s ) = G ( sI − A + BG + HC ) −1 H EQ 5.6 com T 3.7052e + 000 2.2045e - 001 4.5435e - 009 - 2.9082e - 010 6.8887e - 001 3.3477e - 002 - 2.5219e - 010 - 2.2958e - 010 G= 4.2615e + 002 - 3.1049e + 002 5.2008e - 008 - 1.5251e - 008 2.3447e + 000 1.5385e - 007 - 2.4026e - 008 3.1277e + 002 2.2045e - 1 6.7080e - 001 - 4.3156e - 009 - 1.5732e - 009 6.2994e - 002 2.4929e - 002 5.2840e - 009 2.6034e - 010 1.9836e + 001 - 4.7538e + 001 3.6985e - 006 - 1.8486e - 007 - 5.9471e + 000 - 9.5456e - 006 - 1.1106e - 006 4.6256e + 001 8.4552e - 012 3.0876e - 012 2.4061e + 000 - 2.9817e - 001 4.1216e - 012 2.5646e - 013 2.9390e - 001 - 1.1221e - 001 7.2501e - 010 - 3.6583e - 009 3.1158e + 002 1.3784e + 001 7.2301e - 011 - 5.0038e + 002 - 3.7378e + 001 3.7108e - 009 - 1.0019e - 010 - 2.0245e - 011 - 2.9817e - 001 4.5156e + 000 - 2.5913e - 011 - 1.6887e - 012 - 9.4172e - 002 1.0240e + 000 - 5.7723e - 009 2.1746e - 008 - 3.1634e + 001 - 1.7274e + 002 - 4.1568e - 010 - 9.7834e + 001 - 3.1384e + 002 - 2.2058e - 008 - 1.2686e + 001 1.4438e + 002 2.6648e - 014 - 8.5059e - 014 - 1.2686e + 001 1.4438e + 002 2.0573e - 014 - 8.7875e - 014 H= 3.1623e + 000 - 6.4757e + 002 5.2708e - 014 2.0206e - 013 3.2741e - 014 4.5901e - 015 6.3450e - 014 - 6.4757e + 002 1.5529e - 001 1.8332e - 008 5.6961e - 002 6.7452e - 009 1.3039e - 015 1.1218e + 000 - 9.7793e - 015 - 3.9806e + 000 1.5529e - 001 1.8332e - 008 5.6961e - 002 6.7452e - 009 2.5377e - 015 1.1218e + 000 - 8.0566e - 015 - 3.9806e + 000 2.5500e - 010 4.4031e - 013 - 2.5548e - 001 - 3.0253e - 008 5.2491e - 015 3.1623e + 000 1.5475e - 014 1.1370e - 003 - 3.9973e - 013 1.5272e - 014 - 1.9237e - 015 - 5.0302e - 003 7.8889e - 015 - 7.2667e - 016 2.9068e + 000 - 3.0253e - 008 - 1.8743e - 009 2.1876e - 008 - 7.7722e - 002 6.7605e - 002 - 1.8743e - 009 2.1876e - 008 - 7.7722e - 002 6.7605e - 002 1.2734e - 013 - 9.8116e - 008 2.7558e - 015 - 1.7043e - 003 1.2155e - 014 7.5400e - 003 3.1623e + 000 - 9.8116e - 008 95 O mesmo procedimento se faz para outros pontos de operação necessários para cobrir um determinado envelope de operação.Os valores de µ = 10-1 e ρ = 10-3 serão utilizados na determinação dos controladores destes outros pontos de operação, tendo em vista que se define aproximadamente a mesma freqüência de cruzamento para os valores singulares da função de transferência de malha ( GN(s)K(s)), gerando controladores que fazem com que os sistemas compensados em malha fechada respondam de forma semelhante a entradas de referência em degrau. O controlador calculado para um determinado ponto de operação correspondente a um certo valor de M0 será representado por KMo(s). Para M0 = 0.2, por exemplo, o controlador será denominado K.2(s) Para a realização das simulações onde se deseja controlar a atitude da aeronave, o controlador calculado é colocado em série com a planta e faz-se uma realimentação de saída. Este procedimento é utilizado tanto no modelo não linear como no modelo linearizado. Para provocar mudanças na altitude é necessário comandar ângulos de trajetória diferentes de zero. Assim, para alcançar uma trajetória de subida é aplicada uma entrada de referência em degrau de amplitude positiva para o ângulo de trajetória. Conforme se vê na FIG. 5.8, as respostas temporais referentes ao modelo não linear e ao linearizado se aproximam bastante para pequenos ângulos comandados. Para controle de velocidade, mantém-se um determinado valor de referência para o número de Mach. Isto porque para realizar subidas ou descidas a aeronave aumenta ou diminui sua velocidade, conforme se vê pela FIG. 5.9, onde procura se manter a velocidade da aeronave em um valor correspondente 0.4 780 0.3 775 Altitude (m) Ângulo de trajetória(graus) a Mach 0.2. 0.2 0.1 0 0 10 20 Tempo(seg) 30 Taxa de Pitch (graus/s) Número de Mach 0.3 0.25 0.2 0.15 0 10 20 Tempo(seg 30 765 760 0 40 0.35 770 40 ) 10 20 30 40 10 20 30 40 Tempo(seg) 0.2 0.1 0 -0.1 -0.2 -0.3 0 Tempo(seg) FIG. 5.8. Resposta ao degrau para o ângulo de trajetória. (linha contínua - linear; tracejado não linear). 96 Para o modo lateral, aplica-se uma entrada de referência no ângulo de rolagem, mantendo a referência para o ângulo de deslizamento igual a zero. Com isso obtém-se um giro coordenado, minimizando-se o deslizamento lateral, conforme se vê na FIG. 5.9. Como se pode observar por esta figura, ocorreu uma maior diferença entre a resposta linear e a resposta não linear com relação à variação do ângulo de deslizamento lateral. Tal fato é decorrência da excitação de modos não lineares provocada pela amplitude do sinal de entrada na variável de referência φ. Observa-se também que o ângulo de guinada(yaw) se modifica pouco e muito lentamente, tendo em vista a não adequação da configuração utilizada. Para maiores mudanças de rumo desejadas em um vôo autônomo, é necessário linearizar o modelo matemático da aeronave em trajetórias circulares com velocidade angular de guinada mantida constante e em configurações adequadas. 6 Yaw angle(graus) Roll angle(graus) 15 10 5 0 0 50 Tempo(seg) 0 50 Tempo(seg) 100 50 Tempo(seg) 100 10 Roll rate (graus/s) 1.5 Beta (graus) 2 -2 0 100 2 1 0.5 0 -0.5 4 0 50 Tempo(seg) 5 0 -5 0 100 FIG.5.9. Resposta ao degrau para o ângulo de rolagem e variações em ψ, β, e p. (Linha contínua: linear; Linha tracejada: não linear). 97 5.3 ANÁLISE DAS VARIAÇÕES PARAMÉTRICAS E APLICAÇÃO TABELAMENTO DE GANHOS COM INTERPOLAÇÃO VIA LÓGICA DIFUSA DE No decorrer de uma missão típica de aeronave não tripulada, ocorrem variações paramétricas que podem deteriorar o seu desempenho ou até mesmo levá-la à instabilidade. Em uma aeronave, podem ocorrer diversos tipos de variações de parâmetros que mudam o comportamento da planta, tais como, variações de massa, de velocidade, de densidade atmosférica, etc. Além disso, o modelo matemático completo de uma aeronave possui parâmetros que variam de acordo com o tipo de trajetória executada. As trajetórias de subida e de descida, por exemplo, são caracterizadas por ângulos de trajetória positivo e negativo, respectivamente. A trajetória circular estacionária, por sua vez, é caracterizada por uma velocidade angular de guinada ( r ) constante. Para controlar o avião nestes modos, é necessário fazer a linearização do modelo matemático nos pontos de operação determinados por estas variações. O modelo utilizado neste trabalho foi obtido para um número de Mach igual a 0.2. Ou seja, todas as suas curvas de coeficientes aerodinâmicos foram levantadas com base neste número de Mach. Para um número de Mach diferente é necessário levantar outras curvas dos coeficientes aerodinâmicos. No entanto, este modelo matemático será utilizado com objetivos acadêmicos neste estudo para analisar e tratar as variações de número de Mach. Assim, arbitrou-se uma faixa de variações situada entre Mach 0.2 a 0.3, limitada pelos valores de equilíbrio menores que 1 para a fração do empuxo máximo, conforme pode ser verificado na TAB. 4.1. Serão também analisadas as variações nos ângulos de trajetória na faixa de ± 3° . Inicialmente, será verificada a estabilidade do sistema compensado em malha fechada face a variações de número de Mach e de ângulo de trajetória acima descritas. Para esta verificação, é calculado o controlador em um determinado ponto de operação e, em seguida, para um determinado conjunto de variações de γ e M em relação ao ponto nominal, é determinado o modelo linearizado. Após isso, mantendo o controlador calculado no ponto nominal, é calculada a função de transferência do sistema em malha fechada (MF) e verificada a localização de seus pólos. Caso não haja nenhum pólo localizado no SPD, este ponto de operação é marcado em um gráfico que contém no seu eixo vertical valores de γ e no seu eixo horizontal valores de número de Mach. No caso de algum pólo ser instável, este 98 ponto não é marcado. Procedendo deste modo em toda a faixa de variações, obtém-se um conjunto de pontos em que o sistema compensado em MF é estável, mantido o controlador calculado nas condições nominais. Este conjunto de pontos forma uma região que será denominada de região de estabilidade. Este procedimento é feito para pontos de operação nominais correspondentes a Mach 0.2, 0.25 e 0.3. As regiões de estabilidade para os sistemas compensados em MF com controladores calculados a partir destes pontos nominais estão ilustradas nas FIG.5.10, 5.11 e 5.12, respectivamente. 3 Ângulo de trajetória 2 1 0 -1 -2 -3 0.19 0.2 0.21 0.22 0.23 0.24 0.25 0.26 0.27 0.28 0.29 Número de Mach 0.3 0.31 FIG 5.10. Região de estabilidade (M0 = 0.2 e γ0 = 0 graus) 3 Ângulo de trajetória 2 1 0 -1 -2 -3 0.19 0.2 0.21 0.22 0.23 0.24 0.25 0.26 0.27 0.28 0.29 Número de Mach 0.3 0.31 FIG. 5.11. Região de estabilidade (M0 = 0.25 e γ0 = 0 graus) 99 3 Ângulo de trajetória 2 1 0 -1 -2 -3 0.19 0.2 0.21 0.22 0.23 0.24 0.25 0.26 0.27 0.28 0.29 Número de M 0.3 0.31 FIG. 5.12. Região de estabilidade (M0 = 0.3 e γ0 = 0 graus) Observando as FIG. 5.10, 5.11 e 5.12, nota-se que as regiões de estabilidade abrangem toda a faixa desejada de variações paramétricas. Diante disso, cada um dos controladores calculados poderia ser uma solução para o problema proposto levando em conta somente o critério da estabilidade. No entanto, o desempenho do sistema pode não ser satisfatório, dependendo das especificações exigidas. Para este trabalho e com fins acadêmicos, será analisado o desempenho do sistema compensado em malha fechada face somente a variações de número de Mach. Para analisar o desempenho do sistema em malha fechada face às variações do número de Mach, serão realizadas simulações de forma semelhante da que foi feita para a análise da estabilidade. A diferença entre as simulações é que, ao invés de verificar a localização dos pólos, será analisada a resposta a uma entrada de referência em degrau. Serão analisadas as respostas temporais de cada um dos seguintes sistemas em MF : CN.Mo_.2(s) = [G N .Mo ( s ) K .2 ( s )][ I + G N .Mo ( s ) K .2 ( s)] −1 EQ 5.7 CN.Mo_.25(s) = [G N .Mo ( s ) K .25 ( s)][ I + G N .Mo ( s) K .25 ( s )]−1 EQ 5.8 CN.Mo_.3(s) = [G N .Mo ( s ) K .3 ( s )][ I + G N .Mo ( s ) K .3 ( s )]−1 EQ 5.9 onde GN.Mo(s) é a matriz de funções de transferência referente ao modelo linearizado no ponto de operação correspondente a um determinado número de Mach (M0); 100 K.2(s), K.25(s) e K.3(s) são as matrizes de funções de transferência dos controladores calculados com base nos modelos linearizados nos pontos de operação correspondentes a Mach 0.2, 0.25 e 0.3, respectivamente; Aplicando uma entrada de referência do tipo degrau no ângulo de trajetória, a resposta de cada sistema para cada ponto de operação correspondente a um número de Mach é yMo_.2 = step (CN.Mo_.2(s), t ) EQ 5.10 yMo_.25 = step (CN.Mo_.25(s), t ) EQ 5.11 yMo_.3 = step (CN.Mo_.3(s), t ) EQ 5.12 onde EQ 5.13 t = [ 0 0.1 0.2 …100] step é a função do MatLab para entrada em degrau. Para quantificar o desempenho do sistema, é proposto um funcional de custo que mede a área entre a curva de resposta do sistema em malha fechada e a entrada de referência. Este funcional é representado pela seguinte expressão N +1 J 1 = ∑ | y Mo _ controlador (k ) − y r (k ) | ⋅∆t , onde N= 1000 e ∆t = 0.1 EQ 5.14 K =1 As FIG. 5.13, 5.14 e 5.15 mostram as curvas de custos J1, para cada variável de referência, gerada pela variação do número de Mach em relação aos pontos de operação 80 80 60 60 Custo J1 ( γ ) Custo J1 (M) nominal correspondentes a Mach 0.2, 0.25 e 0.3. 40 20 0 0.2 0.25 40 20 0 0.2 0.3 Número de Mach 0.3 80 Custo J1 ( φ ) Custo J1 ( β ) 80 60 60 40 40 20 0 0.2 0.25 Número de Mach 20 0.25 0.3 Número de Mach 0 0.2 0.25 0.3 Número de Mach FIG. 5.13. Curva de custos J1 para cada variável de referência (M0 = 0.2) 101 60 40 Custo J1 ( γ ) Gama Custo J1 ( M ) 60 40 20 20 0 0.2 0.25 Número de Mach 0 0.2 0.3 0.3 0.25 Número de Mach 0.3 60 Custo J1 ( φ ) Custo J1 ( β ) 60 0.25 Número de Mach 40 20 0 0.2 0.25 Número de Mach 40 20 0 0.2 0.3 40 20 0 0.2 Custo J1 ( β ) 60 Custo J1 ( γ ) 60 0.25 Número de Mach 60 40 20 0 0.2 0.25 Número de Mach 0.3 40 20 0 0.2 0.3 Custo J1 ( φ ) Custo J1 ( M ) FIG. 5.14. Curva de custos J1 para cada variável de referência (M0 = 0.25) 0.25 Número de Mach 0.3 0.25 Número de Mach 0.3 60 40 20 0 0.2 FIG. 5.15. Curva de custos J1 para cada variável de referência (M0 = 0.3) Portanto, pelo que se pode observar através das FIG. 5.13, 5.14 e 5.15, nenhum dos três controladores isoladamente fornece um índice de desempenho favorável, principalmente para a variável de estado número de Mach, na faixa de variações pretendidas. Para que se 102 melhore este índice de desempenho do sistema compensado em malha fechada em relação às variações do número de Mach, pode-se adotar a solução do tabelamento de ganhos. Para isso é necessário determinar controladores para os diversos pontos de operação e fazer a interpolação de ganhos (ou parâmetros) de cada controlador à medida que o sistema varia o número de Mach. Uma outra solução é a comutação de ganhos, mas esta não é uma solução razoável, porque ocorrem variações rápidas nos parâmetros do controlador, gerando transientes indesejáveis e, em casos mais críticos, ocasionando instabilidade, fato este bastante conhecido na literatura (ROSENBROCK, 1963; SKOOG & LAU, 1973). Para diminuir as variações rápidas de parâmetros seria necessário projetar controladores muito próximos entre si, gerando um esforço de projeto maior. Com o intuito de evitar tais problemas adota-se a interpolação de ganhos. A estrutura de tabelamento de ganhos utilizada para esta aplicação faz a ponderação das saídas dos sub-controladores através de ganhos, conforme mostra a FIG. 5.16. gK g2 g1 YR + - K1(s) X K2(s) X Kk(s) X TABELADOR DE GANHOS v + + + I/s Planta Y FIG. 5.16. Diagrama de estrutura de controle com tabelamento de ganhos Nesta figura, o bloco da planta representa a dinâmica da aeronave, o bloco I/s representa os integradores no canal de entrada da planta e o controlador global consiste de k sub-controladores K1(s) ,..., Kk(s) , projetados em k diferentes pontos de operação. O vetor de 103 variáveis de tabelamento é denominado v(t) e o algoritmo de tabelamento fornece os ganhos g1,..., gk para os sub-controladores. O sinal de controle é dado pela seguinte expressão: η (t ) δ (t ) e = δ r (t ) δ a (t ) η trim δ k e trim + g (v(t )) K l l δ r trim ∑ l =1 δ a trim M ref γ ref β ref φ ref −M − γ −β − φ EQ 5.15 onde Mref, γref, βref, φref são os comandos de referência e Kl(s) é a função de transferência do controlador robusto linear projetado no l-ésimo ponto de operação e gl é a saída do l-ésimo sub-controlador e v(t) é o vetor de variáveis de tabelamento. Neste trabalho, pelas observações relativas às FIG. 5.13, 5.14, 5.15, é adotado k=3 para o número de sub-controladores. Os pontos de operação para o cálculo dos sub-controladores estão em Mach 0.2, 0.25 e 0.3. Partindo-se da premissa de que se faz a interpolação com controladores calculados através de técnicas com critérios específicos, é intuitivo considerar que, em pontos situados na região intermediária, o sistema compensado pelo controlador resultante da interpolação tenha uma resposta que esteja situada entre as respostas dos pontos de projeto. Para quantificar esta proximidade entre as curvas é necessário estabelecer uma expressão que represente adequadamente o desempenho desejado. Com o objetivo de se chegar a esta expressão, serão analisadas as curvas de resposta para os seguintes sistemas compensados em malha fechada: CN.2_.2(s) = [G N .2 ( s) K .2 ( s )][ I + G N .2 ( s ) K .2 ( s )]−1 EQ 5.16 CN.25_.25(s) = [G N .25 ( s) K .25 ( s)][ I + G N .25 ( s ) K .25 ( s )]−1 EQ 5.17 CN.3_.3(s) = [G N .3 ( s ) K .3 ( s )][ I + G N .3 ( s ) K .3 ( s )]−1 EQ 5.18 Aplicando uma entrada de referência do tipo degrau para Mref, a resposta para cada um dos sistemas anteriores é y.2_.2 = step (CN.2_.2(s), t ) EQ 5.19 y.25_.25 = step (CN.3_3(s), t ) EQ 5.20 y3_3 = step (CN.3_3(s), t ) EQ 5.21 onde EQ 5.22 t = [ 0 0.1 0.2 …100] 104 Para um ponto de operação situado entre Mach 0.2 e 0.25, observou-se que o controlador calculado com base neste ponto intermediário, mantendo-se os mesmos valores dos parâmetros da técnica LQG/LTR usados para Mach 0.2 e 0.25, faz com que o sistema compensado com este controlador tenha uma resposta temporal que se situa entre as curvas y.2_.2 e y.25_.25. Como exemplo, para o ponto de operação correspondente a Mach 0.22, as respostas temporais dos sistemas compensados por controladores LQG/LTR para M0 igual a 0.2, 0.22 e 0.25 são mostradas na FIG. 5.17. 1.2 1 Número de Mach 0.8 0.6 0.4 y.2_.2 0.2 y.22_.22 y.25_.25 0 -0.2 0 10 20 30 Tempo (seg) 40 50 60 FIG. 5.17. Resposta ao degrau para ponto de operação em M0 = 0.22 Para simplificação de trabalho computacional, ao invés de se calcular o controlador para cada ponto de operação intermediário, pode-se estabelecer uma curva de resposta temporal que seja resultado de uma média proporcional entre as curvas dos pontos de projeto vizinhos. Esta curva será denominada de curva objetivo. Para pontos situados entre 0.2 e 0.25, a expressão para a curva objetivo é a seguinte: YMach_(obj) = (200(0.25 - Mach) y .2_.2 + 200(Mach - 0.2) y .25_.25 ) 10 105 EQ 5.23 Para pontos situados entre Mach 0.25 e 03, a curva objetivo é expressa por YMach_(obj) = (200(0.3 - Mach) y . 25_. 25 + 200(Mach - 0.25) y . 3_. 3 ) EQ 5.24 10 Por exemplo, para o ponto correspondente a Mach 0.22, a expressão para a curva objetivo é: y.22_.(obj.) = (6y .2_.2 + 4y .25_.25 ) EQ 5.25 10 Para verificar a proximidade entre a curva objetivo e a curva verdadeira, na FIG. 5.18, mostra-se para o ponto de operação correspondente a Mach 0.22 que a curva objetivo se aproxima bastante da curva verdadeira. 1.2 Número de Mach 1 0.8 0.6 0.4 y .22_.22 0.2 y .22_(obj) 0 -0.2 0 10 20 30 Tempo 40 50 60 FIG. 5.18. Curva objetivo para ponto de operação situado na região intermediária Ao se fazer a interpolação de ganhos, deseja-se que a curva de resposta gerada pelo sistema compensado através do tabelamento de ganhos se aproxime o máximo possível da curva objetivo e, conseqüentemente, aproxime-se da curva verdadeira. Através do tabelamento de ganhos, determina-se um controlador global que é expresso por KTG(s) = g1K.2(s) + g2K.25(s) + g3K.3(s) 106 EQ 5.26 O sistema compensado em malha fechada torna-se então CN.Mo_TG(s) = [ GNmo(s)KTG(s) ] [ I + GNmo(s)KTG(s) ]-1 EQ 5.27 A resposta em degrau é expressa por yMo_TG = step (CN.Mo_TG(s), t ) EQ 5.28 Para que yMo_TG se aproxime de sua respectiva curva objetivo é necessário ajustar os ganhos dos sub-controladores de modo que a proximidade entre as curvas seja a menor possível. Para quantificar este critério, estabelece-se um funcional de custo J2 que representa a área compreendida entre as curvas yMo_TG e yMo_(obj). O funcional de custo J2 é expresso por: N +1 J 2 = ∑ | y Mo _ TG (k ) − y Mo _(obj ) (k ) | ⋅∆t , onde N=1000 e ∆t = 0.1 EQ 5.29 K =1 Deste modo, o melhor ajuste para os ganhos dos sub-controladores será aquele que fornecer a resposta com o menor valor para o custo J2 para um determinado ponto de operação intermediário. Para pontos de operação situados na região de transição é necessário determinar os ganhos dos sub-controladores de modo que o custo seja o menor possível. Isto pode ser feito escolhendo pontos de operação na região de transição que sejam suficientemente próximos entre si. Para cada ponto de operação intermediário, é preciso calcular os ganhos dos subcontroladores de modo que o custo J2 calculado seja pequeno. Isto pode ser feito através de um processo de otimização. Após ter calculado os ganhos de maneira ótima para cada ponto de operação intermediário, utiliza-se regressão linear para se determinar uma expressão que seja válida para os demais pontos de operação situados entre os pontos extremos. Após isto, são realizadas simulações em pontos para os quais os ganhos dos sub-controladores não foram otimizados e verifica-se a adequação do valor do custo J2 para cada ponto intermediário. Uma maneira alternativa de implementar uma lei de tabelamento de ganhos é utilizar a lógica fuzzy ou lógica difusa. A interpolação de ganhos com a utilização de lógica fuzzy (Fuzzy Gain Scheduling) faz a ponderação de modo sistemático entre os controladores, aproveitando o conhecimento e a experiência do projetista. A vantagem adicional da 107 interpolação via lógica fuzzy é a diminuição do número de pontos intermediários utilizados e a diminuição do esforço computacional. A variável lingüística utilizada neste trabalho é denominada NrMach e está relacionada ao número de Mach, que é a variável de tabelamento de ganhos. A faixa de variação do número de Mach está situada entre 0.2 e 0.3 e é denominado espaço de entrada. Identificado o espaço de entrada a próxima etapa é a partição deste espaço em termos lingüísticos. A variável lingüística de entrada está associada a um conjunto de termos lingüísticos definidos neste espaço. Deste modo, dividiu-se o espaço de entrada NrMach em três subconjuntos fuzzy (termos lingüísticos): BAIXO , MÉDIO e ALTO. O termo lingüístico BAIXO é representado por uma função de pertinência do tipo trapezoidal aberta à esquerda. O termo lingüístico MÉDIO é representado por uma função de pertinência do tipo triangular. O termo lingüístico ALTO é representado por uma função de pertinência do tipo trapezoidal aberta à direita. Para estimar inicialmente os parâmetros das funções de pertinência da variável lingüística NrMach, adotou-se a verificação e a análise do comportamento das curvas de custos J1 para as respostas a uma entrada na variável de referência no número de Mach dos sistemas compensados em malha fechada, através das FIG.5.13 e 5.14 e 5.15. Observando as figuras, verifica-se que, para a variável MRef, o custo J1 aumenta consideravelmente à medida que se afasta do ponto de operação nominal. Com isto, pode se considerar que cada controlador tenha uma faixa de atuação predominante somente nas vizinhanças de cada ponto nominal e que esta atuação diminua à medida que se afasta destes pontos. Considerando a denominação dos parâmetros das funções de pertinência do tipo trapezoidal definidos na seção 3.3, para a variável lingüística NrMach os valores escolhidos são os seguintes: - o parâmetro a1 igual 0.2 define o valor de M para o qual a influência de K.2(s) é predominante. - o parâmetro d1 igual 0.25 define o valor de número de Mach para o qual a influência de K.2(s) pode ser mínima. - os parâmetros e2 igual 0.25 e d2 igual a 0.3 definem os valores de número de Mach para o qual a influência de K.25(s) pode ser mínima. - o parâmetro a2 define o valor de número de Mach para o qual a influência de K.25 (s) pode ser predominante. - o parâmetro e3 igual 0.25 define o valor de número de Mach para o qual a influência de K.3(s) pode ser mínima. 108 - o parâmetro a3 igual a 0.3 define o valor de número de Mach para o qual a influência de K.3(s) pode ser predominante. A FIG. 5.19 mostra as funções de pertinência da entrada da variável lingüística NrMach com os valores acima estabelecidos. 1.2 1 BAIXO MÉDIO ALTO Grau de pertinência 0.8 0.6 0.4 0.2 0 0.18 0.2 0.22 0.24 NrMach 0.26 0.28 0.3 0.32 FIG. 5.19. Funções de pertinência da variável lingüística NrMach As variáveis de saída que representam a ação de comando são os ganhos dos subcontroladores g1, g2 e g3 . Cada uma das variáveis de saída possui dois termos lingüísticos: BAIXO e ALTO. O termo lingüístico BAIXO é representado por função de pertinência do tipo trapezoidal aberta à esquerda. O termo lingüístico ALTO é representado por uma função de pertinência do tipo trapezoidal aberta à direita. De forma semelhante à definição dos parâmetros das funções de pertinência da variável NrMach, a notação utilizada será a mesma da seção 3.3. A escolha dos parâmetros das funções de pertinência das variáveis de saída g1, g2 e g3 é dependente do método de decodificação utilizado. Como será utilizado o método Centro dos Máximos, somente os pontos centrais associados aos valores máximos de cada função de pertinência necessitam ser considerados. Assim, somente os parâmetros a1 e a3 serão definidos nas funções de pertinência das variáveis de saída. Como se deseja graduar a influência de cada controlador à medida que se afasta do ponto de operação nominal, é conveniente escolher inicialmente para o parâmetro a1 igual a 0 e para parâmetro a3 igual a 1 para todas as variáveis de saída. Como se pretende posteriormente modificar os valores de a1 e a3 para cada variável de saída separadamente, estes parâmetros serão denominados, respectivamente, de C1_BAIXO e 109 C1_ALTO para a variável g1, de C2_BAIXO e C2_ALTO para a variável g2 e de C3_BAIXO e C3_ALTO para a variável g3. A FIG. 5.20 mostra as funções de pertinência da variável g1, com os valores iniciais dos parâmetros escolhidos. As variáveis g1 e g2 possuem forma semelhante. 1.2 1 BAIXO ALTO Pertinência 0.8 0.6 0.4 0.2 0 -0.2 0 0.2 0.4 0.6 0.8 Ganho g 1 1.2 1.4 1 FIG. 5.20. Funções de pertinência da variável g1 Os conhecimentos do processo podem ser explicitados com base no sistema de inferência fuzzy de Mandani como um conjunto de regras entre as variáveis lingüísticas de entrada (Mach) e as variáveis de saída (g1, g2): R1: Se NrMach é BAIXO então g1 é ALTO , g2 é BAIXO e g3 é BAIXO; R2: Se NrMach é MÉDIO então g1 é BAIXO , g2 é ALTO e g3 é BAIXO; R3: Se NrMach é ALTO então g1 é BAIXO , g2 BAIXO e g3 é ALTO; Após a escolha dos parâmetros das funções de pertinência para cada termo lingüístico da variável de entrada e das variáveis de saída e da definição do conjunto de regras, aplica-se o método de decodificação escolhido para obter os valores físicos que melhor representam o valor fuzzy da variável de saída. O método de decodificação produz o resultado final do processo do raciocínio fuzzy explicitado através do conjunto de regras entre as variáveis de entrada e variáveis de saída, fornecendo um sinal de ponderação representado pelo vetor de ganhos dos sub-controladores. Como exemplo, considerando que se deseja calcular os ganhos dos sub-controladores para M = 0.22, calcula-se o valor das funções de pertinência para este número de Mach e, 110 através do conjunto de regras de inferência, determina-se quais são as regras ativadas com seus respectivos graus de validade (GRi), conforme se vê abaixo: R1 : Nr Mach BAIXO (µ = 0.6) então g1 ALTO, g2 BAIXO e g3 BAIXO R2 : Nr Mach MÉDIO(µ = 0.4) então g1 BAIXO, g2 ALTO e g3 BAIXO R3 : Nr Mach ALTO (µ = 0.0) então g1 BAIXO, g2 BAIXO e g3 ALTO Com isso, GR1 = 0.6; GR2 = 0.4; GR3 = 0 Assim, aplicando o processo de decodificação, os valores para g1, g2 e g3 são g1 = 0.6 ⋅ 1 + 0.4 ⋅ 0 + 0 ⋅ 0 =0.6 0.6 + 0.4 + 0 EQ 5.30 g2 = 0.6 ⋅ 0 + 0.4 ⋅ 1 + 0 ⋅ 0 = 0.4 0.6 + 0.4 + 0 EQ 5.31 g3 = 0.6 ⋅ 0 + 0.4 ⋅ 1 + 0 ⋅ 0 = 0 0.6 + 0.4 + 0 EQ 5.32 Aplicando este procedimento para toda a faixa de variação do número de Mach entre 0.2 a 0.3, os ganhos dos sub-controladores variam conforme se vê na FIG. 5.21. 1.2 1 Ganhos dos sub-controladores 0.8 g1 0.6 g2 0.4 g3 0.2 0 -0.2 0.2 0.22 0.24 0.26 Número de Mach 0.28 0.3 0.32 FIG. 5.21. Variação dos ganhos g1, g2, e g2 de acordo com a variação do Nr de Mach 111 Para verificar o comportamento do sistema em malha fechada, quando se compensa o modelo linearizado no ponto de operação correspondente a um determinado número de Mach com o controlador obtido através da interpolação de ganhos com os valores iniciais estimados, segue-se a seguinte seqüência: 1) Determinar o controlador global pela interpolação de ganhos via lógica fuzzy, cuja expressão é a seguinte EQ 5.33 KFS i (s) = g1K.2(s) + g2K.25(s) + g3K.3(s) 2) Determinar o sistema compensado em malha fechada expresso por CN.Mo_FS i (s) = [G N .Mo ( s ) K FSi ( s)][ I + G N .Mo ( s ) K FSi ( s)] −1 EQ 5.34 3) Determinar resposta em degrau expressa por EQ 5.35 y.Mo_FSi = step (CN.Mo _FSi(s), t) 4) Calcular o custo J1 de acordo com a EQ. 5.29. Fazendo a variação do ponto de operação e calculando o custo J1 tanto para as curvas objetivos como para as curva de resposta do sistema compensado com o controlador obtido por interpolação difusa com parâmetros inicialmente estimados ( KFSi ), obtém-se o gráfico da FIG. 5.22. Pelo que se observa nesta figura, a curva do custo J1 obtida do sistema compensado, através da interpolação com os parâmetros inicialmente escolhidos das funções de pertinência, fornece um boa aproximação com a curva J1(obj), entre Mach 0.25 e 0.3. 20 18 16 14 Custo J1 12 10 8 6 J1(obj) 4 J1_FSi 2 0 0.2 0.21 0.22 0.23 0.24 0.25 0.26 0.27 0.28 Número de Mach FIG. 5.22. Curvas dos custo J1(obj) e J1_FSi 112 0.29 0.3 A TAB. 5.1 mostra os valores da diferença de custos entre a curva objetivo e a curva de resposta do sistema em MF compensado com tabelamento de ganhos para diferentes pontos de operação. TAB. 5.1 Diferença de custos Ponto de operação (M0) J1_FSi – J1(obj) 0.20 0.0000 0.21 2.8218 0.22 2.8097 0.23 2.0090 0.24 1.1703 0.25 0.0000 0.26 0.2363 0.27 0.3389 0.28 0.3251 0.29 0.2134 0.30 0.0000 A FIG. 5.23 mostra a curva obtida da interpolação de ganhos via FS e a curva objetivo para um valor de M0 = 0.21 que onde a diferença é próxima da maior constante no gráfico da FIG.5.22 . 1.2 1 Número de Mach 0.8 0.6 0.4 y.21_FSi 0.2 y.21_(obj) 0 -0.2 0 10 20 30 40 50 60 Tempo ( seg) 70 80 90 100 FIG. 5.23. Curvas de resposta ao degrau para o número de Mach 113 Para diminuir o módulo da diferença entre as curvas e conseqüentemente ter um melhor desempenho é necessário modificar os parâmetros das funções de pertinência da variável de entrada NrMach e das variáveis de saída. Este ajuste pode ser feito através do método de tentativas. No entanto, este processo pode ser muito custoso, tendo em vista que é preciso atender aos requisitos em vários pontos de operação situados na região intermediária. Uma maneira mais adequada é utilizar um método de otimização para ajustar estes parâmetros levando-se em conta os custos J2 para vários pontos de operação. Neste caso, além dos pontos de operação nominais 0.2, 0.25 e 0.3, são necessários no mínimo dois pontos intermediários nos intervalos. Assim, foram escolhidos os pontos de operação intermediários em Mach 0.21, 0.22, 0.24, 0.27 e 0.28. Com isso, a função objetivo a ser minimizada tem a seguinte expressão para os pontos de operação considerados: t t t K =1 K =1 K =1 J 3 = ∑ [ y.2 _ . FS (k ) − y.2( obj ) (k )](0.1) + ∑ [ y .21 _ . FS (k ) − y.21( obj ) (k )](0.1) + ∑ [ y .22 _ FS (k ) − y .22obj (k )](0.1) + t t t K =1 K =1 + ∑ [ y .24 _ .FS (k ) − y .24obj (k )](0.1) + ∑ [ y .25 _ . FS (k ) − y .25obj (k )](0.1) + ∑ [ y 27 _ FS (k ) − y .27 obj (k )](0.1) + K =1 t t K =1 K =1 + ∑ [ y.28 _ FS (k ) − y.28obj (k )](0.1) + ∑ [ y.3 _ FS (k ) − y.3obj (k )](0.1) EQ 5.36 Na composição de J3, devem ser incluídas as parcelas relativas às restrições dos parâmetros das funções de pertinência. Considerando as denominações dos parâmetros das funções de pertinência, tem-se como valor de projeto inicial (X0): [ X 0 = a1 d1 e2 a2 d2 e3 a3 C1 _ BAIXO C1 _ ALTO C 2 _ BAIXO C 2 _ ALTO C 3 _ BAIXO C 3 _ ALTO ] T EQ 5.37 Serão consideradas as seguintes restrições: 0.2 ≤ X 0 (i ) ≤ 0.3 , i = 1,2,3,4,5,6,7 EQ 5.38 a1 ≤ d 1 EQ 5.39 e2 ≤ a 2 ≤ d 2 EQ 5.40 e3 ≤ a 3 EQ 5.41 O método de otimização adotado neste trabalho é o método de Powell, já citado na seção 3.3. e o custo definido é pela EQ. 5.36, obedecendo as restrições das EQ 5.38 a 5.41. Com os valores escolhidos inicialmente, o valor do projeto inicial X0 é Xq = [0.2 0.25 0.2 0.25 0.3 0.25 0.3 0 114 1 0 1 0 1]T EQ 5.42 Adotando p = 0.01 como passo da busca unidimensional, o custo J3 inicial de 11.5195 alcança um valor igual a 4.4818 após 26 iterações e se chega o seguinte resultado para o valor de projeto Xq = [0.2 0.25 0.2 0.2371 0.2951 0.25 0.3167 0.0455 1 0 0.8585 0.0508 1]T EQ 5.40 A FIG 5.24 mostra a evolução do custo após os 26 ciclos. 12 11 10 Custo 9 8 7 6 5 4 0 5 10 15 20 25 Ciclos FIG. 5.24. Evolução do custo J3 Com os valores dos parâmetros otimizados obtém-se as novas configurações para as funções de pertinência para a variável de entrada e para as variáveis de saída g1, g2 e g3, conforme se vê nas FIG. 5.25 , 5.26, 5.27 e 5.28, respectivamente. 1.2 Grau de pertinência 1 BAIXO MÉDIO ALTO 0.8 0.6 0.4 0.2 0 0.18 0.2 0.22 0.24 0.26 Número de Mach 0.28 0.3 0.32 FIG. 5.25. Funções de pertinência da variável lingüística NrMach Linha contínua: c/parâmetros otimizados; tracejado: c/valores iniciais 115 1.2 Grau de pertinência 1 BAIXO ALTO 0.8 0.6 0.4 0.2 0 -0.2 0 0.2 0.4 0.6 0.8 1 1.2 1.4 Ganho g1 FIG. 5.26. Funções de pertinência da variável de saída g1 Linha contínua: c/parâmetros otimizados; tracejado: c/valores iniciais 1.2 Grau de pertinência 1 BAIXO ALTO 0.8 0.6 0.4 0.2 0 -0.2 0 0.2 0.4 0.6 0.8 1 1.2 Ganho g2 FIG. 5.27. Funções de pertinência da variável de saída g2 Linha contínua: c/ parâmetros otimizados; tracejado: c/ valores iniciais 1.2 BAIXO ALTO Grau de pertinência 1 0.8 0.6 0.4 0.2 0 -0.2 0 0.2 0.4 0.6 0.8 1 1.2 Ganho g3 FIG. 5.28. Funções de pertinência da variável de saída g3 Linha contínua: c/parâmetros otimizados; tracejado: c/valores iniciais 116 Os valores otimizados geram novas curvas dos ganhos g1, g2 e g3,como mostra a FIG. 5.29. Ganho g 1 1 0.5 0 0.18 0.2 0.22 0.24 0.26 0.28 0.3 0.32 0.2 0.22 0.24 0.26 0.28 0.3 0.32 0.2 0.22 0.28 0.3 0.32 Ganho g 2 1 0.5 0 0.18 Ganho g 3 1 0.5 0 0.18 0.24 0.26 Número de Mach FIG. 5.29. Ganhos dos subcontroladores em função do Nr Mach Linha tracejada: valores iniciais: contínua: valores otimizados. Fazendo a variação do ponto de operação e calculando para cada ponto o custo J2, tanto para as curvas objetivos como para as curva de resposta do sistema compensado com o controlador obtido por interpolação difusa com parâmetros otimizados ( KFso ), obtém-se o gráfico da FIG. 5.30. 20 18 16 14 Custo J1 12 10 8 6 4 J1_Fso 2 J1_(obj) 0 0.2 0.21 0.22 0.23 0.24 0.25 0.26 Número de Mach 0.27 0.28 0.29 0.3 FIG. 5.30. Custos J1_FSo e J1_(obj) para variação do ponto de operação 117 Pelos valores constantes da TAB. 5.2, observa-se que, para a maioria dos pontos de operação, a diferença entre os custos J1 das curvas objetivos e das curvas de resposta do sistema com interpolador otimizado diminuiu em relação ao custos dos sistemas com valores inicialmente escolhidos para cada ponto de operação. TAB. 5.2 Diferenças de custos Ponto de operação (M0) J1(FS_i) – J1(obj) J1(FS_o) – J1(obj) 0.2 0.0000 0.0000 0.21 2.8218 -0.3866 0.22 2.8097 -0.2027 0.23 2.0090 0.1872 0.24 1.1703 0.2936 0.25 0.0000 0.2562 0.26 0.2363 0.2159 0.27 0.3389 0.1836 0.28 0.3251 0.1637 0.29 0.2134 0.1060 0.3 0.0000 0.0000 Pela TAB. 5.2, verifica-se que para o ponto de operação em M0 = 0.25, houve um aumento do custo J1. Fazendo o gráfico das respostas temporais dos sistemas em MF com interpolador inicial e com interpolador com parâmetros otimizados(FIG. 5.30), verifica-se uma pequena degradação de desempenho em relação ao tempo de subida, se considerarmos que o sistema otimizado atingiu 95% da amplitude da entrada de referência em 19.8 s ao invés dos 18.7 s do sistema com parâmetros inicialmente escolhidos. 1.2 Número de Mach 1 0.8 0.6 0.4 y.25_FSo 0.2 y.25_obj 0 0 5 10 15 20 25 30 35 40 Tempo ( seg) FIG. 5.31. Resposta temporal para número de Mach (M0 = 0.25) 118 A FIG. 5.32 mostra melhora de desempenho da curva de resposta do sistema com interpolador otimizado em relação ao sistema com interpolador inicial, em M0 = 0.21. 1.2 1 Número de Mach 0.8 0.6 0.4 y.21_Fsi 0.2 y.21_Fso 0 -0.2 0 10 20 30 40 50 60 Tempo ( seg) 70 80 90 100 FIG. 5.32. Resposta temporal para número de Mach (M0 = 0.21) O sistema compensado em MF com o uso de tabelamento de ganhos com interpolação via lógica fuzzy, com ajuste dos parâmetros das funções de pertinência através de otimização, forneceu curvas de respostas ao degrau para número de Mach com um melhor desempenho em relação ao sistema com os valores iniciais dos parâmetros, conforme se constatou pelas figuras e tabelas mostradas. No entanto, é necessário verificar se as respostas de outras variáveis de saída que não foram levadas em conta para o cômputo da função custo de minimização (M, φ e β) também possuem um índice de desempenho favorável. As FIG. 5.33, 5.34 e 5.35, mostram as curvas dos custos J1(obj), J1(FS_i) e J1(FS_o) para γ, β e φ, com a variação do ponto de operação. Verifica-se que houve um nítido aumento da diferença entre o custo do sistema otimizado em relação ao custo do sistema não otimizado para o ângulo de trajetória. Não ocorrendo este aumento de custo para as variáveis β e φ. Estes resultados estão dentro do esperado, tendo em vista que, para se conseguir uma diminuição de custo global , as resposta destas variáveis devem ser levadas em conta para o cálculo do custo J2. 119 7 6 Custo J1 5 4 3 J1_(obj) 2 J1_FSi 1 0 0.2 J1_FSo 0.21 0.22 0.23 0.24 0.25 0.26 0.27 0.28 0.29 0.3 Número de Mach FIG. 5.33. Curvas de J1 para as respostas ao degrau para ângulo de trajetória 8 7 Custo J1 6 5 4 3 J1_(obj) 2 J1_FSi 1 J1_FSo 0 0.2 0.21 0.22 0.23 0.24 0.25 0.26 0.27 0.28 0.29 0.3 Número de Mach FIG. 5.34. Curvas de J1 para as respostas ao degrau para ângulo de deslizamento 3 2.5 Custo J1 2 1.5 J1_(obj) 1 J1_FSi 0.5 J1_FSo 0 0.2 0.21 0.22 0.23 0.24 0.25 0.26 0.27 0.28 0.29 0.3 Número de Mach FIG. 5.35. Curvas de J2 para as respostas ao degrau para ângulo de rolagem 120 Para ter um desempenho favorável em todas as saídas do sistema compensado é necessário modificar a função custo, incluindo as demais variáveis neste cálculo. Deste modo, far-se-ía a minimização deste custo e alcançar-se-ía curvas de respostas do sistema em MF próximas das curvas objetivos para cada variável de saída. Para verificar a validade da interpolação, é necessário realizar simulações com o modelo não linear em que se varia a velocidade. Esta variação não deve ser abrupta, pois gera mudanças bruscas nos ganhos dos controladores, ocasionando perda de desempenho do sistema e até mesmo a instabilidade. Por isto, será incluído um pré-filtro na entrada de referência Mref, para fornecer um comando suave. Tendo em vista evitar a saturação dos atuadores, serão dados comandos escalonados para que o número de Mach passe de uma condição inicial Mach 0.2 para 0 Mach.29. As FIG. 5.36, 5.37 e 5.38 mostram os resultados desta simulação em termos de número de Mach, sinais dos atuadores e curva de ganhos dos sub-controladores, respectivamente. 0.3 Número de Mach 0.28 0.26 0.24 0.22 Machcomandado Machresposta 0.2 0 100 200 300 400 500 Tempo ( seg) 600 700 FIG. 5.36. Resposta a degraus escalonados pré-filtrados 121 800 Fração do empuxo máximo Deflexão do profundor (graus) 0.9 0.8 0.7 0.6 0.5 0 100 200 300 0 100 200 300 400 500 600 700 800 400 500 Tempo ( seg) 600 700 800 -9 -10 -11 -12 -13 FIG. 5.37. Sinais dos atuadores no modo longitudinal 1.2 1 Ganhos g1, g2, g3 0.8 g1 0.6 g2 0.4 g3 0.2 0 -0.2 0 100 200 300 Tempo ( seg) 400 500 FIG. 5.38. Curvas de ganhos dos sub-controladores 122 600 5.4 CONTROLE DE TRAJETÓRIA E LEI DE GUIAGEM Nesta seção, são abordadas a malha de guiagem e a malha responsável pela navegação da aeronave não tripulada, dentro do enfoque de arquitetura hierárquica de controle, de maneira simplificada. Como já foi dito na seção 2.2, a malha de guiagem é responsável por fazer com que a aeronave siga determinados comandos em altitudes e rumos, que por sua vez são fornecidos pelo módulo de geração de trajetória autônoma. A estrutura de controle é executada com a utilização de controladores PID, conforme se vê na FIG. 5.39. Gerador de trajetória G u i H + a R g e m ΨD + - M MR PID γ βR PID γ R ΦR + - K(s) 1/s Planta β Φ Ψ X A Y A Z A FIG. 5.39. Diagrama de blocos incluindo sistema de guiagem. 123 5.4.1. CONTROLE DE ALTITUDE Esta dissertação restringiu-se ao modo de manutenção de altitude, pois para atingir alturas maiores ou menores em relação à altitude inicial é necessário considerar pontos de operação em ângulos de trajetórias diferentes de zero, como por exemplo, γ0 = ± 1°, ± 2°, ± 3°, e em seguida, utilizando tabelamento de ganhos de modo semelhante ao realizado para o número de Mach, realizar a subida ou descida até a altitude desejada. Neste trabalho, como já citado, serão utilizados somente modelos linearizados com ângulo de trajetória igual a zero para pequenas variações do número de Mach de equilíbrio. Por isso, a faixa de variação de altura considerada neste trabalho está entre ± 10 metros e o ângulo de trajetória será limitado em ± 0.5°. Será utilizado um controlador do tipo proporcional-integral-derivativo (PID) para seguir comandos de referência em altura. Este comando de referência é comparado com a altitude atual da aeronave e o sinal de erro é convertido em comandos de ângulo de trajetória. O ajuste dos ganhos do controlador PID será feito para o modelo não linear com o interpolador de ganhos fuzzy. Além disso, serão utilizados saturadores para os sinais dos atuadores no diagrama de blocos que representa o modelo não linear no ambiente SIMULINK.Tendo em vista esta simulação ser não linear, este ajuste será feito com auxílio de um método de otimização de ordem zero, o método de Powell, já utilizado para o ajuste do interpolador fuzzy. A função custo a ser minimizada é expressa por N +1 J 4 = ∑ | ha (k ) − hr ( k ) | ∆t , N = 1000 e ∆t = 0.1 EQ 5.41 K =1 onde ha é altitude atual da aeronave hr é altitude de referência t = [ 0 0.1 0.2 ... 100] Denominando a variável de projeto como X 0 = [K P KI K D ]T EQ 5.42 onde KP é o ganho proporcional KI é o ganho integral KD é o ganho proporcional. 124 O ganho proporcional terá um valor inicial igual a 0.025, o ganho derivativo um valor inicial de 0.3 e o ganho integral um valor inicial nulo . A restrição a ser imposta é o limite de ± 0.5° para ângulos de trajetória. Utilizando-se um passo de busca unidimensional p igual a 0.001 para as 24 iterações, obtém-se um valor de projeto igual a Xq = [0.0496 0 0.3611]T EQ 5.43 A FIG. 5.40 mostra a evolução do custo J4: 480 460 Custo J4 440 420 400 380 360 340 320 300 0 4 8 12 Ciclos 16 20 24 FIG. 5.40. Evolução do custo J4. A FIG. 5.41 mostra as curvas de resposta ao comando de altitude e as respectivas variações no ângulo de trajetória comandado. Altitude ( m ) 775 770 765 Ângulo de trajetória 760 0 10 20 30 40 50 Tempo ( 60 70 80 90 100 0.6 0.4 s/otimização 0.2 c/otimização 0 -0.2 0 10 20 30 40 50 Tempo ( seg ) 60 70 80 90 100 FIG.5.41. Resposta para comando de altitude e variação do ângulo de trajetória. 125 A FIG. 5.42 mostra a variação de número de Mach necessária para a subida e as conseqüentes variações de ganhos dos sub-controladores. Número de Mach 0.22 0.215 0.21 0.205 0.2 Ganhos g1, g2, g3 0.195 0 50 100 150 Tempo ( seg) 200 250 1 g1 g2 0.5 g3 0 0 50 100 150 Tempo ( seg) 200 250 FIG.5.42. Variação do número de Mach e dos ganhos dos sub-controladores. A FIG. 5.43 mostra a variação dos sinais de controle, onde se nota a ação do bloco de Deflexão do profundor (graus) Fração do empuxo máximo saturação no canal da fração do empuxo máximo. 1 0.5 0 0 50 100 150 200 250 50 100 150 Tempo ( seg) 200 250 -8 -10 -12 -14 0 FIG.5.43. Sinais dos atuadores no modo longitudinal. 126 5.4.2. COMANDO DE ÂNGULO DE GUINADA A configuração utilizada é própria para manutenção de determinado ângulo de guinada ou para pequenas alterações de rumo. Para comandar ângulos de guinada maiores é necessário linearizar o modelo matemático da aeronave em trajetórias circulares com velocidade angular de guinada constante e controlar o sistema através de técnicas de tabelamento de ganhos a semelhança do que foi feito para variações de número de Mach. Antes disso, no entanto, é necessário todo um trabalho de modelagem a fim se alcançar a configuração adequada para aeronave em órbita circular coordenada em altitude constante, em termos de curvas de coeficientes aerodinâmicos . De forma análoga ao controle de altitude, o ajuste ótimo dos ganhos do controlador tipo PID para ângulo de guinada também será feito por otimização. A simulação será como o modelo não linear e a estrutura será a mesma do controle de altitude,ou seja, será feita com o interpolador fuzzy, saturadores, com a diferença que o PID para o controle de altura será também adicionado com seus valores já ajustados. A função custo a ser minimizada é expressa por N +1 J 5 = ∑ | ψ a ( k ) − ψ r ( k ) | ∆t , N = 6000 e ∆t = 0.1 EQ 5.41 K =1 onde ψa é ângulo de guinada (rumo) atual da aeronave ψr é rumo de referência t = [ 0 0.1 0.2 ... 600] Serão estimado os seguintes valores iniciais para os ganho do controlador PID para o modo lateral: Kp2 = 01; Ki2 = 0.1; Kd2 = 0. Deste modo, com um passo de 0.01, após 6 iterações ,obtém-se um valor de projeto Xq = [2.9746 0.1402 0] 127 A evolução do custo após as 6 iterações é mostrada na FIG. 5.44. 180 170 Custo J5 160 150 140 130 120 110 0 1 2 3 4 5 6 Ciclos FIG.5.44. Evolução do custo para o modo lateral. A curva de resposta para um comando de referência de ângulo de guinada é visto na FIG. 5.45, com a respectiva curva do ângulo de rolagem comandado. 8 ψ ( graus ) 6 4 2 0 0 50 100 150 200 250 300 350 400 450 500 350 400 450 500 Tempo ( seg ) 20 15 φ (graus) 10 5 0 -5 0 50 100 150 200 250 300 Tempo ( seg ) FIG.5.45. Curvas de resposta para comando de rumo. (Linha contínua : c/otimização ; tracejado : s/otimização) 128 A FIG. 5.46 mostra a curva dos sinais de controle do modo lateral. Deflexão do leme 5 0 -5 Deflexão do aileron (graus) -10 0 100 200 300 400 500 600 100 200 300 Tempo ( seg) 400 500 600 5 0 -5 -10 0 FIG.5.46. Deflexões do aileron e do leme 129 5.4.3. GERAÇÃO DE TRAJETÓRIA Considerando que se deseja cumprir uma determinada missão utilizando-se uma aeronave não tripulada, há necessidade de pré-definir a trajetória a ser seguida pelo veículo. Nesta seção, para gerar comandos de altitude e rumo desejados será utilizado o método ponto a ponto (PP), que controla o veículo para seguir um ponto objetivo intermediário. É um dos métodos mais simples para gerar trajetórias, mas servirá aos propósitos desta dissertação. Supondo que a aeronave esteja localizada em um certo instante em um ponto definido pelas coordenadas (XA,YA) e deseja-se que siga uma determinada trajetória passando pelos pontos (X0,Y0) e (X1,Y1), conforme se vê na FIG. 5.47. Para determinar o ângulo de guinada a ser seguido é calculado a cada instante o rumo desejado e é comparado com o rumo da aeronave. O erro de ângulo de guinada é transformado em comando de ângulo de rolagem através do controlador PID. Quando a distância entre a aeronave e o way-point atinge um valor suficientemente próximo, automaticamente um novo way-point (X1,Y1) é selecionado e assim sucessivamente até que todos os way-points sejam percorridos. (Xo,Yo) (X1,Y1) ΨD (Xa,Ya) ΨA FIG. 5.47. Esquema da lei de guiagem O ângulo de guinada ψD é calculado pela seguinte expressão ψ D = arctan Y0 - YA X0 - XA onde ψD é o rumo desejado XA , YA são as coordenadas da aeronave X0 , Y0 são as coordenadas do primeiro ‘way-point` X1 , Y1 são as coordenadas do próximo ‘way-point` 130 EQ 5.44 Na simulação realizada, definiu-se 05 (cinco) way-ponts que a aeronave deve percorrer a fim de cumprir uma missão de reconhecimento. Devido à baixa manobrabilidade lateral demonstrada pela configuração original da aeronave, conforme se pôde observar pela FIG. 5.45, houve a necessidade de ajustar os valores dos elementos das matrizes de espaço estado correspondentes aos coeficientes aerodinâmicos laterais. Deste modo, cumpriu-se a trajetória pretendida, conforme se vê na Figura 5.48. 4 x 10 4 Coordenada y (m) 3 2 1 0 -1 0 1 2 3 4 5 Coordenada x (m) FIG. 5.48. ‘Way-points’ e trajetória da aeronave 131 6 7 4 x 10 Na FIG. 5.49, observam-se as variações nos estados correspondentes ao modo lateral. Observa-se que, quando se usa o método ponto a ponto para gerar a trajetória, as mudanças nos estados ocorrem de maneira brusca na passagem de um way-point a outro. φ (graus) 20 0 -20 β (graus) 0 100 500 Tempo(seg)0 0 -20 0 6 4 2 15 10 5 0 -2 0 -5 -4 -6 0 Roll rate ψ (graus) 20 500 100 Tempo(seg) -10 -15 0 100 500 Tempo(seg)0 500 100 Tempo(seg) FIG. 5.49. Variações nos estados do modo lateral para mudança de direção Como há restrições severas de manobrabilidade do modelo não linear, tendo em vista estar sendo usado em uma configuração diferente para o qual foi modelado, as mudanças de direção no plano horizontal são pequenas. Além disso, para mudanças maiores de rumo é necessário modelar para um ponto de operação em que a aeronave realiza trajetórias circulares com velocidade angular de guinada constante. Além disso, para ângulos maiores que 90°, há problemas relativas às singularidades dos ângulos de Euler. 132 6 CONCLUSÕES Esta dissertação apresentou um estudo da aplicação de controladores robustos tabelados via lógica difusa para controle e guiagem de Veículos Aéreos Não Tripulados (VANT) dentro de um enfoque de arquitetura hierárquica de gerenciamento autônomo de vôo. Para a malha de controle de atitude foram determinados controladores robustos, com base na técnica LQG/LTR, para vários pontos de operação. A técnica de tabelamento de ganhos com interpolação via lógica fuzzy foi utilizada para as mudanças destes pontos de operação. Foi utilizado um método de otimização de ordem zero para ajuste dos parâmetros das funções de pertinência do interpolador de ganhos, fazendo com que o desempenho do sistema em malha fechada resulte adequado em toda a região de transição. Na malha de guiagem, foram utilizados controladores PID para seguir comandos de ângulos de trajetória e ângulos de rolagem, a fim de se atingir alturas e rumos fornecidos pelo gerador de trajetória. Tendo em vista o trabalho realizado nesta dissertação, chegou-se às seguintes conclusões: • O modelo matemático da aeronave na configuração de aproximação para o pouso utilizado mostrou-se, como já esperado, pouco adequado para a aplicação realizada. Fato este verificado pelo baixo desempenho, principalmente nos tempos de respostas a entradas de referências tanto no modo longitudinal como no modo lateral. No entanto, foi possível demonstrar a validade da técnica de tabelamento de ganhos empregada, bem como a adequabilidade da estrutura hierárquica de controle utilizada. Resultados mais expressivos serão alcançados com um modelo de aeronave para todas as configurações de vôo. • A linearização do modelo matemático da aeronave forneceu adequada aproximação para pequenas perturbações. Para perturbações maiores em relação ao estado de equilíbrio, o sistema compensado em malha fechada respondeu razoavelmente ao se realizar as simulações tanto no modo linear como no modo não linear. • O tabelamento de ganhos com interpolação difusa, utilizado para mudanças de ponto de operação provocados pela variação do número de Mach, forneceu bons resultados. No entanto, verifica-se a necessidade de aplicação de tabelamento de ganhos quando se deseja comandar diferenças de altitudes maiores, pois o sistema exige variações maiores de ângulo de trajetória. Os resultados obtidos ao se analisar as variações de número de Mach possibilitam proceder de maneira análoga para variações de ângulo de trajetória. O mesmo 133 raciocínio se faz quando se deseja realizar grandes mudanças de rumo. Neste caso, devese fazer a linearização do modelo matemático da aeronave em pontos de operação nos quais a aeronave está realizando órbita circular coordenada em altitude constante. • A utilização de sistema de inferência fuzzy para interpolação de ganhos mostrou-se adequada na região de transição entre os pontos de operação propostos, à medida que oferece um modo baseado na experiência do projetista para ajuste inicial dos ganhos dos sub-controladores calculados, além de gerar menor esforço computacional. Por intermédio do método de otimização de Powell, foi possível ajustar, de maneira adequada, os parâmetros das funções de pertinência das variáveis do interpolador fuzzy, e, assim, obter uma melhoria no desempenho do sistema em malha fechada no envelope de operação em que foi proposto. • O controle de altitude se resumiu ao modo de manutenção de altitude, tendo em vista a restrição do modelo linearizado ser válido para pequenas perturbações. Para se realizar subidas ou descidas com diferenças de altura maiores, é necessário fazer linearizações em diversos pontos de operação para ângulos de trajetória diferentes de zero. A partir daí, é possível realizar o mesmo procedimento que foi utilizado para variações de número de Mach. • O controle de rumo com base em modelos linearizados em pontos de operação em que a aeronave realiza um vôo reto e nivelado não é adequado quando se deseja realizar mudanças de direção. Nesta dissertação, para que fosse possível realizar pequenas mudanças de direção ao percorrer uma trajetória determinada pelo método ponto a ponto, foi necessário fazer ajustes no modelo linearizado com base em tentativas. Apesar de servir aos propósitos desta dissertação, o procedimento mais adequado, no caso de maior disponibilidade de tempo, seria fazer todo um trabalho de modelagem a fim de ajustar os coeficientes aerodinâmicos do modo lateral com base em valores típicos de aeronaves similares, na falta de um modelo completo. • No transcorrer do percurso definido pelos way-points, ocorreram grandes variações nos estados ao passar de um way-point a ser seguido para outro, como era de se esperar ao se utilizar o método ponto a ponto. Este fato também é um fator limitante da escolha dos pontos pré-determinados, pois pode ocorrer, se um determinado ponto for escolhido de modo que seja comandado um ângulo de rumo maior que o possível para o modelo linearizado, este ponto não será alcançado. A solução a ser adotada é utilizar o método de trajetória contínua, que pode ser gerada segundo um critério ótimo. 134 Como perspectivas para próximos trabalhos na área de controle de aeronaves autônomas sugere-se o seguinte: - Obter modelos matemáticos de aeronaves não tripuladas a fim de se verificar as particularidades com relação a aeronaves maiores; - Fazer a modelagem do caça F-16, cujos dados completos e tabelas de coeficientes aerodinâmicos estão constantes em NGUYEN ET AL(1993), trabalho este disponível no Grupo de Controle - DE/3. Com os dados e tabelas constantes nesse trabalho, é possível modelar a aeronave nas diversas configurações de interesse(aterrissagem, descida, subida, vôo de cruzeiro, giro coordenado, etc) e aplicar a técnica de controle adequada a cada ponto de operação. - Aplicar uma lei de controle com tabelamento de ganhos considerando diversas variáveis, como por exemplo, velocidade, ângulo de trajetória, massa, densidade atmosférica, etc, a fim de abranger todo o envelope de operação da aeronave; - Incluir quaternions como variáveis de estado, ao invés dos ângulos de Euler, evitando assim as singularidades e possibilitando a simulação de trajetória para ângulos maiores de 90 graus; - Empregar algoritmo genético para otimizar os parâmetros dos controladores PID, tendo em vista evitar mínimos locais; - Utilizar outras técnicas de controle robusto que melhor tratem as variações de parâmetros; - Fazer o planejamento de trajetória utilizando carta digital. Esta trajetória pode ser gerada de maneira ótima, adotando como critérios, como, por exemplo, consumo de combustível mínimo, tempo mínimo, risco mínimo, etc. Para percorrer percurso ótimo gerado, utilizar o método de trajetória contínua, que propiciará variações suaves nos estados da planta; - Integrar o controle da aeronave a um sistema de navegação inercial. 135 7. REFERÊNCIAS BIBLIOGRÁFICAS ATHANS, M. A tutorial on the LQG/LTR method. Proc. ACC, Seattle, WA, June 1986. ATHANS, M. Multivariable Control Systems: Lecture Notes. MIT, 1984. BLAKELOCK, John H., Automatic Control Of Aircraft and Missiles. John Wiley & Sons, New York, 1991. CHANDLER, P.R.; PACHTER, M. Research issues in autonomous control of tactical UAVs American Control Conference, 1998. Proceedings of the 1998 , vol.1 , pp. 394 –398 1998. CORBAN, J. E.; CALISE, A. J.; PRASAD, J. V. R. Implementation of adaptive nonlinear control for flight test on an umanned helicopter. Proc. 37th IEEE Conf. On Decision and Control, pp. 3641-3646,December 1998. CRUZ, J. J. Controle Robusto Multivariável: O Método LQG/LTR. Editora da Universidade de São Paulo,1996. DORATO, P.; YEDAVALLI, R.K. Recent Advances in Robust Control. IEEE Press, 1990 DOYLE, J. C.; STEIN, G, Multivariable Feedback Design : concepts for a classical/modern synthesis. IEEE Trans. Automatic Control, vol. AC-26, pp 4-16, Feb 1979 ETKIN, Bernard. Dynamics of Flight Stability and Control. John Wiley&Sons, New York, 1972. FOLEY, B. T. Design and evaluation of a LQR controller for the BlueBird Unmanned Air Vehicle. Thesis ( M.S in Aeronautical engineering) Naval Postgraduate School, Monterrey, California, Sept. 1994 FONTENROSE, P. L; HALL, C.E Development and flight testing of quantitative feedback theory pitch rate stability augmentation system Journal of Guidance Control and Dynamics, vol. 19: (5), pp. 1109-1115, SEP-OCT 1996 FOX, Richard L. Optimization Methods for Engineering Design. Addison-Wesley, Califónia, 1971. HALLBERG, E.; KAMINER, I.; PASCOAL, A., Development of the rapid flight test prototyping system for unmanned air vehicles . American Control Conference, 1998. Proceedings of the 1998 , Volume: 2, pp. 699 -703, 1998. HARRIS, C.J.; CHARNLEY, D. Intelligent autonomous vehicles: recent progress and central research issues Computing & Control Engineering Journal , vol. 3, no. 4 , pp. 164 –171, July 1992. 136 HOWARD, R. M.; BRAY, R. M.; LYONS, D. F.; Flying-qualities analysis of an unmanned air vehicle . Journal Of Aircraft , vol. 33: (2), pp. 331-336 MAR-APR 1996. HOWARD, R. M.; TANNER, J. C.; LYONS, D. F. Flight test of a half-scale unmanned air vehicle . Journal Of Aircraft , vol. 28: (12), pp. 843-848 DEC 1991. HWANG, Y. K.; NARENDRA, A. Gross motion planning – a survey. ACM Computing Surveys, vol. 24, no. 3, pp. 219-291, 1992. JONES, C. A., Unmanned Aerial Vehicles (UAVs) – An Assesment of Historical Operations and Future Possibil.ities. Air Command and Staff College, 1997. JIANG, T. Y.; PRASAD, J. V. R.; CALISE, A. J. Adaptative fuzzy logic flight controllers for rotorcraft. Proc. AIAAA Guidance Navigation and Control conf. , pp. 1-8, July 1996. KADMIRY, B.; BERGSTEN, P.; DRIANKOV, D. Autonomous helicopter control using fuzzy gain scheduling. Robotics and Automation, 2001. Proceedings 2001 ICRA. IEEE International Conference on , vol. 3 , pp. 2980 –2985, 2001. KAMINER, I; PASCOAL, A; HALLBERG, E; SILVESTRE, C. Trajectory tracking for autonomous vehicles: An integrated approach to guidance and control Journal Of Guidance Control And Dynamics, vol. 21: (1), pp. 29-38, JAN-FEB 1998. KAZEROONI, H.; HOUPT, P. K. On Loop Transfer Recovery , International Journal of Control, vol 43, pp. 981-996, Mar. 1986. KHATIB, O. Real-time obstacle avoidance for manipulators and mobile robots. International Journal of Robotics Research, vol. 5, no. 1, pp. 90-98, 1986. KOROBA, Z The model of the control of aerial robot with autonomous system of ground object seeking and tracking ,Robot Motion and Control, 1999. Proceedings of the First Workshop on, pp. 41 –44, 1999. KUECHENMEISTER, D. R. A non linear simulation for an autonomous unmanned air vehicle. Thesis ( M.S in Aeronautical engineering) Naval Postgraduate School, Monterrey, California, Sept. 1993. LAI, G.; FREGENE, K.; WANG, D. A control structure for autonomous model helicopter navigation Electrical and Computer Engineering, 2000 Canadian Conference on , Vol. 1 , pp. 103 -107 ,2000. LING, C.; EDGAR , T.F. A new fuzzy gain scheduling algorithm for process control. In: Proc. American Control Conf., Chicago, IL Vol. 3, pp. 2284-2290, 1992 LATOMBE, J. C. Robot motion planning. Kluver Academic Publishers, Boston, 1991. LIN, C. Modern Navigation, Guidance, and Control Processing, Prentice-Hall, Englewood Cliffs , NJ,1991. 137 LOURTIE, P.; AZINHEIRA, J.R.; RENTE, J.P. Analysis and simulation of the longitudinal control of an unmanned aerial vehicle. Control and Guidance of Remotely Operated Vehicles, IEE Colloquium on, pp. 8/1 -8/4, 1995. MEYROWITZ, A. L.; BLIDBERG D. R.; MICHELSON R. C. Autonomous Vehicles. Proc. IEEE, Vol. 84, No. 8, pp 1147-1164, 1996. MOORE, J. B.; TAY, T. T., Loop Recovery via H2/H-infinito sensitivity recovery, International Journal of Control, vol 49, pp. 1249-1271, Mar. 1989. MOYER A. S.; TALBOT, M.D. Wind-Tunnel Test Techniques For Unmanned Aerial Vehicle Separation Investigations , Journal Of Aircraft, vol.31: (3) 585-590 MAY-JUN 1994. NELSON, R.C. Flight stability and automatic control McGraw-Hill Interrnational EditionsAerospace, 1989. PRASAD, J. V. R.; CALISE, A. J.; PEI, Y.; CORBAN, J. E. Adaptive Nonlinear Controller Synthesis And Flight Test Evaluation On An Unmanned Helicopter, Control Applications, 1999. Proceedings of the 1999 IEEE International Conference on, vol. 1, pp. 137 –142, 1999. ROSENBROCK, H. H. The Stability of Linear Time-Dependent Control Systems. International J. Eletronic and Control, 15:30-80,1963. ROSKAM, J. Airplane Flight Dymnamics and Automatic Flight Controls. Lawrence, Kans.: Roskam Aviation and Engineering Corp., 1979. RUFF, H.A.; RAO EDALA, N.; GEIST, J.; KUMAR, P.K.; NARAYANAN, S.; DRAPER, M.; HAAS, M.W., An architecture for modeling uninhabited aerial vehicles, Systems, Man, and Cybernetics, 1999. IEEE SMC '99 Conference Proceedings. 1999 IEEE International Conference on , Vol. 1 , pp. 744 –749, 1999. SANDI, F. A.; HEMERLY, E. M.; LAGES, W. F. Sistema para navegação e guiagem de robôs móveis autônomos SBA Controle & Automação, vol. 9, no. 3 /Set.,Out.,Nov.,Dez, 1998. SKOOG, R. A.; LAU, C. G. Y. Instability of Slowly Varying Systems. IEEE Trans. Aut. Control, 17:86-92, 1972. STEIN, G.; ATHANS, M. The LQG/LTR Procedure for Multivariable Feedback Control Design. IEEE Transactions on Automatic Control, vol. AC-32, n.2, pp. 105-114, Fev 1987. SUGENO, M.; HIRANO, I.; NAKAMURA,S.; KOTSU, S. Development of na intelligent unmanned helicopter. IEEE International Conf. Fuzzy Systems, pp. 33-34, 1995. VIAN, J.L.; FU, S.J.; GROSE, D.L.; SAWAN, M.E. Intelligent flight management in threat environments Aerospace and Electronics Conference, 1988. NAECON 1988., Proceedings of the IEEE 1988 National , vol.1, pp. 224 –228, 1988. 138 VIDYASAGAR, M. Nonlinear System Analysis, Englewood Cliffs, N. J.: Prentice Hall, 1978. WHITE, J.E.; PHELAN, J. R. Stability Augmentation And Control Decoupling For The Airborne Remotely Operated Device JOURNAL OF GUIDANCE CONTROL AND DYNAMICS : Vol.: 14, Fasc./Issue: : (1) pp. 176-183, JAN-FEB 1991. ZHAO, Z. Y.; TOMIZUKA, M.; ISAKA, S. (1993). Fuzzy gain scheduling of PID controllers. IEEE Trans. Sust., Man, Cybernetics, SMC-23, 1392-1398. 139