Ficheiro PDF - Departamento de Engenharia Mecânica
Transcrição
Ficheiro PDF - Departamento de Engenharia Mecânica
UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR TÉCNICO Arquitecturas para Navegação Inercial/GPS com Aplicação a Veículos Autónomos Bruno Miguel Simões Carvalho Cardeira (Licenciado) Dissertação para a obtenção do Grau de Mestre em Engenharia Electrotécnica e de Computadores Orientador: Co-Orientador: Júri: Presidente: Vogais: Doutor Carlos Jorge Ferreira Silvestre Doutor Paulo Jorge Coelho Ramalho Oliveira Doutor Doutor Doutor Doutor Fernando Duarte Nunes Jorge Manuel Miranda Dias Carlos Jorge Ferreira Silvestre Paulo Jorge Coelho Ramalho Oliveira Fevereiro de 2009 Agradecimentos O presente relatório sumariza um trabalho que se estendeu ao longo de cerca de dois anos, tendo nesse período, contado com a ajuda e amizade de diversas pessoas às quais gostaria de agradecer. As primeiras palavras dirigem-se para os Professores Carlos Silvestre e Paulo Oliveira cuja inspiração originou este trabalho, pelas importantes contribuições e pelo apoio e incentivo continuado. Agradeço também aos colegas e amigos do DSOR, Rita Cunha, Manuel Rufino, Luís Sebastião, João Alves, Alex Peñas, André Oliveira, Pedro Gomes, Bruno Guerreiro, Pedro Serra, pela disponibilidade e ajuda prestadas. Uma palavra de agradecimento é também devida ao colega Pedro Baptista pela sua contribuição neste trabalho. Estendo o presente agradecimento a todos os amigos que por proporcionarem bons momentos de descontratação e boa disposição, que são essenciais nos momentos de maior tensão, contribuíram para a concretização deste esforço. Uma palavra especial para o amigo e colega do DSOR José Vasconcelos, cujo apoio e colaboração em alturas mais críticas do trabalho foi bastante importante. Não posso deixar de agradecer aos meus pais e familiares por terem respeitado o meu trabalho, tolerado ausências forçadas em momentos importantes e telefonemas esquecidos, para eles, muito obrigado! i ii Resumo Esta tese aborda o desenvolvimento e integração de um sistema de navegação inercial para a determinação da posição e orientação de um veículo autónomo recorrendo a um receptor de Global Positioning System (GPS) e a conjuntos de acelerómetros, magnetómetros e giroscópios tridimensionais. No presente trabalho, recorre-se a técnicas de filtragem complementar para implementar um sistema de navegação com estimativa de posição parametrizada em coordenadas do referencial da Terra, estimativa de velocidade parametrizada no referencial do Corpo e estimativa de atitude descrita em ângulos de Euler. A filtragem complementar permite abordar explicitamente o problema da fusão de dados com origem nos sensores instalados a bordo da plataforma, cuja informação se encontra em regiões complementares do espectro de frequência. Algumas das características especiais desta metodologia incluem a estimação e compensação de polarizações dos sensores inerciais. Um dispositivo auxiliar para determinação da orientação, designado por Estimador Magneto-Pendular é apresentado e descrito em detalhe. É esboçada a síntese de filtros complementares, multi-ritmo, com propriedades de estabilidade e de desempenho, para a resolução do problema de determinação da posição e da orientação. Os parâmetros dos filtros propostos são desenhados com recurso a critérios de optimalidade, tendo em conta a caracterização dos sensores disponível, que poderá ser estocástica ou no domínio da frequência. É ainda apresentada e discutida de forma breve uma transformação não linear com aplicação à análise de estabilidade e de desempenho dos filtros complementares de posição e atitude. Formulados em tempo discreto, os filtros complementares de atitude e posição, permitem uma implementação prática recorrendo a hardware de processamento digital convencional, preservando a validade das propriedades de estabilidade e desempenho. Descreve-se uma arquitectura de hardware de tempo real para a implementação do sistema navegação e discutem-se questões de integração, tanto de índole electromagnética como de índole mecânica, que surgem da interacção entre os diferentes módulos. Apresentam-se sucintamente os sistemas integrados a bordo bem como a consola de terra desenvolvidos a partir de módulos Commercial-Off-The-Shelf (COTS) e de hardware/software especificamente concebidos para a presente aplicação. Finalmente, o desempenho do sistema de navegação bem como a sua instalação são avaliadas em simulação e testes de campo recorrendo ao catamaran DELFIMx, desenvolvido no pólo de Lisboa do Instituto de Sistemas e Robótica. Palavras-Chave: Sistema de Navegação, Filtragem Complementar, Sistemas de Navegação Inercial, Arquitecturas de Sistemas de Tempo Real, Veículos Autónomos. iii Abstract This thesis addresses the development and integration of a strapdown navigation system to determine the position and attitude of unmanned vehicles, using accelerometers, magnetometers and rate gyros triads aided by Global Positioning System (GPS) measurements. The current work resorts to Complementary Filtering techniques to implement the navigation system developed on Earth frame coordinates for the position estimation, with the velocity estimated in the body frame and with the attitude described using Euler angles. Complementary filters explicitly tackle the problem of merging information provided by the vehicle sensor suite over distinct, yet complementary frequency regions. Special features include bias estimation and removal in inertial sensors. An attitude aiding device, referred to as Magneto-Pendular Sensor, is implemented and the synthesis of the multirate complementary filters is outlined. Stability and performance properties of the proposed filters are derived to solve the position and attitude estimation problem. The proposed filters parameters are synthesized based on optimality results, regarding the available sensor suite characteristics, that can be stochastic or frequency based. It is also presented and briefly discussed a nonlinear transformation that finds application in the stability and performance analysis of the position and attitude complementary filters. Formulated in discrete-time, the position and attitude complementary filters allow for practical implementation without requiring high performance signal processing hardware and maintaining all their stability and performance properties. The hardware architecture for the implementation of the real-time navigation system is presented and the different hardware modules are described. Integration issues, both electromagnetic and mechanical, that arise from the interaction of different systems are also addressed. The on-board systems and ground station design made from Commercial-Off-The-Shelf (COTS) sub-systems and custom developed hardware/software modules are briefly presented. Finally, the overall system performance is evaluated both in simulation and in sea trials using the DELFIMx catamaran developed at the Institute for Systems and Robotics - Lisbon. Keywords: Inertial Navigation Systems, Complementary Filters, Strapdown Systems, Inertial Sensors, Avionic Systems, Autonomous Vehicles. v vi Conteúdo Agradecimentos i Resumo iii Abstract v Conteúdo vii Lista de Figuras xi Lista de Tabelas xv Nomenclatura xvii 1 Introdução 1.1 Veículos Autónomos . . . . . . . . . . . . 1.1.1 Características Gerais . . . . . . . 1.1.2 Estrutura de um Veículo Autónomo 1.1.3 Veículos Marinhos Autónomos . . . 1.1.4 Veículos Aéreos Autónomos . . . . 1.1.5 Veículos Terrestres Autónomos . . 1.1.6 Aplicações . . . . . . . . . . . . . . 1.2 Objectivos . . . . . . . . . . . . . . . . . . 1.3 Contribuições . . . . . . . . . . . . . . . . 1.4 Organização da Tese . . . . . . . . . . . . . . . . . . . . . . 2 Representação da Orientação e Referenciais 2.1 Representação da Orientação . . . . . . . . . 2.1.1 Matriz de Rotação . . . . . . . . . . 2.1.2 Ângulos de Euler . . . . . . . . . . . 2.1.3 Vector de Rotação . . . . . . . . . . 2.1.4 Quaterniões . . . . . . . . . . . . . . 2.2 Definição dos Referenciais . . . . . . . . . . 2.2.1 Referencial Inercial . . . . . . . . . . 2.2.2 Referencial da Terra . . . . . . . . . 2.2.3 Referencial Geográfico . . . . . . . . 2.2.4 Referencial Geocêntrico . . . . . . . . vii . . . . . . . . . . . . . . . . . . . . de . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1 1 2 4 7 9 10 13 14 14 Navegação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 16 16 18 21 21 25 25 25 27 27 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . viii CONTEÚDO 2.3 2.2.5 Referencial do Plano Tangente . . . 2.2.6 Referencial do Corpo . . . . . . . . A Forma da Terra e Modelo da Gravidade 2.3.1 Campo Gravitacional . . . . . . . . 2.3.2 Campo Gravítico . . . . . . . . . . 2.3.3 O Geóide . . . . . . . . . . . . . . 2.3.4 Elipsóide WGS84 . . . . . . . . . . 2.3.5 Modelo Gravítico da Terra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 Fundamentos de Navegação Terrestre 3.1 Introdução . . . . . . . . . . . . . . . . . . . . . 3.2 Navegação Inercial . . . . . . . . . . . . . . . . 3.2.1 Introdução . . . . . . . . . . . . . . . . . 3.2.2 Sensores Inerciais . . . . . . . . . . . . . 3.2.3 Tipos de Plataformas . . . . . . . . . . . 3.3 Navegação por Satélite . . . . . . . . . . . . . . 3.3.1 Introdução . . . . . . . . . . . . . . . . . 3.3.2 Global Positioning System . . . . . . . . 3.3.3 GLONASS . . . . . . . . . . . . . . . . . 3.3.4 Galileo . . . . . . . . . . . . . . . . . . . 3.4 Campo Magnético Terrestre . . . . . . . . . . . 3.4.1 Magnetómetro . . . . . . . . . . . . . . . 3.4.2 Estimador de Atitude Magneto-Pendular . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 28 29 29 30 31 31 33 . . . . . . . . . . . . . 34 34 36 36 39 42 44 44 45 46 46 47 47 49 4 Arquitectura Proposta para um Catamaran 4.1 Descrição Geral do Veículo e da Arquitectura . . . . . . 4.2 Computador de Bordo Distribuído . . . . . . . . . . . . . 4.2.1 Arquitectura de Comunicações Distribuída - CAN 4.2.2 Nós da Rede CAN Bus . . . . . . . . . . . . . . . 4.3 Monitorização, Transformação e Distribuição de Energia 4.4 Actuadores . . . . . . . . . . . . . . . . . . . . . . . . . 4.5 Sensores . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.5.1 Unidade de Medição Inercial . . . . . . . . . . . . 4.5.2 Tecnologia MEMS . . . . . . . . . . . . . . . . . 4.5.3 Magnetómetro . . . . . . . . . . . . . . . . . . . . . . . . . . Bus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 52 54 54 56 59 59 60 60 61 66 5 Filtro de Navegação 5.1 Introdução e Motivação . . . . . . . . . . . . . . 5.2 Filtro Complementar de Atitude . . . . . . . . . 5.3 Filtro de Posição . . . . . . . . . . . . . . . . . 5.4 Implementação . . . . . . . . . . . . . . . . . . 5.4.1 Estimador de Atitude Magneto-Pendular 5.4.2 Acoplamento do Filtro Complementar . . 5.4.3 Filtragem Multi-Ritmo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 68 73 78 82 82 83 83 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix CONTEÚDO 6 Resultados e Análise de Dados Reais 6.1 Síntese dos Parâmetros dos Filtros . . . . . . . . . . . 6.2 Análise dos Resultados Experimentais . . . . . . . . . . 6.2.1 Desempenho dos Filtros com Falhas de GPS . . 6.2.2 Validação dos Filtros no Domínio da Frequência . . . . 86 86 88 90 91 7 Conclusões e Trabalho Futuro 7.1 Conclusões . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.2 Trabalho Futuro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 98 99 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A Desempenho do Filtro Atitude 101 B Magnetómetro: Modelação do Erro e Calibração 103 B.1 Descrição e Modelação das Fontes de Erro . . . . . . . . . . . . . . . . . 103 B.2 Modelo do Erro das Medidas do Magnetómetro . . . . . . . . . . . . . . 105 B.3 Algoritmos de Calibração de um Magnetómetro . . . . . . . . . . . . . . 109 C Descrição do Hardware C.1 Placa MC-XAS3 . . . . . . . . . . . . . . . . . . . . . . . C.1.1 Características Gerais . . . . . . . . . . . . . . . . C.1.2 Características Específicas . . . . . . . . . . . . . . C.1.3 Características do Microcontrolador Philips XAS3 . C.2 Arquitectura de Aquisição de Sinal . . . . . . . . . . . . . C.2.1 Características Gerais . . . . . . . . . . . . . . . . C.2.2 Características Específicas . . . . . . . . . . . . . . C.2.3 Caracterização do Desempenho da Placa AD24B3C C.3 Placa ASHDG14If - Interface com GPS Ashtech . . . . . . C.3.1 Características Gerais . . . . . . . . . . . . . . . . C.3.2 Características Específicas . . . . . . . . . . . . . . C.4 Placa DSPIf - Interface com D.Module.VC33 . . . . . . . . C.4.1 Características Gerais . . . . . . . . . . . . . . . . C.4.2 Características Específicas . . . . . . . . . . . . . . C.5 Placa D.Signt.T D.Module.VC33 . . . . . . . . . . . . . . C.5.1 Características Gerais . . . . . . . . . . . . . . . . C.5.2 Características Específicas . . . . . . . . . . . . . . C.6 Placa MC_AVRCAN128 . . . . . . . . . . . . . . . . . . . C.6.1 Características Gerais . . . . . . . . . . . . . . . . C.6.2 Características Específicas . . . . . . . . . . . . . . C.7 Placa HMR_MB - Interface com HMR3300 . . . . . . . . C.7.1 Características Gerais . . . . . . . . . . . . . . . . C.7.2 Diagrama de Blocos . . . . . . . . . . . . . . . . . C.8 Placa BatMonit . . . . . . . . . . . . . . . . . . . . . . . . C.8.1 Características Gerais . . . . . . . . . . . . . . . . C.8.2 Características Específicas . . . . . . . . . . . . . . C.8.3 Diagrama de Blocos . . . . . . . . . . . . . . . . . C.9 Placa SWLNPWR . . . . . . . . . . . . . . . . . . . . . . C.9.1 Características Gerais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115 115 115 116 116 117 117 118 120 122 122 122 123 123 123 124 124 126 127 127 127 129 129 130 131 131 131 132 133 133 x CONTEÚDO C.9.2 Características Específicas . . . . . . . . . . . . . . . . . . . . . . C.9.3 Diagrama de Blocos . . . . . . . . . . . . . . . . . . . . . . . . . D Especificações Técnicas dos Sensores D.1 Acelerómetro Crossbow CXL02TG3 . . . . . . . . . . . . D.2 Giroscópio de Velocidade Silicon Sensing Systems CRS03 D.3 Magnetómetro Honeywell HMR3300 . . . . . . . . . . . D.4 GPS Thales Navigation DG14 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133 134 135 135 136 138 140 Lista de Figuras 1.1 1.2 1.3 1.4 1.7 1.8 1.9 Exemplos de Veículos Submarinos Autónomos. . . . . . . . . . . . . . . . Exemplos de Autonomous Surface Crafts. . . . . . . . . . . . . . . . . . . Exemplos de Veículos Aéreos Autónomos. . . . . . . . . . . . . . . . . . . Exemplos de plataformas aéreas de testes pertencentes a várias instituições académicas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Exemplos de Veículos Terrestres Autónomos. . . . . . . . . . . . . . . . . Transporte automático de materiais entre armazéns da EFACEC e postos de trabalho (extraído de [1]). . . . . . . . . . . . . . . . . . . . . . . . . . Sistemas avançados de resposta a incêndio (extraído de [2]). . . . . . . . Patrulhamento de fronteiras (extraído de [3]). . . . . . . . . . . . . . . . Inspecção automática de estruturas semi-submersas. . . . . . . . . . . . . 10 11 12 13 2.1 2.2 2.3 2.4 2.5 2.6 2.7 Ângulos de Euler Z-Y-X. . . . . . . . . . . . . . . . . . . . . Relação entre os referenciais {I} e {E}. . . . . . . . . . . . . Elipsóide e sistemas de coordenadas habituais. . . . . . . . . Referencial do plano tangente e sua relação com o referencial Eixos do referencial do corpo. . . . . . . . . . . . . . . . . . Vector de gravidade real. . . . . . . . . . . . . . . . . . . . . O Geóide terrestre e outras superfícies de interesse. . . . . . 18 26 27 28 29 30 32 3.1 Corte de uma girobússola desenvolvida pelo alemão Hermann AnschützKämpfe. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Algoritmos de navegação para plataformas inerciais. . . . . . . . . . . . . Máquina de Bohnenberger e giroscópio mecânico (extraído de [4]). . . . . Modelo simplificado de um acelerómetro. . . . . . . . . . . . . . . . . . . Constelação de satélites do GPS. . . . . . . . . . . . . . . . . . . . . . . Ilustração da não sobreposição entre os pólos magnéticos e os pólos geográficos terrestres (extraído de [5]). . . . . . . . . . . . . . . . . . . . . . Mapa mundial da declinação magnética (extraído de [6]). . . . . . . . . . Descrição do campo magnético terrestre num ponto da sua superfície. . . Leitura de dois sensores magnéticos ortogonais (inseridos no plano horizontal) quando rodados de 360o no plano horizontal. . . . . . . . . . . . . Inclinómetro e acelerómetro. . . . . . . . . . . . . . . . . . . . . . . . . . 1.5 1.6 3.2 3.3 3.4 3.5 3.6 3.7 3.8 3.9 3.10 4.1 4.2 . . . . . . . . . {E}. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Diagrama de blocos do conceito operacional do sistema DELFIMx. . . . . Diagrama geral da arquitectura proposta para operação do sistema DELFIMx. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi 5 6 7 8 9 35 38 40 41 45 47 48 48 49 50 52 53 xii LISTA DE FIGURAS 4.3 4.4 4.13 Diagrama de blocos da arquitectura distribuída. . . . . . . . . . . . . . . Arquitectura dos nós CAN e ligação ao meio de transmissão (extraído de [7]). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Diagrama funcional do protocolo do tipo mailbox implementado com a DP-RAM. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Partes mecânicas, electro-mecânicas e eléctricas dos actuadores. . . . . . Unidade de medição inercial. . . . . . . . . . . . . . . . . . . . . . . . . . Classes de giroscópios de velocidade do tipo Coriolis Vibrating Gyroscopes (extraído de [8]). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Primeiro protótipo funcional de um giroscópio MEMS do tipo diapasão, desenvolvido no Draper Laboratory. . . . . . . . . . . . . . . . . . . . . . Giroscópio de velocidade Silicon Sensing Systems CRS03 (extraído de [9]). Imagem SEM de um acelerómetro de massa pendular no plano (extraído de [10]). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Imagem SEM de um acelerómetro de massa pendular fora do plano (extraído de [10]). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Imagem SEM de um VBA no plano (extraído de [10]). . . . . . . . . . . 5.1 5.2 5.3 5.4 Aplicações de filtragem. . . . . . . . . . . . . Arquitectura global do sistema de navegação. Filtro complementar de atitude. . . . . . . . . Filtro complementar de posição. . . . . . . . . . . . . . . . . . . . . 70 72 74 79 6.1 6.2 6.3 6.4 6.5 6.6 6.7 6.8 6.9 6.10 6.11 6.12 Funções de transferência do filtro complementar. . . . . . . . . . . . . 1 s). . . . . . . . . . . . . . . . Desempenho do filtro de atitude (T = 56 Resultados da trajectória estimada do DELFIMx. . . . . . . . . . . . Resultados da estimação de atitude. . . . . . . . . . . . . . . . . . . . Resultados da estimação de posição. . . . . . . . . . . . . . . . . . . . Resultados da estimação das velocidades linear e angular. . . . . . . . Resultados da estimação da polarização do giroscópio de velocidade. . Resultados da estimativa de posição com falhas nas medidas de GPS. Detalhes da trajectória estimada com falhas nas medidas de GPS. . . Espectrogramas das medidas de yaw e da estimativa do filtro. . . . . Espectrogramas das medidas de picth e da estimativa do filtro. . . . . Espectrogramas das medidas de px e da estimativa do filtro. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 88 89 89 90 90 91 92 93 95 95 95 4.5 4.6 4.7 4.8 4.9 4.10 4.11 4.12 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B.1 Evolução do modelo do erro em função de yaw medido com diferentes perturbações. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B.2 Representação da distorção de hard iron. . . . . . . . . . . . . . . . . . . B.3 Representação da distorção de soft iron. . . . . . . . . . . . . . . . . . . B.4 Representação da distorção devido a diferentes factores de escala para cada eixo do magnetómetro. . . . . . . . . . . . . . . . . . . . . . . . . . . . . B.5 Representação da distorção devido ao desalinhamento no plano horizontal entre os eixos do magnetómetro e o referencial do corpo. . . . . . . . . . B.6 Ilustração do processo de correcção das perturbações que afectam as medidas do magnetómetro quando o mesmo completa uma volta de 360o no plano horizontal. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 55 57 60 61 63 63 64 64 65 66 106 107 108 109 109 112 xiii LISTA DE FIGURAS B.7 Efeito da calibração no erro da medida de heading a partir do magnetómetro.113 C.1 C.2 C.3 C.4 Placa MC-XAS3. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115 Diagrama de blocos da placa MC-XAS3 (extraído de [11]). . . . . . . . . 116 Placa AD24B3C. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117 Arquitectura de aquisição de sinal analógico composta por placas AD24B3C empilhadas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118 C.5 Histogramas dos ADC0 e ADC1 da placa AD24B3C. . . . . . . . . . . . . 121 C.6 Histograma do ADC2 da placa AD24B3C. . . . . . . . . . . . . . . . . . 121 C.7 Placa ASHDG14If. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122 C.8 Diagrama conceptual da interface entre a placa MC-XAS3 e o D.Module.VC33.123 C.9 Diagrama de blocos e imagem da placa DSPIf. . . . . . . . . . . . . . . . 124 C.10 Placa D.Module.VC33. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125 C.11 Placa MC_AVRCAN128. . . . . . . . . . . . . . . . . . . . . . . . . . . 127 C.12 Placa HMR_MB. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129 C.13 Placa do HMR3300 empilhada na placa HMR_MB. . . . . . . . . . . . . 129 C.14 Diagrama de blocos da placa HMR_MB. . . . . . . . . . . . . . . . . . . 130 C.15 Placa BatMonit. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131 C.16 Diagrama de blocos da placa BatMonit. . . . . . . . . . . . . . . . . . . . 132 C.17 Placa SWLNPWR. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133 C.18 Diagrama de blocos da placa SWLNPWR. . . . . . . . . . . . . . . . . . 134 D.1 D.2 D.3 D.4 Acelerómetro CXL02TG3 da Crossbow Technology, Inc.. . . Giroscópio de velocidade CRS03 da Silicon Sensing Systems. Magnetómetro HMR3300 (extraído de [12]). . . . . . . . . . GPS DG14 da Thales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136 137 138 140 Lista de Tabelas 2.1 Parâmetros do WGS84. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 6.1 6.2 Parâmetros do filtro complementar. . . . . . . . . . . . . . . . . . . . . . Deriva da posição final e média devido a falhas de GPS. . . . . . . . . . . 86 91 C.1 Desempenho da placa AD24B3C. . . . . . . . . . . . . . . . . . . . . . . 122 D.1 Especificações técnicas do acelerómetro Crossbow CXL02TG3 (extraído de [13]). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136 D.2 Especificações técnicas do giroscópio de velocidade Silicon Sensing Systems CRS03 (extraído de [14]). . . . . . . . . . . . . . . . . . . . . . . . . . . 137 D.3 Características do Honeywell HMR3300 Digital Compass (extraído de [12]).138 D.4 Especificações técnicas para a medida de yaw do Honeywell HMR3300 Digital Compass (extraído de [12]). . . . . . . . . . . . . . . . . . . . . . 139 D.5 Especificações técnicas para a medida de roll e pitch do Honeywell HMR3300 Digital Compass (extraído de [12]). . . . . . . . . . . . . . . . . . . . . . 139 D.6 Especificações técnicas para a medida de campo magnético do Honeywell HMR3300 Digital Compass (extraído de [12]). . . . . . . . . . . . . . . . 139 xv Nomenclatura A notação utilizado nesta tese é bastante comum. Uma lista de convenções, definições, símbolos, e grandezas frequentemente adoptadas são enumeradas em seguida. Convenções de Notação • Vectores coluna são representados por minúsculas a negrito, e.g. s. • Matrizes são representadas por letras maiúsculas a negrito, e.g. S. • A dimensão das matrizes é omitida sempre que seja óbvia no contexto em que se insere. Referenciais {B} {C} {E} {G} {I} {T } Referencial Referencial Referencial Referencial Referencial Referencial do Corpo (Body). Geocêntrico. da Terra (Earth). Geográfico. Inercial. do Plano Tangente. Conjuntos M(n, m) M(n) R Rn Z conjunto conjunto conjunto conjunto conjunto das das dos dos dos matrizes reais n × m. matrizes reais n × n, {M ∈ M(n, n)}. números reais. vectores reais de dimensão n. números inteiros. Símbolos Alfabeto Latino a a semi-eixo maior do elipsóide de referência. aceleração expressa em {E}. xvii xviii b bs D e f f F g G I G G h H In k K L E m̄ B mr ns N (µ, Ξ) p P Q(λ) A2 A1 R R ŝ δs s̃ t T T v x z NOMENCLATURA semi-eixo menor do elipsóide de referência. polarização da medida do sensor s, expressa em {B}. matriz de inserção do ruído de processo na equação de saída. excentricidade do elipsóide de referência. achatamento do elipsóide de referência. medida do acelerómetro (força específica), expressa em {B}. matriz da dinâmica. Campo Gravítico Terrestre expresso em {E}. Constante de Gravitação Universal. aceleração gravitacional. matriz de inserção do ruído de processo. altitude em relação ao elipsóide de referência. matriz de saída do sistema. n × n matriz identidade. vector de norma unitária que define o eixo de rotação na representação de atitude descrita pelo vector de rotação. matriz dos ganhos de Kalman. latitude geográfica. campo magnético da Terra expresso em {E}. medida do magnetómetro, expressa em {B}. ruído de medida ou de processo associado a s. distribuição Gaussiana com valor esperado µ e covariância Ξ. posição. matriz da covariância do erro de estimação do filtro de Kalman. matriz que transforma o vector velocidade angular de {B} em relação a {A} expresso em {B} nas derivadas dos ângulos de Euler. matriz de rotação do referencial {A1 } para o referencial {A2 }. notação abreviada para E B R. estimativa do vector s. perturbação do vector s, definido como δs = ŝ − s salvo indicação em contrário. erro de estimação do vector s. tempo. período de amostragem. matriz de transformação de coordenadas. velocidade. vector de estado. vector de observação. Alfabeto Grego γe θ Θs λ λ gravidade efectiva equatorial. ângulo de pitch. matriz da covariância do ruído de observação do vector s. longitude. vector dos ângulos de Euler Z-Y-X, i.e. λ = [ψ θ φ]. xix Ξs Σ φ ϕ ψ I I ωE I ΩE I ωB ωr B matriz da covariância do ruído de processo do vector s. matriz da covariância do erro de estimação. ângulo de roll. vector de rotação (parametrização de atitude). ângulo de yaw. velocidade angular de {E} em relação a {I}, expressa em {I}. forma skew-symmetric de I I ω E , i.e. I ΩE = I I ω E × . velocidade angular de {B} em relação a {I}, expressa em {B}. B I medida de um giroscópio de velocidade.de ω B ). Índices e Expoentes sij sk sr sx , sy , sz A s ŝk elemento da matriz S na linha i e coluna j. vector s no instante de tempo discreto tk , k ∈ Z. medida do vector s. componentes segundo os eixos do x, y e z do vector 3 × 1 s. vector expresso no referencial {A}. estimativa do vector s. Funções S−1 S′ [s×] E(·) inverso de S. transposta de S. 0 −sz sy matriz do produto externo do vector 3 × 1 s, definido como sz 0 −sx . −sy sx 0 valor esperado. Acrónimos ADC ALU AGV ASC ASCII CAN CEP CMT ESA EUA DOP DMA Analog-to-Digital Converter. Arithmetic and Logic Unit. Automated Guided Vehicle. Autonomous Surface Craft. American Standard Code for Information Interchange. Controller Area Network. Circular Error Probable. Campo Magnético Terrestre. Agência Espacial Europeia. Estados Unidos da América. Dilution of Precision. Direct Memory Access. xx DP-SRAM DSOR ECEF EGNOS GPS HITL IMU INS ISA ISR IST NASA NMEA MEMS MPS FLOPS MSAS PLD RAM RF RISC RMS RS-232 RTCM SBAS SEM SNR SRAM TRIAD UAE VA VAA VMA VSA VTA VTOL WGS-84 WAAS NOMENCLATURA Dual Port Static Random Access Memory. Dynamical Systems and Ocean Robotics Lab. Earth Centered, Earth Fixed. European Geostationary Navigation Overlay System. Global Positioning System. Hardware In The Loop. Inertial Measuring Unit. Inertial Navigation System. Inertial Sensor Assembly. Instituto de Sistemas e Robótica. Instituto Superior Técnico. National Aeronautics and Space Administration. National Marine Electronics Association. Micro Electro Mechanical Systems. Magneto-Pendular Sensor. Floating point Operations Per Second. Japanese Multi-function Transport System System. Programmable Logic Device. Random Access Memory. Rádio Frequência. Reduced Instruction Set Computer. Root Mean Square. Recommend Standard number 232. Radio Technical Commission for Maritime Services. Space Based Augmentation System. Scanning Electron Microscope. Signal to Noise Ratio. Static Random Access Memory. Tri-Axial Attitude Determination System. Uniformemente Assimptoticamente Estável. Veículos Autónomos. Veículo Aéreo Autónomo. Veículo Marinho Autónomo. Veículo Submarino Autónomo. Veículo Terrestre Autónomo. Vertical Take-Off and Landing. World Geodetic System 1984. Wide Area Augmentation System. Capítulo 1 Introdução Os principais impulsionadores do desenvolvimento e estudo dos sistemas de coordenação, comando e controlo de Veículos Autónomos (VA), foram as aplicações civis e militares. Com o enorme crescimento do número de aplicações, só num passado recente é que se começou a generalizar um melhor entendimento sobre o impacto desta tecnologia na sociedade do século XXI. O propósito deste capítulo é fornecer uma visão geral dos vários tipos de VA, as tecnologias envolvidas com o fim de atingir um vasto leque de objectivos com que uma plataforma móvel deste género pode ser confrontada. São apresentados também os objectivos e contributos da tese. 1.1 1.1.1 Veículos Autónomos Características Gerais Neste trabalho, definem-se Veículos Autónomos como plataformas não tripuladas, que para além da operação com um determinado grau de autonomia, têm também, por vezes, a capacidade de serem teleoperados, isto é, pilotados remotamente por um agente humano ou computorizado. É possível conceber aplicações para VA tripulados onde a tripulação humana pode ou não desempenhar um papel relevante no comando do veículo, ou então resumir-se simplesmente a ser a "carga"a ser transportada. No presente, é seguro afirmar, que o que se pretende com os VA é prescindir da presença e intervenção directa no comando, evitando as suas limitações inerentes, e dotar os VA com as suas capacidades cognitivas de percepção e decisão. Os VA podem assumir uma enorme diversidade de configurações mecânicas que os tornam potencialmente atractivos e aptos para desempenharem missões em diferentes ambientes, tais como, em terra, no ar ou na água. Uma missão, pode ser definida como um conjunto de acções que leva à possibilidade de concretização de um único ou múltiplos objectivos. Assim, existem veículos terrestres (com locomoção por rodas, pernas, lagartas ou qualquer combinação dos mesmos), aquáticos (podem ser submarinos, de superfície ou arrastados), anfíbios (a locomoção pode ser conseguida com propulsores de asa rotativa e a plataforma flutua numa almofada de ar), aéreos (asa fixa ou rotativa ou veículos menos densos que o ar). Por exemplo, os veículos aéreos, podem apresentar-se como um avião, um helicóptero, um dirigível, etc, visto que é essencial a adaptação das vantagens que cada tipo de 1 2 Capítulo 1. Introdução plataforma apresenta às necessidades da missão. Para um melhor entendimento sobre a adaptação dos veículos a uma determinada aplicação, numa missão em que se pretenda vigiar ou monitorizar uma vasta área (vigilância de florestas, de fronteiras, etc), a escolha mais acertada será optar por um sistema de asa fixa (tipo do avião) cuja velocidade e alcance são mais apropriados. Para o caso da monitorização de zonas de catástrofe numa área restrita, tome-se por exemplo a Central Eléctrica Nuclear de Chernobil, na Ucrânia, aquando da explosão acidental do reactor 4 a 26 de Abril de 1986, onde decorreram missões que se revelaram fatais para as tripulações humanas que tripularam helicópteros de monitorização de radiação, poderiam ser no presente cumpridas por helicópteros autónomos ou teleoperados. É comum na literatura especializada designar missões destinadas aos VA como tendo, pelo menos, um de três atributos, conhecidos como os 3D’s -Dull, Dirty, Dangerous- (Monótono, Sujo, Perigoso) [15]. De facto é possível encontrar mais adjectivos que caracterizam o tipo de missões a que se destinam os VA, tais como, difícil, longa duração, etc. Resumindo, a progressão da tecnologia dos VA deve-se ao seguinte conjunto de factores [16]: • Hostilidade do ambiente tornando impossível ou extremamente onerosa a presença segura do operador. • Competitividade económica relativamente aos sistemas que assentam na participação do operador. • Requisitos não satisfeitos por sistemas em que determinadas actividades envolvam o operador ou, ao incluí-lo, a intervenção deste requer o apoio disponibilizado por funcionalidades de autonomia. O estudo do grau e da natureza da autonomia (ou mesmo do "nível de inteligência") destes sistemas sai fora do âmbito deste trabalho, mas é importante acrescentar que estes veículos podem ter modos de operação bastante distintos, como sejam [15, 16, 17]: • Pré-programados: A missão é composta por actividades estipuladas à priori ou dinamicamente no decorrer da mesma, pelo agente humano. • Supervisionados: Alguma parte da missão é planeada automaticamente, em geral nas camadas hierárquicas de decisão mais baixas (activação de sensores, manobras defensivas, etc), ficando o decisor humano responsável pelas decisões de mais alto nível. • "Inteligentes": Incorporam sistemas de Software de Autonomia Inteligente que possibilitam a tomada de decisões, escolhendo de entre um conjunto de opções geradas automaticamente. Faz monitorização e diagnóstico em caso de falhas ao nível do veículo e ao nível da missão tendo a capacidade de colaboração e negociação com outros sistemas ou veículos. 1.1.2 Estrutura de um Veículo Autónomo Os pontos seguintes descrevem, de forma sucinta, os principais subsistemas que compõem um VA [18, 16]. 1.1. Veículos Autónomos 3 Sistema de Suporte, Monitorização e Recuperação de Falhas: controla a distribuição de energia para os sistemas eléctricos e mecânicos instalados a bordo do veículo, e monitoriza o consumo energético. Para além da verificação do estado inicial e a monitorização contínua do estado do veículo, este subsistema tem como objectivo detectar falhas de hardware e erros de comportamento, e promover a recuperação das falhas correspondentes. Neste contexto, este subsistema determinará comportamentos que degradem graciosamente a execução da missão ou activará acções reflexivas para evitar a perda do veículo. Sistema de Actuação: controla os actuadores para que a velocidade de rotação destes ou a inclinação adequada das superfícies de deflexão corresponda à referência gerada pelo Sistema de Comando e Controlo. Sistema de Navegação: é responsável pela determinação da posição e velocidade lineares e angulares de um corpo relativamente a um referencial, recorrendo para tal a um conjunto de sensores internos, tais como giroscópio, acelerómetros, profundidade, efeito Doppler, magnetómetro, etc, ou a fontes de informação externa (posicionamento global por satélite, sistema de posicionamento acústico do tipo Long Base Line, sonar, etc). As saídas deste sistema, alimentam o Sistema de Comando e Controlo e são enviadas para o Sistema de Controlo de Missão. Sistema de Comando e Controlo: recebe as trajectórias de referência enviadas pelo Sistema de Controlo de Missão e a informação necessária do Sistema de Navegação. Produz os comandos que são enviados ao Sistema de Actuação e é responsável pelo seguimento preciso de trajectórias. Sistema de Comunicações: faz a gestão das comunicações entre o operador e o veículo ou entre este e outros sistemas ou veículos com os quais alguma forma de cooperação está prevista no decorrer da missão. Sistema de Carga: efectua a gestão dos dispositivos específicos à classe de missões (sensores e actuadores) sendo os dados decorrentes da sua activação armazenados para a análise pós-missão ou transmitidos no decorrer da missão. As gamas de sensores e actuadores poderão ser extremamente variadas. Sonares, temperatura, humidade, oxigénio, pH, turbidez, fluorescência, hidrofones, vídeo-câmaras, câmaras acústicas, lasers, etc. para os primeiros e iluminação, dispositivo de recolha de amostras, braços, manipuladores e outros dispositivos mecânicos, para os segundos. Sistema de Interface Homem-Máquina: apoia o operador na sua interacção com o veículo. Esta poderá consistir num simples acompanhamento da missão por parte do operador, troca de dados entre este e o veículo, ou então permitir o envio de comandos pelo operador tendo em vista a alteração da missão. Sistema de Controlo de Missão: transforma o plano da missão (tipicamente definido pelo operador numa linguagem de alto nível ou numa aplicação informática dedicada) num conjunto de comandos para cada um dos subsistemas para que, tendo em 4 Capítulo 1. Introdução conta o estado do veículo e do seu ambiente, sejam executadas as diversas actividades necessárias para a prossecução dos objectivos da missão de acordo com os requisitos prédefinidos. Em particular, poderá presidir às actividades em cooperação que, sendo viáveis no decurso da execução da missão, sejam percebidas como vantajosas. Este subsistema tem pois a seu cargo a interpretação, nos diversos níveis hierárquicos, da informação recolhida durante a execução da missão e a produção de decisões respeitantes à gestão da utilização dos recursos de bordo de forma a maximizar o valor das actividades para cumprimento dos objectivos de acordo com os requisitos especificados. Nas subsecções seguintes, vão ser apresentadas, com maior detalhe, as características principais dos veículos autónomos mais comuns podendo os mesmos ser classificados com base no ambiente onde têm capacidade de operar. 1.1.3 Veículos Marinhos Autónomos Na classe de Veículos Marinhos Autónomos (VMA) podem ser identificadas duas grandes sub-classes: Veículos Submarinos Autónomos (VSA) e os Veículos de Superfície Autónomos que vão passar a ser designados no resto do documento por ASC (Autonomous Surface Crafts). O desenvolvimento de Veículos Submarinos teve o seu inicio há muitos anos. De facto, o primeiro submarino, baptizado de Turtle, foi construído nos Estados Unidos da América por David Bushnell no ano de 1775 em Saybrook no Connecticut. Era um submarino tripulado, com forma oval, feito em madeira, juntas com tiras de ferro com um suprimento de ar de cerca de 30 minutos, sendo a emersão e a submersão controladas com tanques com lastro, os quais podiam ser preenchidos com água ou esvaziados com ar pressurizado [19]. Só em 1879 surgiu aquilo que muitos consideram ser o primeiro submarino útil desenvolvido pelo Reverendo George W. Garrett com uma autonomia de cerca de 10 horas, ao qual se deu o nome de Resurgam. Desde essa época, grandes saltos tecnológicos foram dados, nomeadamente durante a Primeira e Segunda Grandes Guerras. Neste contexto bélico, surgem os torpedos, que são considerados como os primeiros sistemas do tipo Veículos Submarinos Autónomos (VSA). O seu desenvolvimento, sem ser como arma de ataque, teve início na década de sessenta do século XX, quando alguns veículos foram construídos para aplicações muito específicas. Os sistemas originais eram extremamente simples devido às limitações tecnológicas da altura, mas muito cedo foi identificado o seu enorme potencial para servir propósitos militares, científicos e industriais. A Marinha de Guerra dos Estados Unidos da América, desde muito cedo, mostrou interesse em sistemas para detecção de minas, estudo e exploração estratégica de ambientes submarinos. Durante a década de setenta do século XX, deu-se o inicio do esforço da comunidade científica com o desenvolvimento de algumas plataformas de teste. Por exemplo nas áreas da Biologia Marinha, Oceanografia, Geofísica, Geologia, etc, houve também um enorme interesse em dispositivos que possibilitassem os estudos de ambientes submarinos de forma segura e sistemática. Outro forte impulsionador deste tipo de tecnologias foi, e continua a ser, a indústria, especificamente a indústria petrolífera e do gás natural onde desempenham um papel muito importante na prospecção de novos depósitos, apoio a plataformas de extracção off-shore e inspecção de pipelines. Como se pode observar na Figura 1.1, os VSA apresentam-se em vários formatos e dimensões, sendo o mais comum, como já foi mencionado anteriormente, o formato 5 1.1. Veículos Autónomos (a) VSA Infante do Instituto de (b) VSA planador Spray Sistemas e Robótica (ISR) [20] do WHOI [22]. Instituto Superior Técnico (IST) [21]. do (c) VSA Autosub do National Oceanography Centre, Southampton [23]. (d) VSA tipo torpedo da BlueFin (e) VSA Odyssey IIx do Massa- (f) VSA solar de uma parceria [24]. chusetts Institute of Technology entre o Autonomous Undersea [25]. Systems Institute (AUSI) [26] e a Falmouth Scientific, Inc. [27]. Figura 1.1: Exemplos de Veículos Submarinos Autónomos. tipo torpedo propulsionado a baterias electroquímicas. Outro formato interessante que permite missões de longa duração, devido ao tipo de propulsão, é o glider (planador). A Figura 1.1(b) apresenta um exemplo de um veículo deste género. Este move-se para cima e para baixo, no oceano, alterando a sua flutuabilidade, literalmente planando na água, conseguindo propulsão e condução horizontal devido às asas que possuí. Descreve uma trajectória em "dente de serra" ao longo da qual pode observar múltiplas variáveis de interesse (temperatura, condutividade, salinidade, etc). Outra solução para missões de longa duração é o recurso à energia solar, sendo o VSA equipado com painéis foto voltaicos. O VSA fica obrigado a, no decurso da sua missão, emergir regularmente e expor os referidos painéis à radiação solar durante um determinado período de tempo. O esforço de desenvolvimento é repartido entre entidades militares e civis (empresas privadas e grupos académicos). De entre os grupos académicos que investiram desde início no desenvolvimento de VSA, destacam-se a University of Hawaii, Stanford University, a University of California at Santa Barbara, o Massachusetts Institute of Technology (MIT), o Woods Hole Oceanography Institution (WHOI), o Naval Postgraduate School (NPS), o Instituto Superior Técnico (IST) entre outras. Os VSA enfrentam dificuldades especificas ao nível de alguns sistemas que o compõem, nomeadamente no sistema de navegação e comunicações que surgem das restrições impostas pelo meio onde operam. O meio aquático impossibilita, quase na totalidade, a propagação de ondas electromagnéticas, o que inviabiliza a utilização dos actuais sistemas de posicionamento global por satélite, bem como as comunicações por radiofrequência. 6 Capítulo 1. Introdução No campo da navegação, para além dos clássicos sistemas inerciais, recorre-se também a sistemas de posicionamento baseados em faróis acústicos ou sensores de velocidade do tipo Doppler. Para resolver os problemas de comunicação sobra somente o canal acústico que só permite comunicações a curta distância com largura de banda bastante limitada. Em relação aos veículos de superfície, as suas origens remontam aos anos da Segunda Guerra Mundial [15] onde plataformas não tripuladas eram teleoperadas para detectar ou mesmo fazer detonar minas. Apresentam-se em várias formas e dimensões como se pode observar pela Figura 1.2. (a) Catamaran DelfimX do Ins- (b) Catamaran Springer da Uni- (c) Embarcação autónoma da tituto de Sistemas e Robótica versity of Plymouth [28]. Marine Robotic Vessels Interna(ISR) [20] do Instituto Superior tional [29]. Técnico (IST) [21]. (d) ASC monocasco tipo kayak (e) Catamaran Delfim do Ins- (f) Catamaran Charlie do CNRda Robotic Marine Systems, LLC tituto de Sistemas e Robótica ISSIA em Itália [31]. [30]. (ISR) [20] do Instituto Superior Técnico (IST) [21]. Figura 1.2: Exemplos de Autonomous Surface Crafts. Existem configurações baseadas em monocasco, bicasco (tipo catamaran), lanchas, etc, sendo os sistemas energéticos, para os sistemas a bordo e para a propulsão, baseados em baterias electroquímicas, motores de combustão interna, células de combustível, células foto voltaicas, etc. Visto operarem na fronteira entre dois meios, podem executar actividades submersas (por exemplo batimetria acústica do leito de rios) e ainda assim tirar partido das funcionalidades de comunicações e navegação de que os veículos terrestres e aéreos dispõem. O recurso a um ASC pode também surgir no contexto do auxílio à operação de um VSA [32], visto que, devido às dificuldades de comunicação referidas anteriormente, estas plataformas, em certos cenários de operação, podem fornecer um canal acústico vertical (configuração que favorece significativamente a qualidade do canal de comunicação), tornando-se assim num gateway de comunicação entre o VSA e todos os sistemas de radiofrequência disponíveis à superfície. Para além dos cenários de cooperação com 1.1. Veículos Autónomos 7 veículos submersos, um ASC está apto para um vasto leque de aplicações militares e civis, tais como: vigilância marítima e fluvial (zonas portuárias, rios, etc), plataforma para sensores (para as ciências como a Oceanografia, Geofísica, Biologia, etc), recolha de amostras em áreas de catástrofe ambiental (química/radiológica/biológica), entre muitas outras. 1.1.4 Veículos Aéreos Autónomos Os Veículos Aéreos Autónomos (VAA) são plataformas com propulsão própria que se mantêm no ar devido a uma força de sustentação aerodinâmica, podendo apresentar-se numa vasta variedade de dimensões, geometrias e custos, tendo a capacidade de desempenhar um enorme espectro de missões. Os VAA podem ser de asa fixa, asa rotativa, tal como os helicópteros, tilt-rotor (consultar Figura 1.3(a)) ou veículos menos densos que o ar com propulsão baseada em motores de explosão, turbinas a jacto ou eléctricos. A Figura 1.3 ilustra alguns VAA em desenvolvimento e operação no presente. (a) VAA tilt-rotor Bell Eagle Eye (b) VAA de asa fixa Predator B (c) VAA de asa fixa Aerosonde da Bell Helicopter [33]. da General Atomics Aeronautical da Aerosonde Pty, Ltd. [35]. Systems [34]. (d) VAA de asa fixa Global Hawk (e) VAA de asa rotativa RQ-8A (f) VAA de asa rotativa A160 da Northrop Grumman [36]. Fire Scout Northrop Grumman Hummingbird da Boeing [37]. [36]. Figura 1.3: Exemplos de Veículos Aéreos Autónomos. O interesse militar nestas plataformas conta já com várias décadas de história, tendo êxitos reconhecidos desde a guerra do Vietname e, de forma mais visível, nas guerras do Iraque (Operação Tempestade no Deserto), Afeganistão e, novamente, no Iraque, na Operação Iraqui Freedom. No presente, esta classe de missões envolve um espectro de sistemas bastante variado, onde se incluem sensores e sistemas de informação, tais como radar de abertura sintética, sensores electro-ópticos, infra-vermelhos, etc. A maioria das missões deste género é de longa duração, desempenhadas por veículos de grandes dimensões com sensores de elevada precisão. 8 Capítulo 1. Introdução A investigação na área dos VAA apresenta um elevado interesse académico, económico e militar fruto do seu alargado espectro de aplicações que se estendem desde operações em condições adversas (e.g. centrais nucleares) até à exploração aeroespacial. A investigação, na área dos VAA, decorre em instituições académicas há mais de uma década, onde se tem feito uso de muitos tipos de plataformas, como por exemplo helicópteros e aviões que são adquiridos a empresas de aeromodelismo ou são projectados e fabricados pelas próprias instituições. Importantes contribuições foram dadas por, Carnegie Melon University [38, 39], Stanford University [40, 41], University of California at Berkeley [42], University of Southern California, Massachusetts Institute of Technology (MIT) ([43, 44] e Georgia Institute of Technology [45, 46]. Grande parte da investigação foi feita em helicópteros e aviões de aeromodelismo de pequena e média dimensões visando os campos de investigação de identificação de sistemas, sistemas de controlo, sistemas de navegação, controlo e cooperação de múltiplos veículos. Algumas dessas plataformas são apresentadas na Figura 1.4. (a) VAA de asa fixa do Projecto (b) VAA de asa rotativa Yamaha (c) VAA de asa rotativa do MasDragonFly [47] da Stanford Uni- R-50 [49] da Carnegie Mellon sachusetts Institute of Technoversity [48]. University [50, 51]. logy [52]. (d) VAA de asa rotativa do Pro- (e) VAA de asa rotativa Yamaha (f) Frota de VAA de asa rotativa jecto AVATAR da University of R-Max [49] do Georgia Institute do Projecto BEAR da University Southern California [53, 54, 55]. of Technology [56, 57]. of California at Berkeley [58, 59]. Figura 1.4: Exemplos de plataformas aéreas de testes pertencentes a várias instituições académicas. Estas plataformas apresentam relevantes vantagens, devido aos seus baixos custos de teste e operação. Estão também disponíveis no mercado com bastante facilidade e são portáveis, isto é, são transportáveis por um ou dois indivíduos sem necessidade de recurso a meios de transporte especiais. Fazem uso de sistemas de energia convencionais, tais como, baterias electroquímicas, motores de combustão interna ou combinações dos dois. Embora neste documento só estejam a ser citadas universidades e instituições dos Estados Unidos da América (EUA), é importante referir que instituições europeias, de 9 1.1. Veículos Autónomos Israel, França, Inglaterra e da Rússia, têm também publicado resultados importantes. 1.1.5 Veículos Terrestres Autónomos Os Veículos Terrestres Autónomos (VTA) caracterizam-se como sendo plataformas que se locomovem no solo, em geral, recorrendo a rodas, lagartas, pernas ou combinações das mesmas, consoante o tipo de geografia onde é suposto operarem. Apresentam-se como veículos que vão desde grandes carros de combate pesando várias toneladas, como é o caso do Abrams Panther (massa superior 40 toneladas, [15]), até pequenos veículos que um ser humano pode transportar, tal como o Dragon Runner [15]. Na Figura 1.5 podem ser observados alguns exemplos deste tipo de sistemas. (a) Abrams Panther [17, 15]. (b) U. S. Marine Corps Gladiator [17, 15]. (c) Mobile Detection Assessment Response System - Expeditionary (MDARS-E) [17]. (d) Dragon Runner [17]. Figura 1.5: Exemplos de Veículos Terrestres Autónomos. Assim como os VSA e os VAA, surgem como sistemas de grande relevância para fins militares e civis. Do ponto de vista militar, encontram-se aplicações tais como: detecção e eliminação de minas, neutralização de munições explosivas, reconhecimento para apoio de tropas, vigilância e aquisição de alvos, guerra urbana e em regiões litorais, etc. Como exemplos de aplicações civis, estas plataformas são importantes em: vigilância de fronteiras, agricultura, combate a incêndios, operações em áreas contaminadas e operações de busca e salvamento. A sua utilização em ambientes não estruturados, gera desafios mais complexos do que aqueles que se podem encontrar para os veículos marinhos e aéreos, sendo por isso comum, estes sistemas terem menos autonomia, no que se refere à sua locomoção, dispondo de funcionalidades de teleoperação. Uma classe de VTA que desempenha um papel relevante em aplicações civis, são os veículos que operam em ambientes estruturados, como é o caso de fábricas e armazéns. Um exemplo nacional de um sistema deste género foi o projecto entre o Instituto Superior 10 Capítulo 1. Introdução Técnico e a EFACEC1 para automatizar transporte de materiais e produtos em curso de produção entre dois armazéns automáticos. Em 1990, da referida parceria, resultou o desenvolvimento de veículos guiados automaticamente (Automated Guided Vehicles, AGV) os quais permitiram, em conjunto com os armazéns automáticos, introduzir na nova fábrica de Transformadores de Distribuição, um sistema de armazenagem e distribuição automática de matérias primas e semifabricados. Estes veículos asseguram o transporte entre os armazéns automáticos e os 120 postos de trabalho e entre eles, sem qualquer intervenção humana. As estações de carga e descarga são passivas sendo o seguimento e a comunicação entre os carros e o sistema de gestão feito por fio enterrado 15 mm no chão da fábrica e a localização dos AGV indicada por etiquetas magnéticas. A Figura 1.6 ilustra dois desses veículos em operação. Outra solução comum neste tipo de sistemas, Figura 1.6: Transporte automático de materiais entre armazéns da EFACEC e postos de trabalho (extraído de [1]). para a definição das trajectórias no ambiente de trabalho, é a utilização de faixas coloridas pintadas no pavimento que servem de guias ópticas para os veículos. Alguns tipos de VTA conseguem uma maior flexibilidade de locomoção, visto que dispõem de sensores, como sonares ou lasers, que lhe fornece a capacidade de sair das trajectórias definidas. 1.1.6 Aplicações Nesta secção são apresentadas algumas aplicações que se tornaram possíveis com o aparecimento e avanço da tecnologia, nomeadamente ao nível de integração de sensores, portabilidade de sistemas computacionais, sistemas de propulsão, algoritmos de navegação e controlo, novos materiais leves e robustos. Estes saltos tecnológicos tornaram possível, e acessível, a aplicação da tecnologia dos VA em novas áreas onde se apresentam como soluções de menor risco e custos, relativamente a soluções que fazem uso de veículos tripulados. Em tempo de paz, alguns projectos militares encontram aplicações civis bem menos destrutivas tais como as que se apresentam em seguida. 1 Grupo EFACEC, http://www.efacec.pt/ 1.1. Veículos Autónomos 11 Sistemas Avançados de Resposta a Incêndios Desenvolvido pela National Aeronautics and Space Administration (NASA) em colaboração com o Departamento de Agricultura dos EUA, pretende aumentar a eficiência táctica do combate a incêndios florestais de grandes dimensões. Plataformas aéreas com sensores térmicos por infra-vermelhos vão diminuir significativamente o tempo necessário a compilar o mapa do incêndio que é de importância primordial no seu combate. Esta tecnologia permite reduzir os riscos para os seres humanos, para os bens materiais, além de minimizar os danos aos recursos florestais. Os testes de campo do projecto Unmanned Aerial Vehicle First Response Experiment (UAV FiRE) tiveram lugar no centro de operações de voo da General Atomics no sul do estado da California. Um VAA General Atomics ALTUS II apresentado na Figura 1.7 (semelhante ao apresentado na Figura 1.3(b)) executou várias passagens sobrevoando um incêndio controlado, enviando por telemetria imagens térmicas, via satélite, para um servidor de comunicações localizado a cerca de 640 km de distância no centro NASA/Ames. As Figura 1.7: Sistemas avançados de resposta a incêndio (extraído de [2]). imagens são georreferenciadas e em cerca de 10 minutos estavam disponíveis em todo o mundo através da World Wide Web [2]. Patrulhamento de Fronteiras No contexto sócio-económico mundial em que se vive, onde o tráfico de bens materiais e seres humanos é uma realidade, surge a necessidade de um patrulhamento eficiente de fronteiras. Uma aplicação bastante adequada para um VAA, será por exemplo, a vigilância de pontos vulneráveis na linha de fronteira entre dois países. Alguns projectos revelaram sucesso em missões deste género. Em particular a empresa Austríaca Schiebel reportou sucesso em testes de campo, feitos como demonstração para o Ministério do Interior Austríaco, onde o seu VAA S-100 CAMCOPTER do tipo VTOL (Vertical TakeOff and Landing) completou nove percursos nocturnos de patrulhamento ao longo de um troço da fronteira que separa a Austria e a Eslováquia, uma missão que habitualmente é desempenhada por helicópteros tripulados. Na Figura 1.8 ilustra-se graficamente este conceito. A voar a cerca de 450 m acima do solo, o S-100 detectou regularmente pontos interessantes utilizando imagens térmicas com origem numa câmara montada numa plataforma 12 Capítulo 1. Introdução Figura 1.8: Patrulhamento de fronteiras (extraído de [3]). estabilizada. Sendo controlado por operadores humanos, e a percorrer trajectórias préprogramadas, sempre que algum ponto de interesse era detectado, a trajectória podia ser alterada para sobrevoar e analisar pontos específicos em maior detalhe. As aplicações civis destes sistemas são virtualmente ilimitadas. A título de exemplo, podem ser mencionadas aplicações como: monitorização de tráfego rodoviário, mapeamento digital, repetidor de telecomunicações, etc. Diagnóstico e Inspecção Robotizada de Estruturas Semi-Submersas O projecto de quebra-mar de taludes é, devido às características destas estruturas, realizado no pressuposto de que obras de manutenção ou reparação serão necessárias durante a sua vida útil. O custo da estrutura, o seu comportamento esperado, bem como as consequências da sua degradação na protecção da bacia portuária, justificam a existência de um programa de acompanhamento da estrutura que permita decidir quando realizar as obras necessárias de manutenção, ou mesmo de reparação. O processo de tomada de decisão relativo a estas intervenções, deve apoiar-se no diagnóstico da estrutura, partindo de um conjunto de variáveis descritoras do seu estado. Contudo, ainda não é viável caracterizar, de forma contínua, o estado de um trecho de um quebra-mar de taludes. Assim, o procedimento mais usual de acompanhamento destas estruturas é a sua inspecção periódica que, na maioria dos casos, se tem limitado à parte emersa da estrutura, uma vez que o custo associado à observação da parte submersa é muito elevado. Com o objectivo de melhorar a caracterização do estado de um quebra-mar de talude, uma equipa do LNEC (Laboratório Nacional de Engenharia Civil) e do IST cooperou num projecto intitulado "MEDIRES - Metodologias de Diagnóstico e Inspecção Robotizada de Estruturas Semi-Submersas"que pretende estabelecer uma metodologia para o diagnóstico de quebra-mares de talude a partir da inspecção periódica, quer da sua parte emersa, quer da sua parte submersa. Na Figura 1.9 ilustra-se graficamente o conceito deste projecto. A automatização do processo conseguiu-se fazendo uso de um ASC (do tipo catamaran) equipado com um sonar (mapeamento da parte submersa) e um laser (mapeamento da parte emersa) cujas medidas são posteriormente georreferenciadas com a informação gerada pelo sistema de navegação também instalado a bordo. A geração e 1.2. Objectivos 13 Figura 1.9: Inspecção automática de estruturas semi-submersas. seguimento de trajectórias é feita autonomamente. 1.2 Objectivos Biólogos marinhos, oceanógrafos e outros investigadores dos oceanos, estão cada vez mais dependentes de tecnologia capaz de levar a cabo estudos que sejam apropriados, quer na escala temporal, quer na escala espacial, para captar os respectivos fenómenos de interesse. Um campo de interesse é a monitorização do estado de conservação de estruturas semi-submersas, tais como, pontes, quebra-mares, que em geral requerem inspecções de rotina regulares e que são simultaneamente dispendiosas e complexas. A maioria destas estruturas estão expostas a condições meteorológicas adversas e a pesadas cargas mecânicas, sendo construídas com o pressuposto de que ao longo na sua vida útil irão ter que ser sujeitos a obras de manutenção. Os ASC conferem um elevado grau de fiabilidade operacional na presença de ambientes cuja dinâmica e incerteza representam um desafio em termos de soluções de engenharia. Na aplicação específica de monitorização de estruturas semi-submersas, permitem o acesso a locais remotos e confinados de uma forma sistemática, tal como é requisito em aplicações de aquisição de dados de sonar. Para executar a sua missão com sucesso, a plataforma tem de ter disponível a bordo um sistema de navegação baseado, de preferência, em componentes de baixo custo e consumo energético, capaz de integrar de forma eficiente a informação com origem nos sensores inerciais e nos sensores auxiliares. O principal objectivo deste trabalho foi o desenvolvimento e teste de uma sistema de navegação para obtenção de estimativas de posição e atitude, que recorre a técnicas de filtragem complementar para fundir informação sensorial com origem em medidas inerciais, medidas do campo magnético terrestre e medidas do sistema de posicionamento global (GPS). As estimativas vão desempenhar um papel determinante na estabilização da plataforma e vão ser a base para a implementação de estratégias de controlo fiáveis para seguimento de trajectórias (trajectory tracking) e seguimento de caminhos (path 14 Capítulo 1. Introdução following). A definição e implementação de uma arquitectura de hardware (sensores, actuadores, sistemas de energia, comunicações) capaz de transformar a estrutura mecânica de um catamaran, desenvolvida e construída no Laboratório de Sistemas Dinâmicos e Robótica Oceânica (Dynamical Systems and Ocean Robotics, DSOR) do Instituto de Sistemas e Robótica (ISR) em Lisboa, num Veículo Marinho Autónomo de Superfície operacional, foi também, um dos propósitos deste trabalho. 1.3 Contribuições Contribuições Teóricas: Neste trabalho propõe-se um sistema de navegação baseado na teoria da filtragem complementar para estimação de posição e atitude, com aplicação a veículos autónomos. Recorrendo a medidas inerciais strapdown, observações vectoriais e medidas auxiliares de GPS, os filtros complementares propostos fornecem estimativas de atitude com representação em ângulos de Euler e estimativas de posição em coordenadas rectangulares definidas para o referencial da Terra enquanto compensam dinamicamente as polarizações dos giroscópios de velocidade. São demonstradas as propriedades de estabilidade e desempenho dos filtros propostos nas condições de operação normalmente encontradas nas aplicações de veículos autónomos oceânicos, terrestres e aéreos de manobras não agressivas. É proposta e enfatizada uma metodologia de afinação dos parâmetros dos filtros baseada em considerações no domínio da frequência. Contribuições Experimentais Os reduzidos meios computacionais exigidos pelo sistema de navegação proposto tornam-no adequado para implementação em hardware de baixo consumo energético recorrendo a sensores de baixo custo, afirmando-se como uma arquitectura multi-ritmo simples mas eficaz com aplicações a veículos autónomos. A plataforma onde foi instalada a arquitectura e com a qual foram feitos os testes experimentais dos algoritmos de navegação é um Veículo Marinho Autónomo de superfície do tipo catamaran, o ASC DELFIMx desenvolvido no ISR-DSOR. São apresentados e discutidos resultados experimentais obtidos em tempo real durante testes de mar com o sistema de navegação proposto. 1.4 Organização da Tese Para além deste primeiro capítulo introdutório, a tese encontra-se dividida da seguinte forma: • Capítulo 1: Introdução. • Capítulo 2: define-se a notação adoptada, analisam-se diferentes formas de representação de orientação, os referenciais considerados, juntamente com algumas propriedades importantes associadas. É apresentada uma breve descrição da geometria e do campo gravítico terrestres. • Capítulo 3: introduz-se a ciência da navegação terrestre recorrendo ao seu campo magnético, a sensores inerciais e a sistemas de posicionamento global por satélite. 1.4. Organização da Tese 15 • Capítulo 4: descreve-se a arquitectura proposta pelo autor para desenvolvimento e teste de um veículo marinho autónomo de superfície. • Capítulo 5: descreve-se o algoritmo de navegação implementado, baseado em filtragem de Kalman complementar que recorre directamente às medidas dos sensores disponíveis (acelerómetros, giroscópios, magnetómetro e GPS) combinando duas medidas da mesma grandeza que apresentam informação em espectros complementares. • Capítulo 6: apresentam-se e discutem-se, os resultados do sistema de navegação proposto, obtidos em testes de mar efectuados com o catamaran DELFIMx. • Capítulo 7: apresentam-se as principais conclusões a retirar do trabalho realizado e sugerem-se possíveis desenvolvimentos futuros. Adicionalmente chama-se a atenção do leitor para o Anexo B onde se descrevem as principais fontes de erro nas leituras obtidas com um magnetómetro triaxial, e sugere-se uma evolução de um modelo para o erro do magnetómetro, bem como um algoritmo de calibração que permite aumentar o desempenho do mesmo. Os Capítulos 2 e 3, servem o propósito de enquadrar a área de conhecimento mais especifica dos filtros de navegação para fusão sensorial, no contexto dos sistemas de navegação terrestre mais comuns. Devido ao carácter mais descritivo dos referidos capítulos, alerta-se o leitor mais conhecedor das referidas matérias, para a possibilidade de passar para o Capítulo 4 e capítulos seguintes, onde é descrita a arquitectura do ASC DELFIMx, e se apresentam os filtros de navegação, bem como os resultados experimentais. Capítulo 2 Representação da Orientação e Referenciais de Navegação É necessário descrever de uma forma rigorosa a orientação do veículo e os referenciais utilizados . Neste Capítulo apresentam-se algumas alternativas para representar a orientação dos referenciais, sendo posteriormente definidos os que foram adoptados neste trabalho. É também apresentada uma breve descrição da geometria e do campo gravítico terrestres. 2.1 Representação da Orientação A abordagem que se segue tem em conta o facto desta representação ser necessária para algoritmos de navegação, focando aspectos como a composição de transformações, estudo da existência de singularidades e dinâmica de representação. 2.1.1 Matriz de Rotação A matriz de rotação descreve rotações de vectores e efectua o mapeamento de coordenadas entre referenciais. De acordo com a notação seguida em [60], a transformação de coordenadas de um vector representado no referencial {B} para o referencial {A} é escrita como B A p=A (2.1) B R p. A matriz de rotação A B R pode ser obtida pela projecção, disposta por colunas, dos vectores ortonormados do referencial {B} segundo os vectores ortonormais do referencial {A} hXB , XA i hYB , XA i hZB , XA i A (2.2) hYB , YA i hZB , YA i , B R = hXB , YA i hXB , ZA i hYB , ZA i hZB , ZA i onde X, Y, Z são os vectores ortonormais de cada um dos referenciais e h, i representa o operador produto interno. Dado que o produto interno de dois vectores de norma unitária é igual ao co-seno do ângulo formado pelos dois vectores, torna-se clara a razão dos componentes desta matriz serem designados por co-senos directores. Da equação 16 17 2.1. Representação da Orientação B (2.1), é directa a relação de A B R com a transformação inversa A R. Sabe-se da Álgebra Linear que a inversa de uma matriz com colunas ortonormadas é igual à sua transposta B AR = −1 A BR = ′ A BR . (2.3) A transformação entre referenciais pode ser obtida através das transformações intermédias simples A B A (2.4) C R = B RC R, envolvendo o referencial {B} na rotação entre o referencial {A} e o referencial {C}. A dinâmica da matriz de rotação pode ser obtida resolvendo o limite A dA R(t + δt) − A δA R BR B R(t) = lim B = lim B , δt−→0 δt δt−→0 dt δt (2.5) A onde A B R(t + δt) e B R(t) são a matriz dos cossenos directores nos instantes de tempo t e t + δt, respectivamente. A matriz A B R(t + δt) pode ser escrita como o produto de duas matrizes A A (2.6) B R(t + δt) = B R(t)A(t), onde A(t) é a matriz de rotação que relaciona o referencial {B} no instante t com o referencial {B} no instante t + δt que, para rotações de pequenos ângulos, pode ser escrita da forma A(t) = [I + δΨ], (2.7) onde I é uma matriz identidade 3 × 3 e 0 −δψ 0 δΨ = −δψ 0 −δφ , 0 −δφ 0 (2.8) onde δψ, δθ e δφ representam os ângulos infinitesimais segundo os quais, o referencial {B} rodou durante o intervalo de tempo δt em torno dos seus eixos de yaw, pitch e roll, respectivamente. No limite, à medida que δt se aproxima de zero, a aproximação da matriz de rotação para pequenos ângulos, torna-se válida e a ordem das rotações deixa de ser importante. Substituindo A B R(t + δt) na equação (2.5), obtém-se dA δΨ BR =A . B R lim δt−→0 δt dt (2.9) é a matriz skew-symmetric do vector velocidade angular No limite, quando δt −→ 0, δΨ δt do referencial {B} em relação ao referencial {A} (B A ω B = [p, q, r]′ ), representada no referencial {B}. Logo δΨ B A ωB × . = (2.10) lim δt−→0 δt Substituindo em (2.9) resulta em B dA BR =A BR dt A ωB × , (2.11) 18 Capítulo 2. Representação da Orientação e Referenciais de Navegação onde B 2.1.2 0 −r q A ωB × = r 0 −p . −q p 0 (2.12) Ângulos de Euler Nesta representação, cada rotação é realizada sequencialmente em torno de um eixo do referencial {B}, em que a orientação dos eixos é alterada após cada rotação. A este conjunto de três rotações, é usual atribuir-se a designação de ângulos de Euler. Este tipo de representação é bastante popular devido ao seu significado físico, visto que, os ângulos de Euler têm correspondência directa com os ângulos medidos pelos sensores de posição dos três eixos de uma plataforma de navegação inercial estabilizada (gimballed systems) sobre a qual vai ser apresentada uma breve descrição no capítulo seguinte. A transformação de coordenadas de um vector do referencial {A} para o referencial {B} pode ser conseguida através três rotações elementares, podendo as mesmas ser expressas matematicamente como três matrizes de rotação 1 0 0 cθ 0 −sθ cψ sψ 0 A2 A1 cφ sφ , (2.13) 1 0 ; B A2 R = 0 A R = −sψ cψ 0 ; A1 R = 0 0 −sφ cφ sθ 0 cθ 0 0 1 onde s ≡ sin, c ≡ cos. Define-se λ = [ψ, θ, φ]′ para representar a atitude ou orientação em ângulos de rotação Yaw, Pitch e Roll, os quais correspondem a rotações em torno dos eixos Z, Y e X, do referencial móvel {B}, respectivamente. Na Figura 2.1 são ilustradas as três rotações. Uma vez que as três rotações ocorrem segundo os eixos Z-Y-X, esta Z A1 ZA Z A1 YA1 Z A2 Z A2 ZB YA 2 ! YA YB YA1 YA 2 " XA ! Yaw X A2 X A1 X A1 ! Pitch XB X A2 ! Roll Figura 2.1: Ângulos de Euler Z-Y-X. representação denomina-se por Ângulos de Euler Z-Y-X (ou 321). Assim, a transformação do referencial {A} para {B} pode ser expressa como o produto destas três transformações B AR A2 A1 =B A2 RA1 RA R. (2.14) A transformação de coordenadas de {B} para {A} é dada por A BR A2 A1 A1 A2 ′ B ′ A =B A R = (A2 RA1 RA R) = A1 RA2 RB R (2.15) 19 2.1. Representação da Orientação cψ −sψ 0 cθ 0 A cψ 0 0 1 B R = sψ 0 0 1 −sθ 0 cψcθ cψsθsφ − sψcφ A B R = sψcθ sψsθsφ + cψcφ −sψ cθsφ sθ 1 0 0 1 0 cφ −sφ cθ 0 sφ cφ cψsθcφ + sψsφ sψsθcφ − cψsφ . cθcφ (2.16) (2.17) É possível, através dos valores numéricos de uma matriz de rotação, a extracção do valor dos ângulos de Euler Z-Y-X. Para tal, define-se uma matriz de rotação genérica r11 r12 r13 A (2.18) B R = r21 r22 r23 . r31 r32 r33 Comparando os elementos das matrizes nas equações (2.18) e (2.17), é possível descrever os ângulos de Euler em função dos elementos da matriz de rotação [61, 10] p 2 2 θ = arctan2 −r31 , r11 + r21 r11 (2.19) cθ cθ r r 32 33 , φ = arctan2 . cθ cθ Dada a existência de uma raiz quadrada para ocálculo de θ, assumem-se apenas como π soluções que respeitam a condição θ ∈ −π , . Esta representação apresenta ainda 2 2 π problemas com singularidades para θ = ± 2 , para as quais se podem escolher as soluções conforme convenção em [61], i.e. ψ = arctan2 r 21 , π π θ = θ = −2 2 , ψ=0 ψ=0 φ = arctan2 (r21 , r22 ) φ = − arctan2 (r21 , r22 ) (2.20) Dada a variação temporal de ângulos de Euler que descrevem a evolução da orientação de um referencial, é possível determinar as componentes do vector de velocidade angular. Por exemplo, seja a orientação do referencial {B} em relação ao referencial {A} definida pelos ângulos de Euler e λ̇ = [ψ̇, θ̇, φ̇]′ as suas derivadas temporais. Iniciando no referencial {A}, fazendo uso de dois referencias intermédios, cujas velocidades angulares são dadas pelas derivadas dos ângulos de Euler e recorrendo à propriedade aditiva da velocidade angular, obtém-se [62] B p φ̇ 0 0 B A2 A ωB = q = 0 + B A2 R θ̇ + A2 RA1 R 0 . r 0 0 ψ̇ (2.21) 20 Capítulo 2. Representação da Orientação e Referenciais de Navegação Substituindo as matrizes apresentadas anteriormente φ̇ 1 0 0 0 1 0 0 cθ 0 sθ 0 p q = 0 + 0 cφ −sφ θ̇ + 0 cφ −sφ 0 1 0 0 0 0 sφ cφ 0 0 sφ cφ −sθ 0 cθ r ψ̇ ψ̇ p φ̇ − sθφ̇ −sθ 0 1 q = cφθ̇ + sφcθψ̇ = sφcθ cφ 0 θ̇ ˙ − sφθ̇ φ̇ r cφcθpsi cφcθ −sφ 0 {z } | (2.22) ψ̇ p −1 (2.23) q = Q (λ) θ̇ , r φ̇ onde Q(λ) é a matriz de transformação de B A ω B para λ̇. Resolvendo para λ̇ fica λ̇ = Q(λ) B A ω B , (2.24) onde 0 sin φ sec θ cos φ sec θ p ψ̇ cos φ − sin φ q . θ̇ = 0 φ̇ 1 sin φ tan θ cos φ tan θ r (2.25) De notar que as derivadas dos ângulos de Euler estão definidas em referenciais diferentes. Assim, as componentes de λ̇ não representam as componentes de um vector. Então, as equações (2.24) e (2.25) não representam transformações de coordenadas e a matriz Q(λ) não é uma matriz ortogonal. As equações (2.24) e (2.25) apresentam também singularidades para θ = ±π/2; logo, pode-se afirmar que esta representação não é adequada para plataformas como, por exemplo, aviões de combate de alto desempenho, onde é mais comum, para ultrapassar esta dificuldade, fazer-se uso de representações de atitude, tais como a matriz de rotação ou quaterniões (uma breve descrição sobre quaterniões vai ser apresentada na Secção 2.1.4). Uma alternativa sugerida em [63] para contornar a dificuldade causada pela singularidade na dinâmica dos ângulos de Euler apresenta-se em seguida ψ̇ = (φ̇ − p) sin θ + (q sin φ + r cos φ) cos θ θ̇ = q cos φ − r sin φ φ̇ = p + ψ̇ sin θ (2.26) Outro método, para se obter a dinâmica dos ângulos de Euler, consiste em escrever explicitamente os elementos da matriz de rotação como função dos ângulos de Euler e desenvolver a dinâmica da matriz de rotação em função da velocidade angular. Embora não se tenha feito uso das mesmas, em seguida apresentam-se mais algumas formas de representação de orientação, com o objectivo de evidenciar as suas vantagens e desvantagens. 21 2.1. Representação da Orientação 2.1.3 Vector de Rotação Como alternativa ao uso de rotações sequenciais, o referencial {B} pode ser obtido directamente rodando o referencial {A} de um ângulo Λ em torno do eixo k. O vector de rotação é definido como kx A (2.27) ϕB = Λ ky , kz onde Λ ∈ [0, π] é o ângulo de rotação e k = [kx , ky , kz ]′ é o vector de norma unitária que define o eixo de rotação. De [62] tem-se que a matriz de rotação pode ser obtida a partir do vector de rotação pela expressão 1 − cos Λ A sin Λ A ϕB × + ϕB × A ϕB × , (2.28) 2 Λ Λ onde [ϕ×] é o operador produto externo definido de forma análoga a (2.12). A expressão, que define o vector de rotação em função dos elementos da matriz de rotação, pode ser obtida desenvolvendo a equação (2.28) r11 + r22 + r33 − 1 Λ = arccos 2 A A ϕB BR = I3 + (2.29) r32 − r23 1 K= r13 − r31 . 2 sin(Λ) r21 − r12 A dinâmica do vector de rotação é apresentada em [64] A ϕ̇B = B A 1 ω B + A ϕB × B 2 A ωB 1 + 2 Λ Λ sin Λ 1− 2 (1 − cos Λ) A ϕB × A ϕB × B A ωB (2.30) sendo normalmente designada na literatura por Equação de Bortz [65]. O vector de rotação constitui uma notação compacta, com três elementos, mas que apresenta problemas de representação para rotações muito pequenas devido ao seu módulo ser directamente proporcional Λ e está também sujeito a singularidades para Λ = 0 e Λ = π. Para uma descrição mais detalhada recorrer a [62]. 2.1.4 Quaterniões Os habituais números complexos são convenientes como meio para expressar rotações de vectores num espaço bi-dimensional, sendo definidos por dois parâmetros (a1 , a2 ) ∈ R2 e expressos por z = a1 + ia2 , (2.31) onde i satisfaz i2 = −1. O número complexo z é a combinação linear da base 1 e i. , 22 Capítulo 2. Representação da Orientação e Referenciais de Navegação Em 1843, Sir William Rowan Hamilton (1805−1865), introduz um novo formalismo recorrendo a quatro parâmetros, designado por quaterniões que são uma generalização de um número complexo (q = (q1 , q2 , q3 , q4 ) ∈ R4 ). São constituídos por uma componente escalar qs , e outra vectorial qv , dada por q = (qs , qv ) = (q1 , q2 , q3 , q4 ) = q1 + iq2 + jq3 + kq4 , (2.32) onde i, j e k são as componentes da parte vectorial qv = (q2 , q3 , q4 ) e q1 é a parte escalar qs = q1 . O símbolo ◦ vai ser utilizado para representar o produto de quaterniões. O produto de dois quaterniões origina um terceiro quaternião, caracterizado pelas seguintes propriedades i ◦ i = −1, i ◦ j = k, i ◦ k = −j, j ◦ j = −1, j ◦ k = i, j ◦ i = −k, k ◦ k = −1, k ◦ i = j, k ◦ j = −i, (2.33) q1 = 0 ⇒ q = 0 − qv = 0 + iq2 + jq3 + kq4 . (2.34) q∗ = qs − qv = q1 − iq2 − jq3 − kq4 . (2.35) sendo designados por quaterniões puros os que têm parte escalar nula, isto é O conjugado do quaternião é obtido pelo simétrico da parte vectorial e é dado por A soma e subtracção de quaterniões é definida como a soma ou subtracção das componentes correspondentes dos quaterniões, embora o resultado não seja um quaternião de rotação. Pelas propriedades apresentadas anteriormente e, pela propriedade distributiva da multiplicação, defina-se um novo quaternião c = c1 + ic2 + jc3 + kc4 , o produto dos quaterniões q e c é dado por q ◦ c = (q1 c1 − q2 c2 − q3 c3 − q4 c4 ) + (q1 c2 + q2 c1 + q3 c4 − q4 c3 )i + (q1 c3 − q2 c4 + q4 c2 + q3 c1 )j + (q1 c4 + q2 c3 − q3 c2 + q4 c1 )k c1 q1 −q2 −q3 q4 q 2 q1 −q4 q3 c2 = q3 q4 q1 −q2 c3 = q4 −q3 q2 (2.36) c4 q1 c1 −c2 −c3 −c4 c2 c1 c4 −c3 c3 −c4 c1 c2 c4 c3 −c2 c1 q1 q2 q3 q4 . (2.37) De notar que a multiplicação de quaterniões, tal como as outras representações de atitude, não é comutativa , isto é, q ◦ c 6= c ◦ q, embora seja associativa: d ◦ (q ◦ c) = (d ◦ q) ◦ c. A norma de um quaternião é dada por kqk = q ◦ q∗ = q12 + q22 + q32 + q42 . (2.38) 23 2.1. Representação da Orientação O inverso do quaternião q, designado por q−1 é obtido por q−1 = q∗ qv q∗ qs − 2 , = = 2 2 2 2 2 ∗ kqk q◦q q1 + q2 + q3 + q4 q1 + q2 + q32 + q42 (2.39) visto que os quaterniões unitários (que surgem, neste trabalho, como uma alternativa para representação de rotações) satisfazem a condição kqk = q12 + q22 + q32 + q42 = 1, então q−1 = q∗ . (2.40) De facto, a construção do quaternião unitário surge do Teorema de Euler que afirma que o movimento genérico de um corpo rígido com um ponto fixo, é equivalente a uma única rotação em torno de um qualquer eixo que atravesse esse ponto. O quaternião q pode ser expresso na forma vectorial, tal como (2.41) q = q1 + qv , sendo esta forma muito útil para se conseguir uma representação compacta das operações de quaterniões. O produto pode ser reescrito da forma q ◦ c = q1 c1 − hqv , cv i + q1 cv + c1 qv + qv × cv , (2.42) onde h, i representa a operação produto interno e (×) representa a operação produto externo. Tendo como base o quaternião q, podem-se construir as seguintes matrizes " # " # ′ q1 −q′v q −q 1 v Υq = e Υ∗q = , (2.43) qv (q1 I3 + [qv ×]) qv (q1 I3 − [qv ×]) que facilita a conclusão de que Υq∗ = Υ′q e Υ∗q∗ = Υ∗q . Recorrendo às matrizes Υq e Υ∗q , o produto dos quaterniões pode ser expresso como ′ q ◦ c = Υq c = Υ∗c q, (2.44) que são as matrizes escritas nas equações (2.36) e (2.37). Por multiplicação directa, pode também ser mostrado que Υq e Υ∗c são comutativas, Υq Υ∗c = Υ∗c Υq . Rotações Recorrendo à estrutura do quaternião, a transformação de um vector visto no referencial {B} para coordenadas do referencial {A}, é dada por A B A −1 pq = A B q ◦ pq ◦ B q , (2.45) onde pq = (0, p) representa o quaternião auxiliar com parte vectorial correspondente às coordenadas do ponto e parte escalar nula, A B q é o quaternião que descreve a orientação −1 do referencial {B} em relação ao referencial {A} e A é o recíproco do quaternião A Bq B q. A composição e a inversa das transformações é dada por A Cq = −1 A B = Bq ◦ C q A B Bq ◦ C q B −1 A −1 ◦ Bq . Cq (2.46) 24 Capítulo 2. Representação da Orientação e Referenciais de Navegação A equação (2.45) pode ser escrita recorrendo à equação (2.44) A onde pq = Υq Υ∗q∗ B pq q1 −q2 −q3 q4 q 2 q1 −q4 q3 = q3 q4 q1 −q2 q4 −q3 q2 q1 Υq Υ∗q∗ = q1 q2 q3 q4 −q2 q1 −q4 q3 −q3 q4 q1 −q2 −q4 −q3 q2 q1 " # 0 , p 1 0 0 0 2 2 2 2 0 q1 + q2 − q3 − q4 2(q2 q3 − q1 q4 ) 2(q1 q3 + q2 q4 ) 2 2 2 2 0 2(q2 q3 + q1 q4 ) q1 − q2 + q3 − q4 2(q3 q4 − q1 q2 ) 0 2(q2 q4 − q1 q3 ) 2(q1 q2 + q3 q4 ) q12 − q22 − q32 + q42 (2.47) , (2.48) ficando a matriz de rotação desejada na matriz 3 × 3 inferior direita. Da análise anterior, a matriz de rotação que transforma vectores expressos no referencial {B} em vectores expressos no referencial {A}, pode ser obtida a partir do quaternião A B q recorrendo à expressão, definida em [66] q12 + q22 − q32 − q42 2(q2 q3 − q1 q4 ) 2(q1 q3 + q2 q4 ) A 2(q2 q3 + q1 q4 ) q12 − q22 + q32 − q42 2(q3 q4 − q1 q2 ) B R(q) = 2(q2 q4 − q1 q3 ) 2(q1 q2 + q3 q4 ) q12 − q22 − q32 + q42 (2.49) ou de forma mais compacta A B R(q) = q12 − kqv k2 I3 + 2qv qv′ + 2q1 [qv ×] . (2.50) Da equação (2.49),obtém-se a expressão do quaternião a partir dos elementos da matriz de rotação r23 − r32 1 qv = r31 − r13 4qs (2.51) r12 − r21 √ qs = 12 1 + r11 + r22 + r33 . De uma rotação em torno de um eixo, obtêm-se as componentes do quaternião através da expressão definida em [67] kx qv = sin Λ2 ky (2.52) kz qs = cos Λ2 . onde Λ ∈ [0, π] é o ângulo de rotação e k = [kx , ky , kz ]′ é o vector de norma unitária que define o eixo de rotação. 25 2.2. Definição dos Referenciais Dinâmica De referir a linearidade da equação da dinâmica do quaternião dada por 1 dA Bq = M dt 2 B A ωB A (2.53) B q, onde A B q é o quaternião que representa a orientação do referencial {B} em relação ao referencial {A}, B A ω B = [p, q, r]′ é a velocidade angular do referencial {B} em relação B A ω B é dada por ao referencial {A}, expressa do referencial {B} e M M 2.2 B A ωB = " B ′ 0 −B A ω B B A A ωB × ωB # = 0 −p −q −r p 0 −r q q r 0 −p r −q p 0 . (2.54) Definição dos Referenciais Os sistemas de navegação necessitam de transformações de grandezas medidas e calculadas entre vários referenciais. O objectivo desta secção prende-se com a definição desses mesmos referenciais. 2.2.1 Referencial Inercial Um referencial inercial é um referencial onde são válidas as leis de Newton. É um referencial não acelerado, mas que pode possuir movimento linear uniforme. A sua origem é arbitrária e os seus eixos coordenados podem estar direccionados para quaisquer três direcções mutuamente perpendiculares. Todos os sensores inerciais produzem medidas relativas a um qualquer referencial inercial, mas descritas ao longo dos eixos sensíveis do sensor. É em geral conveniente definir-se um referencial inercial com origem no centro da Terra (Earth Centered Inertial, ECI) e com o eixo do x a apontar para a vernal equinox, o eixo do z alinhado com o eixo de rotação da Terra e o eixo do y definido de forma a completar um sistema de coordenadas segundo a regra da mão direita. No contexto deste trabalho, o referencial ECI vai ser considerado como um referencial inercial genuíno representado por {I}. 2.2.2 Referencial da Terra Este referencial é fixo em relação à Terra e acompanha a sua rotação. No contexto deste trabalho, vai ser descrito por {E} (Earth). Os seus eixos descrevem um movimento de rotação em relação ao referencial inercial com frequência I ωE ≈ 1 + 365.25 ciclo (365.25)(24) hora 2π rad/ciclo 3600 s/hora = 7.292115 × 10−5 rad/s, (2.55) 26 Capítulo 2. Representação da Orientação e Referenciais de Navegação devido aos 365.25 dias de rotação da Terra por ano mais uma revolução completa em torno do Sol. Em relação ao referencial inercial, a velocidade angular da Terra (referencial {E}) E I descrita no referencial {E} é dada por ω E = [0, 0, 1]′ I ωE . Devido ao seu movimento de rotação, que é ilustrado na Figura 2.2(a), o referencial {E} não pode ser considerado como um referencial inercial. Dois sistemas de coordenadas são comuns no referencial {E}, coordenadas rectangulares (ou cartesianas) e as geodésicas elipsoidais. As coordenadas rectangulares, ilustradas na Figura 2.2(b), são descritas pelos três parâmetros habituais E [x, y, z], com origem no centro de massa da Terra e com o eixo do x a estender-se através da intersecção entre o Meridiano Principal (0 graus de longitude) e o Equador (0 graus de latitude). O eixo do z estende-se através do Pólo Norte (i.e., é coincidente com o eixo de rotação da Terra). O eixo do y define-se de forma a completar um sistema de coordenadas segundo a regra da mão direita, passando através do Equador num ponto com 90 graus de longitude. (a) Rotação do referencial {E} em rela- (b) Sistema de coordenadas rectangulares do referenção ao {I}. cial {E}. Figura 2.2: Relação entre os referenciais {I} e {E}. As coordenadas geodésicas elipsoidais são expressas nas coordenadas (L, λ, h) tal como apresentadas nas Figuras 2.3(b) e 2.3(a), onde L representa latitude, λ representa longitude e h representa a altitude acima do elipsóide de referência. Define-se latitude como o ângulo entre a normal ao elipsóide no ponto de interesse e o plano do Equador. A longitude é o ângulo rectilíneo entre o plano do meridiano internacional de referência e o plano do meridiano do ponto de interesse. A altitude é a distância entre a superfície do elipsóide e o ponto de interesse, ao longo da normal à superfície do elipsóide. A necessidade da definição de coordenadas geodésicas prende-se com o facto de o geóide terrestre ser habitualmente aproximado por um elipsóide de revolução em torno do seu eixo menor, visto que o elipsóide de revolução é a forma geométrica simples que melhor se aproxima e ajusta à forma irregular e achatada da terra. Para cada aplicação, é necessário recorrer a um conjunto consistente de parâmetros que modelem a gravitação e a forma da Terra (elipsóide). O valor apresentado em (2.55) para I ωE deve ser considerado apenas como uma aproximação, sendo possível considerar outros modelos mais precisos. No caso particular do sistema de navegação proposto neste trabalho, o recurso a modelos 27 2.2. Definição dos Referenciais (a) Secção do elipsóide de revolução. (b) Coordenadas geodésicas elipsoidais e rectangulares. Figura 2.3: Elipsóide e sistemas de coordenadas habituais. mais precisos e complexos não acrescenta nenhum aumento de desempenho, visto que as perturbações e não idealidades do sistema mascaram as diferenças introduzidas. 2.2.3 Referencial Geográfico O referencial geográfico é definido localmente, em relação ao geóide da Terra. A origem do referencial geográfico move-se com o veículo e define-se como a projecção da origem do veículo no elipsóide de referência. O eixo do z geográfico aponta para o interior do elipsóide ao longo da sua normal. O eixo do x aponta para o Norte verdadeiro (i.e., ao I longo da projecção do vector de velocidade angular da Terra ω E no plano ortogonal ao eixo do z). O eixo do y aponta para Este e completa um referencial ortogonal segundo a regra da mão direita. Visto que a origem do referencial geográfico viaja com a plataforma, os eixos deste referencial rodam quando a mesma viaja segundo as direcções Norte ou Este; logo, o referencial geográfico também não é um referencial inercial. O referencial geográfico é muito relevante para aplicações relacionadas com navegação, visto que é usual um utilizador necessitar de ter uma solução para a atitude em relação às direcções Norte, Este e vertical local. Para a posição e velocidade, fornece um conjunto conveniente de eixos de medida, mas não é utilizado como um referencial. Este referencial tem uma grande desvantagem para aplicações de navegação perto dos pólos, visto que, apresenta uma singularidade em cada pólo pois, os eixos Norte e Este não estão definidos nestes dois locais [68]. 2.2.4 Referencial Geocêntrico O referencial geocêntrico é semelhante ao referencial geográfico. A principal diferença reside no facto de o eixo do z do referencial geocêntrico apontar para o centro da Terra. O eixo do x aponta para o Norte verdadeiro no plano ortogonal ao eixo do z. O eixo do y aponta para Este e completa um sistema de coordenadas ortogonal rectangular segundo a regra da mão direita. Tal como no referencial geográfico, os eixos do referencial geocêntrico também rodam quando a plataforma se move segundo as direcções Norte e 28 Capítulo 2. Representação da Orientação e Referenciais de Navegação Este, portanto, também não pode ser considerado um referencial inercial. 2.2.5 Referencial do Plano Tangente É determinado ajustando um plano tangente ao elipsóide de referência num qualquer ponto de interesse, para medidas locais, da superfície do mesmo. Este ponto torna-se a origem do referencial local. O eixo do x aponta para o Norte verdadeiro. O eixo do z aponta para o interior da Terra, perpendicularmente à superfície do elipsóide de referência. O eixo do y é definido de modo a completar um sistema de coordenadas segundo a regra da mão direita; logo, aponta para Este, tal como se ilustra na Figura 2.4. Para um sistema estacionário, localizado na origem do referencial do plano tangente, os referenciais geográfico e do plano tangente são coincidentes. Quando um sistema se encontra em movimento, a origem do referencial do plano tangente mantém-se fixa, enquanto a origem do referencial geográfico é a projecção da origem da plataforma no elipsóide de referencia da Terra. O referencial do plano tangente é normalmente utilizado para navegação local (e.g., navegação em relação a uma estrada, aterragem de aviões, etc). Figura 2.4: Referencial do plano tangente e sua relação com o referencial {E}. 2.2.6 Referencial do Corpo O referencial do corpo encontra-se solidário com o veículo e é composto pelos habituais eixos em torno dos quais são medidos os ângulos de yaw, pitch e roll. É usual a origem deste referencial coincidir com o centro de massa do veículo visto que simplifica a dedução da cinemática do mesmo, e é também conveniente para a síntese de sistemas de controlo. De notar que a origem nem sempre coincide com a localização do sistema de navegação. Como se ilustra na Figura 2.5, o eixo do x (roll ) aponta para a frente, o eixo do z aponta para baixo (yaw ) e finalmente o eixo do y aponta para o lado direito, tudo em relação ao veículo. 29 2.3. A Forma da Terra e Modelo da Gravidade Figura 2.5: Eixos do referencial do corpo. Tal como indicado na Figura 2.5, o vector de velocidade angular do referencial do corpo em referencial inercial expressa no referencial do corpo é designado por relação ao B I ′ ω B = [p, q, r] onde p é a velocidade angular em torno do eixo do x, q é a velocidade angular em torno do eixo do y, e r é a velocidade angular em torno do z. O sentido positivo de cada velocidade angular é definido segundo a regra da mão direita. O referencial do corpo também não é um referencial inercial, já que o veículo pode sofrer acelerações ou velocidade angular não nula. 2.3 2.3.1 A Forma da Terra e Modelo da Gravidade Campo Gravitacional Foi Sir Isaac Newton (1642 − 1727) quem primeiro explicou, nos seus Princípios Matemáticos da Filosofia Natural publicados em 1687, recorrendo à Lei da Gravitação Universal, que uma massa atrai qualquer outra massa com uma força cuja magnitude é proporcional ao produto das duas massas e é inversamente proporcional ao quadrado das distância entre elas. Esta lei explica tanto a queda dos corpos atraídos pela Terra, como o movimento dos planetas atraídos pelo Sol e vem representada pela fórmula F12 = − Gm1 m2 r12 , kr12 k3 (2.56) GMe m re2 kre2 k3 (2.57) onde F12 representa a força gravitacional que m1 exerce em m2 . Esta força é também designada por atracção gravitacional ou de Newton, onde G é a Constante de Gravitação Universal, m1 e m2 as massas dos dois corpos cuja interacção estamos a analisar e r12 = r2 − r1 é a posição do centro de massa r2 em relação ao centro de massa de r1 . No contexto deste trabalho, consideram-se idênticas as massas inerciais e gravitacionais. O sinal de menos no lado direito de (2.56) indica que direcção da força é simétrica da de r12 (i.e., m2 é atraído para m1 ). Em particular, se m1 = Me representar a massa da Terra e fazendo m2 = m, então a atracção gravitacional da Terra sobre m vem Fe2 = − e a atracção gravitacional de m sobre a Terra é 30 Capítulo 2. Representação da Orientação e Referenciais de Navegação F2e = − GMe m r2e . kr2e k3 (2.58) GMe I re2 , kre2 k3 (2.60) Recorrendo à Segunda Lei de Newton, as equações (2.57) e (2.57) originam as seguintes equações diferenciais Gm I I r̈e = − r2e , (2.59) kr2e k3 I r̈2 = − então, porque, re2 = r2 − re = −r2e , fica I r̈e2 = − ≈ G(Me + m) I re2 kre2 k3 G(Me ) I re2 = − kre2 k3 (2.61) I G, onde I G é a aceleração gravitacional definida como I G=− G(Me ) I re2 . kre2 k3 (2.62) Este modelo relativamente simples da gravitação é derivado para um campo de força central. Seria aproximadamente válido para veículos no espaço, mas, para veículos perto da superfície terrestre são necessários modelos gravitacionais mais detalhados, como o que é apresentado na Secção 2.3.5. 2.3.2 Campo Gravítico O vector de gravidade é a soma vectorial da força gravitacional da massa da Terra e da força centrífuga originada pelo seu movimento de rotação. As dimensões relativas e a orientação destas duas forças é dependente da localização. Por exemplo, a força centrifuga é máxima no Equador e nula ao longo do eixo de rotação da Terra. Na Figura 2.6 apresenta-se a relação entre estas três acelerações, embora a magnitude não esteja à escala. Figura 2.6: Vector de gravidade real. Analiticamente, este somatório de vectores pode ser representado da seguinte forma 31 2.3. A Forma da Terra e Modelo da Gravidade I I g = I G(r) − I ΩE I ΩE r, I ω E × é a forma skew-symmetric de (2.63) I I ω E e r é o vector de posição onde I ΩE = geocêntrico. A superfície geodésica da Terra é definida como sendo sempre normal ao vector da gravidade (i.e., uma superfície equipotencial em relação à força da gravidade). Esta superfície é diferente da superfície topográfica real terrestre e pode ser imaginada como a forma média que a Terra teria se a sua superfície fosse totalmente coberta pelas águas dos oceanos. Na secção seguinte é apresentada, como mais detalhe, a referida superfície, designada por Geóide terrestre. 2.3.3 O Geóide Para descrever a forma da Terra pode-se recorrer a dois conceitos distintos: o primeiro está relacionado com a descrição geométrica da superfície física (montanhas, vales, etc), o segundo prende-se com o estudo das superfícies equipotenciais do campo gravítico real. Numa primeira aproximação, poder-se-ia afirmar que a Terra é esférica (tal como vista do espaço). Em segunda aproximação, a Terra é um elipsóide de revolução (achatada nos pólos). O facto de a Terra ter um movimento de rotação, causa um empolamento equatorial, o que coloca de lado a hipótese da Terra possuir uma superfície esférica. Se a Terra estivesse completamente coberta pelos oceanos, então, ignorando os ventos e as correntes internas, a superfície deveria reflectir as forças devidas à rotação e à atracção gravitacional de corpos externos, como o Sol, a Lua e efeitos surgidos do interior. Quando os efeitos de maré são removidos, a forma da superfície é devida a variações na densidade do interior. Rigorosamente, a superfície física da Terra é definida pelo Geóide, superfície que coincide, em média, com a superfície livre dos oceanos, descontados os efeitos meteorológicos. Uma ilustração do Geóide terrestre é apresentada na Figura 2.7(a). Referimo-nos a ela quando falamos de alturas acima do nível do mar. O nível médio do mar é uma superfície equipotencial. Sendo o Geóide uma superfície equipotencial do Campo Gravítico Real da Terra, a gravidade é-lhe perpendicular em todos os pontos. Estruturas da crusta, continentes, regiões montanhosas e cristas médias oceânicas, heterogeneidades do manto influenciam a forma do Geóide. Designa-se por ondulação do Geóide ao afastamento do Geóide em relação ao elipsóide de referência, segundo a sua normal. A forma do Geóide é, no presente, bastante conhecida, podendo variar entre os 70 m acima do elipsóide, no Atlântico, e os 100 m abaixo do Elipsóide, no oceano Índico. As ondulações do Geóide reflectem as irregularidades da crusta, mas principalmente, a variação das densidades das massas da crusta e do manto (baseado em [69, 70]). 2.3.4 Elipsóide WGS84 O WGS84 (World Geodetic System, estabelecido em 1984) é um referencial global associado ao sistema de posicionamento GPS. Foi definido pela U.S. Defense Mapping Agency (actual National Imagery and Mapping Agency, NIMA), este sistema é utilizado pelo próprio sistema GPS na determinação de efemérides radiodifundidas, nas operações 32 Capítulo 2. Representação da Orientação e Referenciais de Navegação (a) O Geóide terrestre. (b) Superfícies terrestres de interesse. Figura 2.7: O Geóide terrestre e outras superfícies de interesse. dos satélites e no cálculo convencional de coordenadas. O sistema teve como base um modelo gravitacional da Terra. Assim sendo, o elipsóide associado é um elipsóide geocêntrico equipotencial de revolução, ou seja, está-lhe associado um campo gravítico normal com uma rotação definida. Os parâmetros do modelo geodésico são determinados recorrendo ao método dos mínimos quadrados baseado em dados experimentais recolhidos nas observações existentes até 1984 de vários sistemas, nomeadamente, de um sistema anterior, o sistema TRANSIT1 [71]. Ao longo dos últimos anos, sofreu algumas revisões do seu elipsóide ao nível do semi-eixo maior, da excentricidade e do seu centro (extraído de [70]). O modelo WGS84 é definido especificando quatro constantes, apresentadas na Tabela 2.1 [72]. A excentricidade do elipsóide que aproxima o Geóide é determinada pela atracção gravitacional e pela velocidade angular da Terra. Assim, como já tinha sido dado a entender anteriormente, os parâmetros que definem o modelo geodésico necessitam de uma definição consistente para possibilitarem a definição do elipsóide e do modelo de gravidade. Parâmetro Tabela 2.1: Parâmetros do WGS84. Símbolo Valor Raio Equatorial Inverso do achatamento Velocidade Angular Constante Gravitacional a 1/f I ωE GM 6378137.0 298.257223563 7.292115 × 10−5 3.986004418 × 1014 Unidades [m] [rad/s] [m3 /s2 ] Uma elipse de referência pode ser definida recorrendo a dois parâmetros, sendo 1 TRANSIT, também designado por Navy Navigation Satellite System, foi desenvolvido no inicio da década de 1960 pelo The Johns Hopkins Applied Research Lab. 33 2.3. A Forma da Terra e Modelo da Gravidade tipicamente o semi-eixo maior a e qualquer um dos que se apresentam em seguida semi-eixo menor = b, excentricidade = e = achatamento = f = q a2 −b2 a2 a−b , a = p f (2 − f ), (2.64) Baseado nas constantes definidas na Tabela 2.1, os seguintes parâmetros da elipse podem ser calculados f = 0.00335281, b = a(1 − f ) = 6356752.314m, p f (2 − f ) = 0.08181919. e = (2.65) Para cada localização especifica, podem ser definidas várias altitudes tal como se ilustra nas Figuras 2.7(b) e 2.3(a). A altitude do Geóide (ondulação do Geóide) N é a distância do elipsóide até ao Geóide, ao longo da normal ao elipsóide. A altitude ortométrica H representa a altitude do veículo acima do Geóide. É, por vezes, designada por elevação. A altitude elipsoidal pode ser expressa por h = H + N . 2.3.5 Modelo Gravítico da Terra O vector da gravidade é função da posição visto que, a atracção gravitacional é função do raio geocêntrico, da dependência da aceleração centrípeta da latitude e do raio, e porque a distribuição da massa terrestre é não uniforme. Os parâmetros geodésicos e do modelo gravítico do WGS84 já foram definidos na Tabela 2.1. No referencial geográfico, o modelo para o vector gravítico local desenvolvido pela Defense Mapping Agency que é preciso na superfície do elipsóide WGS84 é dado por 0 ζg (2.66) g = 0 + −ηg , δg γ(L) onde L representa a latitude geodésica, γe = 9.7803267715[m/s2 ] é a gravidade efectiva equatorial e 1 + 0.001931851353 sin2 (L) γ(L) = γe p , 1 − 0.0066943800229 sin2 (L) (2.67) sendo a forma em γ(L) é apresentada conhecida por Fórmula Gravítica Elipsoidal WGS84. Na equação (2.66), o vector [ζg , −ηg , δg ] representa perturbações locais no vector de gravidade em relação à normal do elipsóide. Quer g, quer [ζg , −ηg , δg ] são funções da posição, mas são omitidos com o objectivo de simplificar a notação. Para uma definição detalhada deste modelo gravítico remete-se o leitor para [72]. Capítulo 3 Fundamentos de Navegação Terrestre O presente Capítulo apresenta uma descrição de alguns dos métodos e instrumentos de navegação terrestre mais comuns, entre os quais se destacam, a navegação inercial, por satélite e a navegação com recurso ao Campo Magnético Terrestre. A primeira Subsecção pretende fazer uma descrição histórica, apresentando os avanços científicos mais relevantes, que permitiram ao Homem navegar no planeta Terra. 3.1 Introdução Os primeiros exploradores ao regressarem das suas viagens, forneciam a quem desejasse percorrer o mesmo percurso, instruções detalhadas sob a forma de mapas onde desenhavam a sua rota, com realce para marcos ou pontos de referência, que ilustravam rios, montanhas, zonas perigosas, etc. Para o caso das cartas marítimas, estas deveriam evidenciar zonas de baixios, zonas de condições meteorológicas habitualmente severas, ilhas, etc. Estes documentos tornaram-se mais detalhados e passaram a permitir identificar um local no globo terrestre, visto que, foi desenvolvido um sistema de coordenadas global que se apresenta num mapa como uma grelha de círculos de latitude e longitude. A navegação em mar aberto, em oposição à navegação junto à costa, onde os marcos geográficos, os faróis luminosos podem existir, cria um conjunto de novos desafios bastante complexos. Desde cerca do século XI, que se faz uso do campo magnético terrestre (CMT) (recorrendo a uma bússola magnética) para obter um rumo, ainda que de forma pouco precisa. No século XIV, era possível obter o valor da latitude, recorrendo à posição de estrelas. Durante o século XVIII surgiram instrumentos como o sextante, que permitiram a localização com bastante precisão de corpos celestes. Para obter a longitude, o processo não é tão "simples"como o da latitude, já que a posição dos corpos celestes, depende da posição angular da Terra em relação aos mesmos, isto é, da hora do dia. A longitude é medida em relação a uma referencia arbitrária, tendo sido escolhida para tal, o meridiano que passa em Greenwich na Inglaterra. Para o cálculo da longitude, é necessário que os navegadores tenham conhecimento sobre a hora local e a hora em Greenwich (Greenwich Mean Time, GMT). A hora local, pode ser obtida por observação do sol, mas a hora GMT requer a observação da posição lunar relativamente a estrelas [73] o que envolve cálculos bastante complexos. A solução que se apresentava como a mais razoável era a de manter um relógio a bordo com a hora GMT, solução essa que originou uma autêntica 34 3.1. Introdução 35 corrida tecnológica para a obtenção de um relógio fiável nos séculos XVI e XVII, para determinação da longitude com uma precisão de 30 milhas náuticas. Foi Salomon Coster, um relojoeiro holandês, que em 1675, construiu o primeiro relógio adequado à navegação maritima desenvolvido pelo cientista Christiaan Huygens, também de origem holandesa. A barreira das 30 milhas náuticas de erro no cálculo da longitude, ao fim de dois meses no mar, só foi quebrada na década de 1760, por John Harrison. Na década de 1900, assistiu-se à substituição da bússola magnética por outro dispositivo denominado por girobússola. Na realidade, a ideia deste dispositivo surgiu cerca de duas décadas antes, mas os dispositivos construídos não provaram ser viáveis. É um instrumento que apresenta grandes benefícios para a navegação marítima e é semelhante a um giroscópio. Pode-se afirmar que é uma bússola que encontra o Norte verdadeiro recorrendo a um disco alimentado electricamente, que roda a alta velocidade e a forças de atrito para tirar partido da rotação da Terra. Os direitos à patente foram alvo de uma acesa disputa entre o alemão Hermann Anschütz-Kämpfe e o norte americano Elmer Ambrose Sperry sendo que, o primeiro saiu vitorioso em 1915. Na Figura 3.1 apresenta-se um exemplar do referido instrumento. A girobússola apresenta pelo menos duas grandes vantagens operacionais em relação à bússola convencional: encontra o Norte verdadeiro (i.e., a direcção do eixo de rotação Terrestre em oposição ao Norte magnético); é muito menos vulnerável a campos magnéticos externos (e.g. tais como os campos criados pelos materiais ferromagnéticos, que se podem encontrar nos cascos dos navios). Figura 3.1: Corte de uma girobússola desenvolvida pelo alemão Hermann AnschützKämpfe. Nas primeiras décadas do século XX, quando as aeronaves começaram a voar através dos oceanos, começaram por navegar recorrendo à bússola magnética e a indicadores de velocidade em relação ao ar. Com o aparecimento de sistemas de radar que permitiam leituras de velocidade em relação ao solo de melhor qualidade (recorrendo ao efeito de Doppler ), era comum fazer navegação do tipo deduced reckoning (normalmente denominado por "dead"reckoning 1 ). Devido à elevada velocidade a que viaja uma aeronave, não era prático para um navegador humano estar constantemente a fazer medições de posição, 1 Técnica comum na navegação maritima onde um navio inicia o seu percurso de uma latitude e longitude conhecidas e viaja numa direcção e velocidade também conhecidas durante um determinado período de tempo. 36 Capítulo 3. Fundamentos de Navegação Terrestre então surgiram sistemas de navegação terrestres baseados em faróis de ondas de rádio, como é o caso dos sistemas LORAN-C (Long Range Navigation) [74] e OMEGA [68]. Para as aeronaves com fins militares ou mísseis intercontinentais, é preferível que não dependam de faróis de rádio, visto que em tempos de guerra, estes podem ser destruídos ou corrompidos pelo inimigo. É ainda importante também que sejam "silenciosos"do ponto de vista electromagnético (não recorrerem a radares para obtenção de medidas de velocidade por efeito de Doppler ) para que a sua detecção seja mais difícil. Em suma, pretende-se um sistema de navegação que forneça posição, velocidade e orientação, que não tenha qualquer dependência de tecnologia externa e que funcione em todas as condições meteorológicas, no ar, no espaço ou submerso. Os sistemas de navegação inerciais descritos na secção seguinte, servem este propósito. 3.2 3.2.1 Navegação Inercial Introdução O nome Navegação Inercial, tem origem na utilização de princípios inerciais por determinados tipos de sistemas de navegação. A sua história começa com o inglês Sir Isaac Newton no século XVII, que introduziu os conceitos de inércia, aceleração e todos os outros que no presente são denominados por Mecânica Clássica. A história continua com o físico francês Foucault ao criar um dispositivo por designado como giroscópio em 1851. O capítulo seguinte foi escrito pelo professor alemão de Mecânica Clássica, Maximilian Schuler, ao provar matematicamente a possibilidade de eliminar os erros nas girobússolas, causados pela aceleração lateral. Visto que um sistema de navegação inercial é um mecanismo bastante complexo, a sua criação foi morosa e faseada, logo, o último capítulo da sua história não pode ser atribuído a um único individuo ou grupo. Foi na realidade o resultado do esforço de vários indivíduos e grupos, que trabalhando de forma mais ou menos independente, e na mesma época (a partir da década de 1940). Embora a escrita da história possa sempre ter espaço para controvérsia, é geralmente aceite como um dos nomes mais relevantes, quer por contributos teóricos quer por experimentais, o nome do norte-americano Dr. Charles S. Draper. Entre a lista de indivíduos com contributos relevantes, encontram-se os seguintes: Lord Kelvin (inglês), Dr. H. Anschütz-Kämpfe (alemão), Dr. E. A. Sperry (norte-americano), Capitão J. M. Boykow (austríaco a que é atribuída a ideia de que um sistema de navegação inercial podia ser construído recorrendo à dupla integração da aceleração em relação ao tempo) e Dr. S. Reisch (alemão). Primeiras Aplicações de Sistemas de Navegação Inercial Os primeiros sistemas de navegação inercial, foram utilizados nos mísseis alemães V1 e V2 durante a Segunda Guerra Mundial. Depois da guerra, um grupo de cientistas alemães supervisionados por Werner Von Braun, desenvolveram esta tecnologia para equipar misseis balísticos intercontinentais e naves espaciais. Tal como mencionado anteriormente, outro grupo de cientistas liderados por Charles Draper no Massachusetts Institute of Technology, conseguiu importantes avanços no desenvolvimento de sistemas de navegação inerciais, tendo testado com sucesso o seu primeiro sistema num voo em 37 3.2. Navegação Inercial 1949, seguido em 1954 por um sistema de navegação para aplicações no mar, o Navy Ship’s Inertial Navigation System. Em 1958 o submarino nuclear Nautilus, conseguiu atravessar com sucesso a calota de gelo do Pólo Norte, recorrendo ao navegador Autonetics XN6. Na década de 1960, o programa Apollo da NASA levou os sistemas de navegação inerciais para aplicações no espaço e no presente estes sistemas encontram-se em aplicações que vão desde munições "inteligentes" a sistemas de navegação inerciais pessoais, que cabem na palma da mão [75, 76, 77]. Física da Navegação Inercial Para um melhor entendimento dos fenómenos físicos por detrás dos sistemas de navegação, é útil ter presente as Leis de Newton. A 1a Lei de Newton, também conhecida por Lei da Inercia, afirma que um objecto em repouso, tende a ficar em repouso e que um objecto em movimento uniforme tende a permanecer em movimento uniforme se a resultante das forças externas aplicadas for nula. Já a 2a Lei de Newton afirma que num referencial inercial a aceleração r̈ de uma massa m é proporcional à resultante das forças aplicadas FI FI = mr̈. (3.1) Dispondo de um sensor que tenha a capacidade de medir a aceleração, seria possível calcular a variação de velocidade e posição através de sucessivas integrações matemáticas em relação ao tempo. A aceleração pode ser medida com um dispositivo denominado por acelerómetro (que, como se vai apresentar mais à frente, mede uma grandeza denominada por força específica), que em geral, são instalados nos sistemas de navegação inercial em conjunto de três tendo cada um deles a capacidade de medir acelerações segundo um eixo. Mecanicamente, são instalados de forma a que os seus eixos sensíveis sejam mutuamente ortogonais. Para se conseguir navegar em relação a um referencial inercial, é fundamental conhecer as direcções segundo as quais, os eixos dos acelerómetros estão a fazer medidas de aceleração. Os sensores que permitem medir os movimentos de rotação de um corpo, são designados por giroscópios, e permitem obter a orientação dos acelerómetros em todos os instantes. Assim é possível transformar as medidas de aceleração para o referencial em relação ao qual se está a navegar e posteriormente integrar em relação ao tempo uma e duas vezes para se obter a velocidade e posição, respectivamente (consultar Figura 3.2(b)). Os princípios básicos de funcionamento das duas classes habituais de sistemas de navegação inercial, descritas em maior detalhe na Secção 3.2.3, são ilustrados na Figura 3.2. Estes dois tipos de sensores, os acelerómetros e os giroscópios, devido a fazerem medidas em relação a referenciais inerciais, são vulgarmente designados por sensores inerciais e constituem a base de uma Inertial Measuring Unit (IMU). É comum designar-se por Inertial Sensor Assembly (ISA) a uma montagem rígida de sensores inerciais para que os mesmos mantenham uma orientação relativa constante. As configurações habituais contêm três acelerómetros e três giroscópios com montagens ortogonais. Em suma, uma IMU, é constituída por uma ISA, por toda a electrónica de suporte, controlo e calibração da mesma, que pode incluir controlo térmico, condicionamento de sinal e interface entrada/saída. Uma IMU pode também incluir um processador. 38 Capítulo 3. Fundamentos de Navegação Terrestre (a) Algoritmo simplificado para sistema de navega- (b) Algoritmo simplificado para sistema de naveção inercial com plataforma estabilizada. gação inercial com plataforma analítica. Figura 3.2: Algoritmos de navegação para plataformas inerciais. Já um Inertial Navigation System (INS) consiste de pelo menos mais um componente, que é normalmente designado por Computador de Navegação onde é calculada a aceleração da gravidade (não medida pelos acelerómetros) e é feita a dupla integração numérica em relação ao tempo para se obter a velocidade e posição do veículo onde está instalado. É normal incluir os sistemas de interface com o utilizador sob a forma de consolas gráficas para interface com humanos ou interface digital/analógico para ligação a outros sistemas de comando e controlo do veículo. Vantagens e Desvantagens dos Sistemas de Navegação Inercial Quando comparados com outros métodos de navegação, os sistemas inerciais apresentam as seguintes vantagens [78]: • as indicações de posição e velocidade são instantâneas e contínuas, permitindo a sua utilização em sistemas caracterizados por dinâmicas com grande largura de banda. • é completamente autónoma uma vez que se baseia em medidas de aceleração linear e angular, que são obtidas no interior do próprio veículo. É um sistema que não radia ondas electromagnéticas e não está sujeito a sabotagem exterior. • a informação de navegação pode ser obtida para todas as latitudes, incluindo as regiões polares, independentemente das condições meteorológicas e sem necessidade de estações terrestres. • um sistema inercial disponibiliza informação de velocidade e posição em relação a um referencial terrestre assim como a atitude do veículo em relação ao referencial terrestre local. As desvantagens principais associadas a um navegador inercial são [78]: • a posição e velocidade degradam-se com o tempo, quer o veículo esteja em movimento ou estacionário. • o equipamento de alto e de muito alto desempenho é extremamente dispendioso (as classes de alta performance que equipam sistemas como navios e submarinos militares e algumas naves espaciais podem atingir custos próximos de um milhão de euros [68]) 3.2. Navegação Inercial 39 • é necessário alinhar o equipamento antes de cada missão; este processo torna-se mais difícil para latitudes superiores a 75o e para veículos em movimento. • a precisão da navegação pode depender das manobras do veículo. 3.2.2 Sensores Inerciais Esta secção introduz de uma forma mais detalhada, a origem e o funcionamento dos sensores inerciais, o giroscópio e o acelerómetro. Giroscópio Ao trabalhar numa experiência simples para provar o movimento de rotação da Terra, o físico francês Léon Foucault introduziu em 1852 o termo Giroscópio para designar o instrumento capaz de observar esses movimentos. Para além do seu muito conhecido pêndulo, as suas pesquisas incidiam sobre giroscópios com suspensão à cardan (designadas na literatura anglo-saxónica por gimbals [79]) apercebendo-se que ao restringir, por exemplo, o movimento de um dos gimbals leva a indicadores específicos de diferentes componentes de rotação. Contudo, não foi Foucault que deu origem a este principio mecânico, sendo este tipo de dispositivos, bastante comuns nas escolas da França no século XIX. De facto, a criação deste instrumento é atribuída ao alemão J.G. Friedrich Bohnenberger em 1817, sendo o mesmo professor de matemática, astronomia e física na Universidade de Tübingen na Alemanha. O instrumento, designado por Máquina de Bohnenberger é apresentado na Figura 3.3(a). Um giroscópio mecânico convencional de três eixos, cujos componentes principais se apresentam na Figura 3.3(b), consiste de um rotor (volante ou toro) perfeitamente balanceado, livre para girar em torno de três eixos perpendiculares entre si, que se interceptam no seu centro de gravidade. Pode-se então dizer, que o giroscópio tem três graus de liberdade. Um efeito da Lei da Conservação do Momento Angular é a resistência à alteração da orientação do seu eixo de rotação do rotor. Assim, quando o giroscópio mecânico é sujeito a rotações, o rotor vai manter uma orientação constante em relação a um espaço inercial e os ângulos entre gimbals adjacentes vão alterar-se. Para medir a orientação da plataforma em movimento, podem ser colocados sensores de posição angular entre os gimbals adjacentes. De notar que o dispositivo descrito só determina a posição angular relativa, necessitando de ser inicialmente alinhada com um referencial conhecido Contrastando com os giroscópios mecânicos clássicos, a quase totalidade do giroscópios actuais (MEMS, ópticos), são na realidade giroscópios de velocidade (rate-gyros). Uma das grandes desvantagens dos giroscópios mecânicos clássicos reside no facto dos mesmos terem muitas partes móveis de maquinação precisa, que não só aumentam a complexidade do sistema, mas também evidenciam uma degradação no desempenho devido ao desgaste causado pela fricção. A capacidade de manufacturar instrumentos giroscópios de precisão, que estão suficientemente livres de fenómenos de deriva imprevisíveis, constitui o factor limitante do desempenho da tecnologia dos sistemas de navegação inerciais. De facto, a deriva de um giroscópio é a principal preocupação aquando do seu desenvolvimento, e esta é causada 40 Capítulo 3. Fundamentos de Navegação Terrestre (a) Máquina de Bohnenberger. (b) Giroscópio mecânico de três eixos (extraído de [80]). Figura 3.3: Máquina de Bohnenberger e giroscópio mecânico (extraído de [4]). por binários de precessão, que não pertencem aos sistemas de realimentação que mecanizam o seu funcionamento. De entre os motivos que provocam perda de desempenho num giroscópio, podem enumerar-se os seguintes: desequilíbrio de massas no rotor; gradientes termodinâmicos; desequilíbrio na flutuabilidade. A tecnologia actual recorre às seguintes técnicas para melhorar o desempenho de um giroscópio mecânico: componentes a flutuar num fluido que diminui a fricção e amortece vibrações; tolerâncias muito reduzidas na manufactura de peças; coeficientes de expansão térmica adequados; controlo de temperatura. Em seguida, apresenta-se um outro sensor essencial aos sistemas de navegação inercial, o acelerómetro. Acelerómetro Um acelerómetro fornece uma medida da diferença entre a aceleração em relação a um referencial inercial e a atracção gravitacional que actua no local onde se encontra o sistema de navegação. Um acelerómetro ideal é geralmente constituído por uma massa de prova confinada num espaço fechado que é livre de se mover em relação à estrutura do acelerómetro ao longo do seu eixo sensível, somente restrita por uma mola e por atrito. Para uma descrição mais detalhada sobre a tecnologia envolvida no desenvolvimento de acelerómetros reais, remete-se o leitor para bibliografia especializada, tal como [81, 77, 10]. Considere-se um acelerómetro construído através de um sistema clássico massamola-atrito, tal como o que é ilustrado na Figura 3.4. O vector de posição da massa m é p. A posição da caixa do acelerómetro é pc . A posição relativa da caixa em relação à massa é dada por δpc = p − pc . Para a seguinte análise, assume-se que δpc pode ser medido de forma rigorosa, sendo a posição de equilíbrio da massa m dada por δpc = 0. Na discussão que se segue, faz-se a distinção entre forças inerciais (i.e., aplicadas 41 3.2. Navegação Inercial ! " Figura 3.4: Modelo simplificado de um acelerómetro. fisicamente) e forças cinemáticas (e.g., gravidade). Na Figura 3.4, FI representa a força fisicamente aplicada à caixa do acelerómetro. Pelas leis de Newton, num referencial inercial (i.e., o referencial não é acelerado, não roda e não tem campo gravitacional), a equação da dinâmica para a aceleração inercial da massa m é dada por k b p̈ = − δpc − δ ṗc , (3.2) m m onde k é a constante de elasticidade da mola e b é a constante de amortecimento viscoso. k δpc , então, a equação (3.2) pode ser Definindo a leitura do acelerómetro como f = − m reescrita como αḟ = −f + p̈, (3.3) f (t) = p̈(t). (3.4) onde o parâmetro α = kb é a constante de tempo do sensor que determina a largura de banda do mesmo. Quando a largura de banda do sinal de aceleração p̈(t) é inferior à largura de banda do sensor, então αḟ (t) é muito pequeno e o sensor mantém a condição De notar que f é uma força específica com unidades de aceleração. Na presença de um campo gravitacional, a dinâmica do acelerómetro é dada por k b δpc − δ ṗc + G, (3.5) m m onde G representa a aceleração gravitacional dependente da posição. Pode ser mostrado por manipulações semelhantes às apresentadas anteriormente que p̈ = − αḟ = −f + p̈ − G(p). (3.6) f = p̈ − G(p). (3.7) Quando o sinal de aceleração p̈(t) apresenta variações que se encontram dentro da largura de banda do sensor, a leitura designada por força específica f é A equação (3.7) representa a equação de saída do acelerómetro (desprezando os efeitos de largura de banda). A equação não assume nada em relação às trajectórias 42 Capítulo 3. Fundamentos de Navegação Terrestre descritas pelo acelerómetro, mas evidencia que a aceleração gravitacional depende da localização. A discussão anterior afirma que um acelerómetro mede a força específica ou a aceleração relativa entre a caixa e a massa m. Este dispositivo não detecta acelerações que afectam a caixa e a massa m de igual forma. Para uma melhor compreensão, considerem-se os seguintes casos: • Um acelerómetro sem rotação e sem forças aplicadas fisicamente encontra-se em queda livre com p̈ = G; então, a leitura do acelerómetro será f = 0. • Um acelerómetro, numa órbita estável em torno da Terra, está também em queda livre. Está em aceleração constante em direcção à Terra com valor p̈ = G, então, a leitura do acelerómetro será f = 0. • Considere-se um acelerómetro em repouso na superfície da Terra. Neste caso, o acelerómetro está sujeito ao campo gravitacional da Terra e é forçado a rodar em torno da Terra a uma velocidade angular I ωE . Definindo a origem do referencial inercial como sendo coincidente com o centro de massa da Terra, vem que p̈ = I ΩE I ΩE p onde I ΩE = I I ω E × ; então, a leitura do acelerómetro será f = I ΩE I ΩE p − G(p) (3.8) que é a força inercial aplicada pela estrutura de suporte à caixa do acelerómetro para a manter estacionária em relação à Terra. 3.2.3 Tipos de Plataformas Existem muitos tipos de sistemas de navegação inercial com diferentes graus de desempenho mas em geral podem ser classificados como pertencendo a duas classes, diferenciadas pela forma como os sensores são instalados no veículo. Sistemas com Plataformas Estabilizadas -Gimballed Systems Um gimbal é uma estrutura rígida com rolamentos que permitem o isolamento da referida estrutura interior de rotações externas em torno do eixo dos rolamentos. Se a estrutura interna fosse perfeitamente equilibrada e os rolamentos ideais (sem qualquer força de atrito), a sua própria inércia de rotação seria suficiente para a isolar de rotações da estrutura externa. Como é habitual, este não é o caso que se verifica na prática. A solução passa por instalar um giroscópio na estrutura central para assim, ser possível detectar binários com origem no atrito dos rolamentos ou no desequilíbrio da estrutura interna. Estas perturbações são utilizadas para alimentar uma malha de retroacção que anula as rotações da estrutura em torno de cada eixo com rolamentos. Veículos marinhos de superfície, veículos terrestres, aeronaves de baixo desempenho e outros cuja gama de operação não implique manobras com ângulos de pitch e roll de valores elevados, são adequados para um sistema de navegação inercial de plataforma estabilizada com três gimbals (número mínimo para isolar de um sistema com rotações segundo três eixos — yaw, pitch e roll ). Para o caso de uma aeronave de alto desempenho, 3.2. Navegação Inercial 43 com liberdade total de manobra, são necessários quatro gimbals para evitar uma situação não desejada designada por gimbal lock que, em termos simples, tira à plataforma estabilizada, a capacidade de isolamento de rotações externas [77, 74]. Em seguida, sumarizam-se as principais vantagens e desvantagens dos sistemas de navegação baseados em plataformas estabilizadas [77]: Vantagens • Giroscópios mais simples. Devido aos pequenos ângulos de rotação que a plataforma estabilizada de sensores tem de efectuar para se manter nivelada, os giroscópios necessitam de um pequeno intervalo de medida dinâmico, visto que, para se ter um giroscópio de 0.01 deg/h só é necessário uma velocidade angular máxima de 3 deg/s. • Elevada precisão. O facto de os eixos de medida dos acelerómetros estarem sempre bem definidos, torna possível que os sistema gimballed sejam muito precisos. Os eixos sensíveis segundo Norte e Este medem somente a aceleração do veículo, ao contrário do acelerómetro vertical que mede a aceleração do veículo na presença da gravidade (1 g). É comum compensarem-se alguns erros que possam surgir, com um altímetro barométrico. • Alinhamento automático com auxílio de girobússola. • Calibração de sensores através de rotações da plataforma. Desvantagens • Complexidade e Custo. A estrutura da plataforma estabilizada é constituída por inúmeras partes móveis que têm de apresentar rigidez estrutural para que os eixos sensíveis dos acelerómetros estejam sempre bem definidos. Os rolamentos que permitem movimentos entre as várias peças, têm de ter o mínimo de atrito possível. Em suma, trata-se de uma estrutura bastante complexa que requer fabricação de alta precisão, o que leva a custos elevados. • Incompatibilidade magnética. Os accionadores e sensores necessários à estabilização da plataforma, podem ser fontes de ruído electromagnético que pode corromper outros sensores. • Fiabilidade. As interfaces mecânicas entre as várias partes móveis como os rolamentos e os slip-rings sofrem bastante desgaste o que provoca uma diminuição no desempenho. Sistemas Analíticos -Strapdown Systems Um sistema de navegação do tipo strapdown, faz uso de uma IMU que não está isolada das rotações do veículo onde foi instalada. Os gimbals são substituídos por software que faz uso das medidas dos giroscópios para calcular a orientação dos acelerómetros em relação ao referencial ao qual estes fazem as suas medidas executando em seguida integrações numéricas em relação ao tempo para obter a velocidade e a posição. Devido 44 Capítulo 3. Fundamentos de Navegação Terrestre aos ambientes com altas vibrações e choques mecânicos onde é comum serem instalados, necessitam que a sua instalação seja feita sobre amortecedores. O mesmo pode acontecer aos sistemas gimballed. Mais uma vez, sumarizam-se as principais vantagens e desvantagens dos sistemas de navegação do tipo strapdown [77]: Vantagens • Estrutura Simples, baixo custo. Os sistemas strapdown são mais leves, mais simples, mais baratos e mais fáceis de integrar em sistemas compactos. Só necessitam que os sensores sejam montados numa direcção conhecida (normalmente de forma ortogonal entre si). • Robustez Mecânica. A estrutura mais simples, torna estes sistemas mais robustos aos choques e vibrações mecânicas. • Fiabilidade. Não necessita de partes mecânicas (não tem rolamentos nem slip-rings) e a electrónica que substitui estes dispositivos mecânicos é bastante mais fiável. Desvantagens • Alinhamento. Os sistemas strapdown são de alinhamento difícil já que não tem partes móveis. • Calibração de Sensores. A imobilidade dos sensores significa que não podem ser calibrados dentro do sistema. Então, têm que ser estáveis, o que representa um fardo para a fase de desenvolvimento. A compensação tem de ser feita em temporeal com base em modelos para eliminar erros inerciais e térmicos. • Erros dos Acelerómetros. Os erros de polarização acumulam-se rapidamente e os eixos sensíveis são expostos a componentes do vector gravítico, o que origina uma redução na precisão das medidas e aumenta os erros entre eixos. • Capacidade Computacional. Todos os cálculos que, nos sistemas com plataforma estabilizada, são resolvidos mecanicamente, nos sistemas strapdown têm de ser efectuados por computadores em tempo-real em períodos relativamente curtos (é comum ser inferior a 0.01 s). Esta limitação era significativamente mais forte no passado, quando os computadores eram volumosos, pesados e consumiam muita energia. No presente, os sistemas computacionais disponíveis para a resolução de um algoritmo de navegação strapdown consomem pouca energia e são incomparavelmente mais compactos que os que existiam há duas ou três décadas. 3.3 3.3.1 Navegação por Satélite Introdução Navegação por satélite é o método que tira partido de uma constelação de satélites de navegação posicionados na órbita terrestre para determinar com precisão a posição e a hora em qualquer local na Terra. 3.3. Navegação por Satélite 45 Até à data da escrita deste trabalho, existem três sistemas de navegação por satélite globais em operação ou em desenvolvimento. Uma breve descrição dos mesmos é apresentada nas secções seguintes. 3.3.2 Global Positioning System O sistema GPS foi inicialmente concebido pelo Departamento de Defesa (Department of Defense, DoD) dos EUA para o apoio à navegação. É extensamente utilizado quer para fins militares, quer para fins civis, onde nos últimos anos tem encontrado inúmeras aplicações que abrangem o cidadão comum, não estando só ao serviço da comunidade científica. O sistema de GPS operacional pressupõe uma rede de 24 ou mais satélites (28 em Março de 2000 [82]) activos que se encontram de forma aproximadamente uniforme em seis órbitas circulares cada uma com cerca de quatro ou mais satélites. As órbitas não geoestacionárias com um raio de aproximadamente 26560 km estão inclinadas de cerca de 55o em relação ao Equador encontram-se separadas umas das outras de múltiplos de 60o com um período orbital de cerca de 11, 967 horas. Em teoria, três ou mais satélites estão 24 horas por dia disponíveis para determinar a posição de um receptor. A Figura 3.5 contém uma ilustração deste sistema. Figura 3.5: Constelação de satélites do GPS. Cada satélite emite um sinal, em duas frequências, contendo informação sobre a sua posição e instante temporal do envio do sinal. O receptor captura o sinal de cada satélite que permite determinar a distância ao satélite. As coordenadas de um receptor de GPS são determinadas por trilateracção, no plano ou no espaço, em função do número de satélites a que se tem acesso, dependendo da localização espaço-temporal do receptor. Se quatro destas distâncias podem ser medidas, então é possível calcular a localização tridimensional do receptor em relação aos satélites e, sendo a posição dos satélites conhecida, então pode-se determinar a posição absoluta. A disponibilidade do sistema significa que, actualmente, qualquer pessoa pode determinar a sua localização na superfície da terra, ou mesmo, navegar. 46 3.3.3 Capítulo 3. Fundamentos de Navegação Terrestre GLONASS Uma segunda configuração para um sistema de posicionamento global por satélite é o Global Orbiting Navigation Satellite System (GLONASS), colocado em órbita pela antiga União Soviética e actualmente mantido pela República Russa [74]. O sistema GLONASS também recorre a uma rede de 24 satélites mas, neste caso, estão distribuídos de forma uniforme em três planos orbitais (ao contrário dos seis planos do sistema GPS) cada um com oito satélites (quatro no GPS). Cada plano orbital tem uma inclinação nominal de 64.8o em relação ao Equador encontrando-se os três planos orbitais separados por múltiplos de 120o . Os satélites descrevem órbitas com raio inferior às dos satélites de GPS, sendo neste caso de 25510 km com um período de rotação de 8/17 de um dia sideral. Cada satélite dos sistemas GLONASS e GPS descrevem respectivamente 17 e 16 rotações completas em torno da Terra a cada oito dias. No que diz respeito aos sinais que são enviados para os satélites , este sistema recorre a um método de multiplexagem por divisão na frequência para transmissão de informação de cada satélite. As duas portadoras L1 e L2, têm frequências f1 = (1.602 + 9k/16) GHz e f2 = (1.246 + 7k/16) GHz, onde k = 0, 1, 2, . . . , 23 representa o número do satélite. 3.3.4 Galileo O sistema Galileo é o terceiro sistema de navegação global baseado numa constelação de satélites que está no presente (2008) a ser desenvolvido. As suas especificações, tais como a alocação de frequências e definição de sinais a transmitir, estão a ser projectadas pela entidade European Commission’s Galileo Signal Task Force (STF), que foi constituída pela Comissão Europeia em Março de 2001. Esta entidade é composta por especialistas nomeados pela União Europeia, investigadores da Agência Espacial Europeia (ESA) e representantes das autoridades de alocação de frequências de cada país. O segmento do espaço do sistema Galileo será constituído por uma constelação de 30 satélites de Medium Earth Orbit, 3 dos quais são de reserva. Cada satélite irá transmitir sinais de tempo precisos, efemérides e outros dados. Os satélites vão descrever órbitas com uma altitude de 23222 km, com uma inclinação orbital de 56o em três planos orbitais. Cada plano orbital contém 9 satélites igualmente espaçados, mais um de reserva que também se encontra a transmitir informação [83]. Quando estiver operacional, é suposto fornecer um conjunto de funcionalidades e serviços que vão para além do posicionamento global como é caso do Search and Rescue (SAR) que representa uma contribuição da Europa para o esforço international de sistemas de Procura e Salvamento de alcance global. Vai tornar possível a recepção de mensagens de socorro quase em tempo-real (o tempo médio de recepção actual é de cerca de uma hora) com origem em qualquer ponto do globo terrestre, com localização precisa dos alertas (erro máximo de poucos metros). A determinação da posição dos beacons em apuros é conseguido pelo COSPASSARSAT [84] através dos sinais e dados fornecidos pelo SAR/Galileo. A precisão na determinação da posição será de cerca de 5 km para os actuais beacons e menos de 10 metros para os beacons avançados equipados com receptores Galileo. As comunicações, desde os beacons até às estações terrestres de salvamento e procura, devem permitir detecções e localizações de emissões em apuros em menos de 10 minutos. 3.4. Campo Magnético Terrestre 3.4 3.4.1 47 Campo Magnético Terrestre Magnetómetro Recorre-se a um magnetómetro para determinação da direcção do campo magnético terrestre. Os compassos magnéticos ou bússolas são facilmente afectados por perturbações do meio envolvente que surgem com campos magnéticos de outros dispositivos e com a proximidade de materiais de permeabilidade diversa. Características do Campo Magnético Terrestre O planeta Terra pode ser considerado como um íman gigante que se encontra envolvido por linhas de fluxo magnético que ligam dois pólos magnéticos. Estes pólos magnéticos estão perto, embora não coincidentes, com os pólos geográficos da Terra. Como se ilustra na Figura 3.6, as linhas de força do campo magnético da Terra, penetram a superfície terrestre com diferentes ângulos com a horizontal local. Este ângulo com a horizontal, é designado por ângulo de inclinação (dip angle). Este ângulo aumenta em valor absoluto de 0o , desde o equador magnético, até 90o nos pólos magnéticos. Figura 3.6: Ilustração da não sobreposição entre os pólos magnéticos e os pólos geográficos terrestres (extraído de [5]). Devido à não correspondência entre os pólos magnéticos2 e os pólos geográficos, qualquer dispositivo magnético (bússola, magnetómetro ou outro) não calibrado, não vai indicar o Norte geográfico, mas sim o Norte magnético. A diferença angular entre o meridiano verdadeiro (círculo que une os pólos geográficos) e o meridiano magnético (tem a direcção das linhas de fluxo do campo magnético) é designada por declinação. Esta declinação, ilustrada na Figura 3.7, tem valores diferentes, em locais diferentes na superfície da Terra. 2 O pólo Norte geomagnético está localizado no antárctico Canadiano com coordenadas 82o N de latitude e 248o E de longitude. O pólo Sul geomagnético está aproximadamente localizado na coordenadas 65o Sul de Latitude e 138o E de Longitude. De notar que os pólos geomagnéticos não são anti-odais, sendo uma assimetria que também mede a complexidade do campo magnético terrestre. 48 Capítulo 3. Fundamentos de Navegação Terrestre Figura 3.7: Mapa mundial da declinação magnética (extraído de [6]). É usual definir o campo magnético terrestre num determinado ponto da superfície terrestre em relação ao referencial geográfico recorrendo a dois ângulos: declinação, o ângulo entre a componente horizontal do campo magnético em relação ao Norte verdadeiro, e inclinação, o ângulo entre o vector campo magnético terrestre e o plano horizontal (ilustrado na Figura 3.8). A intensidade, que é independente da orientação do referencial, é Figura 3.8: Descrição do campo magnético terrestre num ponto da sua superfície. representada como a intensidade do vector campo magnético terrestre. 49 3.4. Campo Magnético Terrestre Utilização de um Magnetómetro para Navegação A utilização do campo magnético terrestre, para obter informação sobre o seu rumo (yaw ou heading), constitui uma prática secular. É legitimo afirmar que a maioria, senão totalidade dos veículos navais, aeronáuticos e alguns terrestres, utiliza de alguma forma o campo magnético terrestre para o cálculo do rumo da plataforma. Os dispositivos de medição de campos magnéticos utilizados na actualidade (como por exemplo um magnetómetro) surgem em geral sob a forma de sensores de 2 ou 3 eixos ortogonais entre si, possibilitando medir componentes do vector campo magnético terrestre. São necessárias as componentes horizontais do referido campo para se conseguir obter uma medida de heading em relação ao Norte magnético. Se o veículo, ao qual o magnetómetro está solidário, tiver ângulos de roll ou de pitch diferentes de zero, os eixos horizontais vão sentir as componentes verticais do campo. Por este motivo, um magnetómetro de somente dois eixos, nas referidas condições, não tem a capacidade de determinar o ângulo de yaw. Um sensor com três eixos pode determinar a orientação dos seus eixos somente se a magnitude do campo magnético for conhecida ou se assumir um valor para a mesma. Somente quando se dispõe de um inclinómetro, é que se torna possível a determinação da atitude triaxial. Um magnetómetro biaxial, em que os seus dois eixos ortogonais se encontram no plano horizontal (designados de forma simplificada por Xh e Yh ), sob o efeito do campo magnético terrestre sem perturbações, origina as leituras apresentadas na Figura 3.9, quando rodado de 360o , no plano horizontal. Leitura do eixo do x e do y do magnetómetro sem perturbaçoes em função de ψ Leitura do eixo do x do magnetometro em funçao do eixo do y sem perturbaçoes real 100 Leitura do eixo x do mag. Leitura do eixo y do mag. 100 Xh [% do valor absoluto da componente horizontal do CMT] [% do valor absoluto da componente horizontal do CMT] 80 60 40 20 0 −20 −40 −60 −80 80 60 40 20 0 −20 −40 −60 −80 −100 −100 −pi −3pi/4 −pi/2 −pi/4 ψ 0 [rad] pi/4 pi/2 real (a) Em relação ao heading. 3pi/4 pi −100 −50 0 50 Yh [% do valor absoluto da componente horizontal do CMT] 100 (b) Um eixo em relação ao outro. Figura 3.9: Leitura de dois sensores magnéticos ortogonais (inseridos no plano horizontal) quando rodados de 360o no plano horizontal. 3.4.2 Estimador de Atitude Magneto-Pendular O estimador de atitude magneto-pendular (Magneto Pendular Sensor, MPS) baseiase no princípio do inclinómetro, segundo o qual se pode determinar a inclinação de um corpo através do ângulo formado entre um pêndulo e a vertical (consultar Figura 3.10). 50 Capítulo 3. Fundamentos de Navegação Terrestre Para o trabalho presente, em lugar do pêndulo utiliza-se uma tríade de acelerómetros, em que a aceleração gravítica corresponde à vertical. Figura 3.10: Inclinómetro e acelerómetro. Utilizando este principio apenas é possível determinar, em ângulos de Euler, os ângulos de pitch e roll, o ângulo de yaw não é mensurável porque a informação fornecida por este é independente da rotação segundo o eixo normal à superfície terrestre. Para determinar o ângulo yaw recorreu-se à componente horizontal do campo magnético, fornecida pelo magnetómetro. Leitura da Componente Gravítica dos Acelerómetros e Determinação da Inclinação A escolha natural como substituto de um inclinómetro, é um acelerómetro. No entanto, a leitura do acelerómetro não poderá ser utilizada directamente. De facto, tal como foi apresentado na Secção 3.2.2, só quando um acelerómetro se encontra imobilizado na superfície terrestre é que se tem B (3.9) f = −B g, E E ′ onde B g = E B R g e g = [0, 0, g] . Um modelo possível para as medidas de um acelerómetro em movimento é dado por d Bv + ω × B v − B g, (3.10) dt B onde ddtv é a aceleração linear, ω × B v é a aceleração centrípeta, e B g é o vector de gravidade no referencial {B}. Este modelo evidencia portanto, a necessidade de remover a aceleração centrípeta para que os resultados do estimador sejam válidos para qualquer movimento, rectilíneo ou de rotação. Definindo a grandeza f= assumindo que d Bv dt f̂ = f − ω × B v, (3.11) ≈ 0, é possível através de g sin θ f̂ ≈ −B g = −R′X (φ)R′Y (θ)E g = −g cos θ sin φ , −g cos θ cos φ (3.12) 51 3.4. Campo Magnético Terrestre depois de algumas manipulações algébricas, com f̂ = [fˆx , fˆy , fˆz ]′ , vem φ = arctan2 −fˆy , −fˆz , ! ˆ fx sin φ , sin φ 6= 0 arctan − fˆ y ! θ= . ˆx cos φ f , cos φ 6= 0 arctan − fˆ z (3.13) que são ângulos de roll e pitch respectivamente. A remoção da aceleração centrípeta não está livre de erros, no entanto, analisando as condições de operação do veículo, observa-se que as acelerações tangenciais são de curta duração devido à compensação dos atritos e que a aceleração gravítica é muito superior às acelerações de funcionamento do veículo, tornando viáveis as leituras do sensor para baixas frequências. Determinação do Ângulo de Yaw O campo magnético terrestre é medido no referencial {B} pelo magnetómetro B mr = R′X (φ)R′Y (θ)R′Z (ψ)E m̄, (3.14) onde E m̄ é conhecido e representa o campo magnético Terrestre expresso no referencial {E} e RX (φ), RY (θ), e RZ (ψ) representam as matrizes de rotação elementares de roll, pitch, e yaw respectivamente. A estimação do ângulo de yaw é obtida através da projecção da leitura do magnetómetro num referencial auxiliar {Ea }. Os referenciais {Ea } e {E} apenas diferem numa rotação em torno do eixo do z. A componente horizontal da leitura do magnetómetro é obtida projectando o campo magnético segundo os ângulos pitch e roll determinados anteriormente Ea m = RY (θ)RX (φ)B mr , (3.15) onde B mr = [mx , my , mz ]′ é a leitura do magnetómetro e Ea mr é a leitura do magnetómetro expressa em {Ea }. Em geral é necessário ter em conta a declinação magnética local (αdec ), sendo a sua compensação possível através de ψ = arctan2 −Ea my , Ea mx − αdec , ou, caso seja conhecido E m̄, (3.16) Ea Ea Ea E Ea E E E ψ = arctan2 my mx − mx my , mx mx + my my O presente Capítulo começou por caracterizar de forma breve, os primeiros avanços do conhecimento e tecnologia conseguidos pelo Homem na ciência da navegação terrestre. Introduziu alguns dos métodos e instrumentos de navegação mais populares na actualidade que assumem especial importância no contexto do presente trabalho. Nos Capítulo 4 e seguintes, é descrita a plataforma, a arquitectura e o sistema de navegação propostos, sendo feita a análise e discussão dos resultados experimentais obtidos em testes de mar com o ASC DELFIMx. Capítulo 4 Arquitectura Proposta para um Catamaran O programa de desenvolvimento de veículos marinhos autónomos (submarinos e de superfície) levado a cabo no DSOR, foi iniciado com a ambiciosa premissa de começar do zero o projecto, concepção e implementação das arquitecturas de software e de hardware dos veículos. O presente Capítulo apresenta, para além de uma visão geral do conceito de operação do sistema DELFIMx, uma descrição com maior detalhe dos vários subsistemas que o constituem. Apresenta também uma breve descrição da tecnologia dos sensores de navegação, em particular dos sensores inerciais e do magnetómetro. 4.1 Descrição Geral do Veículo e da Arquitectura A Figura 4.1 ilustra o veículo autónomo de superfície de DELFIMx, um pequeno catamaran com cerca de 4.5 m de comprimento, 2.45 m de largura, carga nominal de cerca de 300 kg, o que corresponde a um calado1 de 0.18 m. Figura 4.1: Diagrama de blocos do conceito operacional do sistema DELFIMx. Os dois cascos do catamaran estão ligados por duas traves, tendo cada casco montado na 1 Calado é a distância da superfície da água ao fundo da embarcação. 52 53 4.1. Descrição Geral do Veículo e da Arquitectura zona posterior um motor eléctrico com um hélice acoplado. Os motores podem operar em modo comum ou diferencial, o que permite controlar a velocidade e a orientação (rumo) do veículo, podendo atingir velocidades de cerca de 6 nós em relação à água. Dispõe de uma estrutura central em forma de asa, que pode ser instalada de forma a ficar semisubmersa. Na extremidade submersa desta estrutura, está instalado um corpo de baixo atrito hidrodinâmico que permite transportar transdutores acústicos. Para operações de batimetria e caracterização do fundo do mar, a asa é equipada com um sonar de varrimento mecânico. As baterias de alimentação dos motores e da electrónica a bordo, bem como a arquitectura de comando e controlo do catamaran, encontram-se no interior dos cascos. A arquitectura distribuída para navegação de veículos autónomos, que é proposta neste trabalho, surge de forma natural no enquadramento proporcionado pelo trabalho desenvolvido no DSOR. As áreas de interesse do referido grupo vão desde a navegação, controlo, passando pelo controlo de missão e integração de sistemas nesses veículos. Foi desenvolvida neste laboratório, uma arquitectura digital distribuída de tempo real, que vem a ser utilizada e testada no âmbito de projectos com veículos autónomos. O presente trabalho enquadra-se na área de investigação deste laboratório relacionada com a integração de sistemas de hardware analógico e digital, calibração de sensores, implementação eficiente de algoritmos de navegação e validação por Hardware-In-The-Loop (HITL) de todo o sistema de navegação. Enquadradas com os objectivos do DSOR, existiram, no passado, contribuições valiosas no âmbito da implementação de algoritmos de navegação [85, 86], tendo sido documentados bons resultados, quer ao nível da simulação, quer ao nível da implementação real de uma plataforma inercial. A opção por uma plataforma descentralizada, cujas vantagens são descritas com mais detalhe em [7], foi desenvolvida de forma a acomodar uma larga variedade de ambientes operacionais. A sua natureza modular confere a este conjunto de sub-sistemas grandes benefícios no que diz respeito à sua integração numa multiplicidade de plataformas diferentes. A Figura 4.2 apresenta uma visão de alto nível da arquitectura total proposta. !"# Figura 4.2: Diagrama geral da arquitectura proposta para operação do sistema DELFIMx. O tipo de implementação ao qual se dedicou esta tese, está vocacionado para a utilização no contexto dos Veículos Marinhos Autónomos de Superfície (habitualmente 54 Capítulo 4. Arquitectura Proposta para um Catamaran designados por Autonomous Surface Craft, ASC), em particular, a embarcação que serviu de plataforma para os testes de campo é uma embarcação do tipo catamaran. A arquitectura, instalada no ASC, caracteriza-se por ser um sistema autónomo montado em várias caixas que apresentam a possibilidade de serem facilmente instaladas ou removidas do veículo. Devido à sensibilidade de alguns dos seus componentes, nomeadamente o sistema de navegação, as referidas caixas, são fixas ao casco do veículo por meio de isoladores de vibração, obtendo-se assim um melhor isolamento das abundantes oscilações e choques mecânicos presentes na embarcação, que têm como principal origem a ondulação. Desta maneira, obtém-se o efeito de um filtro passa-baixo mecânico, conseguindo assim uma atenuação efectiva das vibrações transmitidas a todos os dispositivos electrónicos. A capacidade computacional a bordo do veículo, para além de estar descentralizada, está projectada conforme as necessidades das tarefas que deve desempenhar. O processamento mais exigente em termos computacionais que os algoritmos de navegação e controlo (a parte algorítmica relacionada com o controlo não faz parte dos objectivos desta tese) requerem, ficam a cargo de um Digital Signal Processor (DSP), conectado à arquitectura de aquisição de sinal por via de uma Dual Port RAM (DP-RAM) implementada numa placa também desenvolvida no IST-ISR. A escolha do DSP recaiu sobre o Texas Instruments TMS320VC33 devido à sua muito favorável relação entre consumo energético e desempenho (trata-se de um DSP de 32 bit de vírgula flutuante - consultar C.5.2). De seguida, surgem mais duas camadas de processamento que foram desenvolvidas em torno dos microcontroladores Phillips XAS3 (16 bit) e o Atmel AT90CAN128 (8 bit) AVR Flash. Não sendo apropriados para cálculo intensivo, estes dispositivos apresentam-se como óptimas soluções para a interface a sensores e actuadores, visto que têm a capacidade para a troca de mensagens através do barramento (Controller Area Network (CAN bus). Para as tarefas de alto nível, foi escolhida uma placa PC/1042 conectada ao CAN bus que, durante a realização deste trabalho, desempenhou a função de Data Logger, armazenando num disco de estado sólido, todos os dados gerados pelo ASC que posteriormente são processados. Futuramente, esta máquina vai ser responsável pelo Controlo de Missão. 4.2 Computador de Bordo Distribuído Nas secções seguintes são descritos com maior detalhe os subsistemas que constituem a arquitectura computacional que se propõe neste trabalho. Na Figura 4.3 apresenta-se uma ilustração dos sistemas a bordo do veículo. 4.2.1 Arquitectura de Comunicações Distribuída - CAN Bus O CAN bus é um barramento série desenvolvido com o intuito de oferecer uma forma fiável e económica de ligar sensores e actuadores em aplicações com requisitos de tempo-real. O CAN bus opera a taxas de transmissão de dados que podem ir até ao 1 Mbit por segundo, apresentando também, uma enorme variedade de sistemas robustos de detecção de erros. Foi desenvolvido por uma empresa de origem alemã designada por 2 PC/104 Embedded Consortium, http://www.pc104.org. 55 4.2. Computador de Bordo Distribuído "# # $ % Figura 4.3: Diagrama de blocos da arquitectura distribuída. Robert Bosch com vista a ser utilizado na indústria automóvel, possibilitando uma forma eficiente e pouco dispendiosa para interligar um crescente número de dispositivos electrónicos presentes num automóvel. O CAN bus é, no presente, um standard internacional documentado no ISO 11898 [87]. Na Figura 4.4 ilustra-se a arquitectura dos nós CAN e a sua ligação ao meio de transmissão. Figura 4.4: Arquitectura dos nós CAN e ligação ao meio de transmissão (extraído de [7]). O meio de transmissão pode consistir somente de dois condutores eléctricos (CAN_H and CAN_L) terminados electricamente nas duas extremidades com cargas resistivas de cerca de 120 Ohm que suprimem as reflexões na linha de transmissão. A generalidade dos circuitos integrados de acesso ao meio de transmissão disponíveis no mercado pode suportar redes com várias dezenas de nós. As suas primitivas para broadcast fiável tornam possível construir um conjunto de serviços de comunicações sobre o protocolo nativo, o que, naturalmente, contribui para 56 Capítulo 4. Arquitectura Proposta para um Catamaran a enorme aceitação comercial que o CAN bus apresenta, sendo neste momento, e muito claramente, o fieldbus mais usado em aplicações e sistemas de controlo distribuído. Com a sua aceitação comercial e consequente implantação massiva na indústria, têm aparecido inúmeras soluções de hardware dos mais diferentes fabricantes (Intel, Philips, Motorola, Siemens entre outros), o que tem tornado o desenho de sistemas baseados em CAN cada vez mais simples e tem garantido que o suporte se manterá durante bastante tempo. A cada mensagem faz-se corresponder um único identificador que permite, de forma unívoca, a sua identificação na rede. Este identificador define, não só os dados, mas também a prioridade da mensagem no barramento (consultar [88]). Por se tratar de uma rede de comunicação em que é possível garantir não só a entrega, mas também uma duração máxima até uma determinada mensagem chegar ao seu destino ou destinos, o CAN bus apresenta-se como uma solução adequada para um canal de comunicação entre os vários dispositivos deste sistema. 4.2.2 Nós da Rede CAN Bus Na Figura 4.3 foi apresentado o diagrama de blocos que descreve os principais sistemas a bordo do ASC. Cada bloco pode conter mais que uma funcionalidade, podendo portanto englobar mais que um nó da rede CAN. Esta secção pretende descrever de forma sucinta os nós constituintes de cada bloco. Comunicações, Comando e Armazenamento de Dados O armazenamento de dados de uma missão para posterior processamento e validação, é uma funcionalidade fundamental de um sistema deste género. O facto de ainda se tratar de um protótipo, é uma plataforma que ainda está sujeita a alterações que podem ter origem no diagnóstico atento e pormenorizado dos dados dos sensores, filtros de navegação e controlo. No caso particular dos dados de GPS, é armazenada informação que não é utilizada em tempo real, mas que depois de pós-processada em laboratório pode ser essencial para testar a qualidade de diversas opções no que diz respeito aos filtros de navegação, isto é, consegue-se em laboratório simular uma missão na sua totalidade. O hardware, que implementa esta funcionalidade, é um módulo PC/104 com interface CAN bus e capacidade de escrita num disco não volátil de estado sólido. O software foi desenvolvido para uma implementação própria (desenvolvida no DSOR) do sistema operativo Linux que está a ser executado nesta máquina. No futuro, este nó vai também conter algoritmos de alto nível para a implementação de controlo de missão. Navegação, Controlo e Sensores Este nó é constituído por vários componentes, sendo aqui que se pode encontrar a maior capacidade computacional dedicada a operações de vírgula flutuante, a bordo do veículo. Está dividido em três subsistemas: a arquitectura de processamento e aquisição de sinal analógico, a interface ao GPS e a interface ao magnetómetro. A primeira é um conjunto de placas (MCXA-S3,DSPIf, D.Module.VC33 e AD24B3C) para processamento digital, placas de interface e placas com conversores analógico-digital (Analog to Digital Converter, ADC). As três primeiras, são conectadas através de um barramento digital paralelo sendo mecanicamente unidas "empilhando"as mesmas (barramento eléctrico e 4.2. Computador de Bordo Distribuído 57 mecânico, semelhante ao barramento PC/104, habitualmente designado por barramento em stack ). Uma pequena descrição de cada placa é apresentada de seguida: Placa MC-XAS3. A placa MC-XAS3, é uma placa microcontroladora genérica de 16 bit equipada com dois interfaces CAN bus 2.0 desenvolvida para utilização em ambientes de controlo distribuído de tempo real onde o reduzido consumo energético e a dimensão compacta são critérios muito fortes. Uma descrição mais pormenorizada sobre esta placa pode ser encontrada no Anexo C.1. Placa DSPIf - Interface entre MC-XAS3 e D.Module.VC33 . Esta placa serve o propósito de fazer a interface entre as placas MC-XAS3 e D.Module.VC33 fazendo uso de uma memória de acesso aleatório (Random Access Memory, RAM) estática de dois portos (Dual-Port RAM, DP-SRAM) e alguma lógica digital implementada num dispositivo de lógica programável (Programmable Logic Device, PLD) de descodificação de endereços. O conceito de memória partilhada que foi desenvolvido, está ilustrado na Figura 4.5, e caracteriza-se por ser um sistema de sinalização e transferência de dados do tipo mailbox, onde, quando um dispositivo pretende comunicar com o outro, escreve na mailbox correspondente o comando desejado e seguidamente provoca-lhe uma interrupção. O primeiro procedimento do sistema interrompido, é ler o comando que o outro dispositivo escreveu e proceder conforme esse comando. Figura 4.5: Diagrama funcional do protocolo do tipo mailbox implementado com a DPRAM. Esta metodologia de interface permite que, na placa MC-XAS3, sejam "empilhadas"várias placas DSPIf (cada uma com uma placa D.Module.VC33 ) caso as necessidades computacionais assim o exijam. Um descrição com maior detalhe é apresentada no Anexo C.4. Placa D.Module.VC33 . A D.Module.VC33 é uma placa de processamento digital de sinal de vírgula flutuante de desempenho médio que pertence à família D.Module da D.SignT 3 . O seu objectivo passa pela execução de aplicações embebidas do tipo standalone que requerem funcionalidade e flexibilidade máximas e baixo consumo de energia. Os requisitos de baixo consumo tornam possível a sua utilização em aplicações móveis alimentadas a baterias. A este dispositivo foram atribuídas as tarefas de maior carga computacional numérica devido às suas características específicas, designadamente, os 3 D.SignT Digital Signalprocessing Technology, http://www.dsignt.de. 58 Capítulo 4. Arquitectura Proposta para um Catamaran filtros de navegação e de futuro, os filtros que implementam as leis de controlo - consultar o Anexo C.5 para obter mais detalhes sobre esta placa. A arquitectura de aquisição é constituída por uma a quatro placas que se ligam em barramento do tipo stack, tendo cada uma a capacidade de amostrar três sinais analógicos em simultâneo. Visto só terem o circuito simples de lógica programável e os conversores ADC, estas placas necessitam de se ligar a um microcontrolador ou processador digital de sinal. Na arquitectura do ASC DELFIMx, a arquitectura de aquisição está ligada através de um barramento dedicado à placa MCXA-S3 que faz parte do stack onde se encontra o DSP. Em termos da rede CAN, as arquitecturas de processamento e de aquisição de sinal pertencem ao mesmo nó. Interface ao GPS. Para além de fornecer dados do posicionamento da plataforma recorrendo a interface com o GPS, este nó serve também como disseminador de tempo para a rede CAN para que todos os nós estejam sincronizados. É composto por uma placa MCXA-S3 (consultar o Anexo C.1), uma placa ASHDG14If (consultar o Anexo C.3) e um GPS Thales DG14 (consultar o Anexo D.4). Este sistema independente constitui um nó de CAN e está instalado, por conveniência, na caixa da Navegação, Controlo e Sensores. Interface ao Magnetómetro. Para se conseguir a integração do magnetómetro Honeywell HMR3300 OEM na arquitectura distribuída, desenvolveu-se uma placa do tipo placa-mãe. Esta placa, a HMR_MB (consultar Anexo C.7), foi desenvolvida em torno do microcontrolador de 8 bit Atmel AVR AT90CAN128 e disponibiliza conectores específicos de modo a que seja possível empilhar a placa do magnetómetro. Desta forma, é possível fazer uma interface local ao magnetómetro via um porto série, e enviar os dados através do CAN bus para os outros nós da arquitectura. Esta característica traduz-se na elevada capacidade de o colocar num qualquer local do veículo de acordo com critérios que minimizem a incompatibilidade entre este sensor e outros agressores, na medida em que este é um sensor muito vulnerável à interferência electromagnética. Propulsão Os sistemas da Propulsão (um por cada casco) são constituídos por uma placa MC_AVRCAN128 baseada no microcontrolador Atmel AVR AT90CAN128 que, para além da interface aos sensores de velocidade angular dos motores e aos detectores de entrada de água nos cascos (leak detectors), é responsável também pela geração de um sinal de Pulse Width Modulation (PWM) que serve de comando para o controlador do motor eléctrico. Os comandos de velocidade codificados em pulsos do tipo PWM podem ter origem na consola de comando ou nos sistemas de controlo e comando automático que se encontram a bordo do ASC. Uma descrição mais completa da placa MC_AVRCAN128 é apresentada no Anexo C.6. Baterias da Propulsão Este sistema, também replicado para cada casco, contém um único nó da rede CAN constituído pela placa BatMonit (consultar Anexo C.8). Tem como principal objectivo, o controlo de um interruptor de estado sólido que permite ligar e desligar as baterias de propulsão dos motores eléctricos ou do carregador de baterias (caso o sistema esteja em 4.3. Monitorização, Transformação e Distribuição de Energia 59 modo de carga). Para além disso, tem a capacidade de monitorizar a corrente e tensão eléctricas de carga e descarga das baterias de propulsão. Baterias dos Computadores O sistema Baterias dos Computadores, tal como o sistema Baterias da Propulsão, é baseado na placa BatMonit (consultar Anexo C.8) e tem também funcionalidade semelhante, isto é, para além de monitorizar a corrente e a tensão das baterias, controla o estado de um interruptor de estado sólido. Este interruptor encontra-se entre o pack de baterias (de 26 V) e o barramento "CAN bus + 26 V"permitindo assim desligar todos os sistemas que estão ligados e dependentes da parte energética do referido barramento. 4.3 Monitorização, Transformação e Distribuição de Energia Para um eficaz planeamento de uma missão, é de extrema importância ter conhecimento, a todo o momento, dos recursos energéticos a bordo da plataforma. No caso dos recursos eléctricos armazenados numa bateria de Lítio Polímero (Baterias dos Computadores), foi desenvolvido um sistema de monitorização de carga e descarga eléctrica que dispõe da capacidade de medição da energia que entra e saí das mesmas, sendo assim possível conhecer o estado de carga em que se encontram. Evita-se por completo situações de falha de energia devido à descarga excessiva das baterias que se podem revelar muito perigosas aquando da operação de um veículo deste género. Uma descrição com maior detalhe é feita no Anexo C.8. O sistema Bateria dos Computadores é constituído por uma série de sete células (7S) de 40 Ah, o que perfaz uma tensão nominal contínua de aproximadamente 26 V e uma energia total disponível de cerca de 1 kWh. Os 26 V são colocados no barramento ("CAN bus + 26 V") para alimentar todos os outros sistemas. Conforme as suas necessidades, cada sistema transforma este nível de tensão nos níveis adequados. A título de exemplo, o sistema de navegação, para além de conversores DC-DC isolados, recorre também à placa SWLNPWR (consultar o Anexo C.9 para mais detalhes) para gerar as tensões adequadas para os sensores inerciais. No caso das Baterias da Propulsão, faz também a monitorização de corrente e de tensão de carga e de descarga. O primeiro protótipo foi equipado com baterias com tecnologia de chumbo. Esta tecnologia permite, através das curvas de carga e descarga de tensão, obter uma estimativa relativamente fiável do seu estado. Quando no futuro forem instaladas baterias de Lítio Polímero, um sistema mais preciso de contagem de carga e descarga vai ser instalado (tal como o que foi instalado no sistema Bateria dos Computadores). 4.4 Actuadores Os actuadores constituem a camada inferior na cadeia de comando e controlo. No caso do catamaran DELFIMx, e para que este possa efectuar a sua missão, foram instalados dois propulsores, cada um na zona posterior de cada casco. Por motivos ambientais e de índole prática, optou-se por um sistema de propulsão eléctrico. O sistema total é 60 Capítulo 4. Arquitectura Proposta para um Catamaran constituído por partes mecânicas (coluna do motor, veio de transmissão, o hélice), por partes electro-mecânicas (motor eléctrico -AXI 53604 ) e por partes eléctricas (placa microcontroladora, controlador de velocidade do motor Schulze 5 ). Algumas vistas dos vários componentes do sistema de actuação, são apresentadas na Figura 4.6. (a) Hélice em rotação. (b) Montagem do motor, coluna do motor, transmissão e hélice fora do ASC. Figura 4.6: Partes mecânicas, electro-mecânicas e eléctricas dos actuadores. Tal como foi referido anteriormente, a placa MC_AVRCAN128, é responsável pela geração do sinal PWM (que recebe pela rede CAN), onde se codifica a velocidade de rotação que vai ser interpretado pelo controlador de velocidade. 4.5 4.5.1 Sensores Unidade de Medição Inercial De modo a controlar ou georeferenciar um veículo móvel, é necessário medir e estimar as suas variáveis de estado. Tal como apresentado no Capítulo 3, uma solução possível para atingir estas estimativas é recorrer a um sistema de navegação inercial. A solução que se propõe para um sistema inercial analítico, isto é, um sistema que é estabilizado computacionalmente, contém um acelerómetro triaxial (trata-se de um dispositivo que contém três acelerómetros montados com os eixos sensíveis de forma ortogonal entre si) e três giroscópios de velocidade montados também de forma a conseguirem medir velocidades angulares segundo três eixos ortogonais entre si. O acelerómetro triaxial é um Crossbow Technology, Inc. CXL02TG3 (consultar o Anexo D.1) e o giroscópio de velocidade uniaxial é Silicon Sensing CRS03 (consultar o Anexo D.2). Estes sensores estão fisicamente fixos a um suporte desenvolvido propositadamente para o efeito. O suporte com os referidos sensores é apresentado na Figura 4.7. Sendo estes dispositivos de baixo custo, o seu desempenho apresenta também algumas limitações. Para ultrapassar essas limitações, faz-se uso de filtros e algoritmos de 4 5 AXI Model Motors, http://www.modelmotors.cz. Schulze Elektronik GmbH, http://www.schulze-elektronik-gmbh.com. 61 4.5. Sensores Figura 4.7: Unidade de medição inercial. navegação que tornam um Sistema de Medição Inercial (Inertial Measuring Unit, IMU) num INS. A solução adoptada neste trabalho é descrita com mais detalhe no Capítulo 5. Devido à sua relevância no desenvolvimento tecnológico actual (em particular em sistemas de navegação), e por ser a tecnologia que é empregue nos sensores inerciais utilizados neste trabalho, apresenta-se em seguida uma pequena descrição da tecnologia do tipo Micro Electro Mechanical System (MEMS). 4.5.2 Tecnologia MEMS O desenvolvimento de sensores do tipo Micro Electro Mechanical System (MEMS) foi incentivado pelo aparecimento de novas aplicações que exigiram sensores de baixo custo que pudessem fornecer medidas de aceleração e movimento angular. Uma aplicação moderna típica é, para estes sensores inerciais, a área dos transportes, nomeadamente a indústria automóvel. Os sensores MEMS são definitivamente um dos avanços mais importantes no que diz respeito a sensores inerciais nos últimos 25 anos. Conseguiram quebrar as barreiras que inviabilizavam o recurso a sistemas inerciais de inúmeras aplicações, onde o custo, dimensão e consumo energético são os critérios de desenvolvimento mais fortes. O desenvolvimento de sistemas inerciais convencionais sofreu também inúmeros e valiosos avanços, mas os seus custos permaneceram extremamente elevados para poderem ser adoptados em aplicações de grande consumo. As razões que justificavam os elevados custos são: elevado número de peças muitas das quais com tolerâncias de manufactura muito elevadas; técnicas de montagem complexas e com requisitos de alta precisão; teste e calibração complexas. A tecnologia MEMS recorre a processos de decapagem química (chemical etching), fotolitografia e processamento em lotes tais como os que são utilizados pela indústria de circuitos integrados. As técnicas de precisão para "maquinar" silício, foram adoptadas para produzir estruturas mecânicas muito pequenas em silício ou quartzo. Este passo possibilitou a concepção e produção de sensores inerciais de estado sólido com as seguintes características: dimensão reduzida, baixo peso, baixo consumo energético, construção robusta, tempo de arranque reduzido, baixo custo de produção e em grande quantidade, 62 Capítulo 4. Arquitectura Proposta para um Catamaran elevada fiabilidade, pouca necessidade de manutenção, compatibilidade com operação em ambientes hostis [10]. Giroscópios de Velocidade O funcionamento de giroscópios vibratórios foi demonstrado no inicio da década de 1980. Um exemplo deste tipo de dispositivos é o Quartz Rate Sensor, desenvolvido pela Systron Donner 6 . Embora giroscópios fabricados em quartzo possam apresentar elevados factores de qualidade e desempenho, o material básico que os constitui, o quartzo, impossibilita o seu processamento em lotes recorrendo à tecnologia da indústria de circuitos integrados. No fim da década de 1980, depois de demonstrado com sucesso o fabrico em lotes de acelerómetros utilizando como matéria prima o silício, foram iniciados esforços para substituir o quartzo pelo silício na produção de giroscópios vibratórios do tipo MEMS. Os giroscópios do tipo MEMS são dispositivos não rotativos e recorrem ao efeito da aceleração de Coriolis em massas de prova a vibrar para detectar velocidade angular inercial. Assim, estes sensores dependem da detecção da força que actua numa massa que está sujeita a um movimento linear vibratório no referencial que se encontra em rotação em relação ao eixo perpendicular ao eixo de movimento linear. A força resultante é designada por força de Coriolis, que actua perpendicularmente ao eixo de vibração linear e ao eixo de rotação aplicada. Analiticamente pode ser descrito como Aceleração de Coriolis : ac = 2v × Ω, Força de Coriolis : Fc = 2mv × Ω, (4.1) onde Ω é a velocidade angular de rotação do referencial em relação ao qual a massa m se encontra a mover com velocidade v e Fc é a força experimentada pela massa m. Muitos tipos de giroscópios de velocidade de tecnologia MEMS apareceram, até à data, na literatura especializada, sendo a maior parte pertencente a um dos três subconjuntos: i) Osciladores Simples: que estruturalmente se assemelham a barras ou vigas com a capacidade de vibrar (designadas na literatura anglo-saxónica por vibrating beams); ii) Osciladores Balanceados: com estrutura tipo diapasão (ou como é conhecido na literatura anglo-saxónica, tuning forks); iii) Shell Resonators: que pode ser do tipo wine glass, em cilindro, ou em anel. As Figuras 4.8(a), 4.8(b) e 4.8(c) ilustram os três tipos básicos de giroscópios MEMS, respectivamente. Giroscópios tipo Diapasão. Contêm um par de massas que são sujeitas a oscilar com a mesma amplitude mas com direcções opostas. Quando em rotação, a força de Coriolis cria uma vibração ortogonal que pode ser medida de diversas formas. Em 1991, o Draper Laboratory [89] demonstrou um dos primeiros giroscópios de velocidade recorrendo à tecnologia MEMS, utilizando o silício como matéria prima [90]. Este dispositivo ilustrado na Figura 4.9 (imagem scanning-electron-microscope, SEM) utiliza estruturas que se assemelham a pentes para forçar o diapasão a entrar em ressonância. 6 http://www.systron.com/ 63 4.5. Sensores (a) Barra ou viga vibratória. (b) Diapasão ou tuning fork. (c) Shell Resonators em anel. Figura 4.8: Classes de giroscópios de velocidade do tipo Coriolis Vibrating Gyroscopes (extraído de [8]). Figura 4.9: Primeiro protótipo funcional de um giroscópio MEMS do tipo diapasão, desenvolvido no Draper Laboratory. Giroscópios tipo Shell Resonators em anel. Uma forma possível, deste tipo de sensor, possui um íman permanente instalado por cima da estrutura MEMS. A corrente eléctrica que passa nas hastes condutoras, criam uma força que faz o anel entrar em ressonância. O movimento do anel induzido pela força de Coriolis, causado pela rotação do sensor, é detectado pela tensão induzida nas hastes que são atravessadas pelo campo magnético. Um exemplo de um giroscópio de velocidade que emprega esta tecnologia, é o sensor Silicon Sensing Systems CRS03 (consultar Anexo D.2) que é utilizado neste trabalho. É fabricado com um único cristal de silício com metal adicionado para obter maior conductividade. Este dispositivo é utilizado para estabilizar o Segway Human Transporter 7 . A Silicon Sensing Systems Ltd [9] é o resultado de uma parceria entre a Sumitomo Precision Products [91] e a Atlantic Inertial Systems [92] (descendente da British Aerospace [93]). Na Figura 4.10 apresentam-se várias ilustrações que revelam a dimensão e a estrutura mecânica deste dispositivo. 7 Segway, http://www.segway.com 64 Capítulo 4. Arquitectura Proposta para um Catamaran (a) Ilustração da escala. (b) Vista alargada da ar- (c) Vista ampliada das hastes que quitectura. suportam o anel. Figura 4.10: Giroscópio de velocidade Silicon Sensing Systems CRS03 (extraído de [9]). Acelerómetros Os acelerómetros MEMS detectam a aceleração de uma das seguintes formas: medindo a posição (por leituras capacitivas ou piezoelétricas) de uma massa de prova manufacturada com tecnologia MEMS; medindo a mudança de frequência de um elemento vibrante, causada pela alteração da tensão mecânica induzida pela mudança na carga mecânica exercida pela massa de prova quando é sujeita à aceleração. A primeira classe é conhecida como acelerómetros pendulares e são análogos aos acelerómetros convencionais do tipo pêndulo em malha aberta e em malha fechada. Já a segunda é habitualmente designada por acelerómetros ressonantes ou VBA (Vibrating Beam Accelerometers). Acelerómetros de massa pendular. Já foram desenvolvidos acelerómetros capazes de medir a força específica com eixos sensíveis contidos no plano da estrutura MEMS (in-plane) e com eixos sensíveis que são perpendiculares ao plano da referida estrutura (out-of-plane). Na Figura 4.11 apresenta-se uma ilustração de um acelerómetro do tipo in-plane. Faz uso de uma estrutura em pente para o seu elemento sensível, medindo a (a) Vista ampliada. (b) Vista alargada. Figura 4.11: Imagem SEM de um acelerómetro de massa pendular no plano (extraído de [10]). força específica através da detecção da alteração da capacidade ao longo dos dentes da estrutura em pente. Este tipo de sensores "mecânicos" é significativamente mais sensível a acelerações aplicadas no plano horizontal (tal como ilustrado, isto é da esquerda para a direita) do que na direcção ortogonal (ou de cima para baixo) 65 4.5. Sensores O recurso à realimentação de força é mais uma propriedade destes sensores que possui uma elevada influência no seu desempenho. Em sensores sem esta característica (Figura 4.12(a)), a leitura é obtida através de um transdutor de posição (capacitivo, piezoeléctrico, piezoresistivo, etc) que mede a posição da massa de prova em relação à posição de equilíbrio (a posição de equilíbrio é forçada por molas que conectam a massa de prova à caixa do acelerómetro). O valor medido é proporcional à força específica. Os sensores com realimentação de força (consultar a Figura 4.12(b))) funcionam de forma diferente. O sistema de realimentação é constituído por circuitos que recorrem às medidas do transdutor de posição e a actuadores electroestáticos para criar uma força de restituição que mantém a massa de prova na posição de equilíbrio. A vantagem desta característica revela-se como uma menor sensibilidade às não linearidades nas molas e às perturbações externas. Podem ser mais sensíveis visto que as molas não têm que suportar a carga mecânica total e o amortecimento pode ser controlado por circuitos electrónicos. Assim, estes sensores são habitualmente a opção a tomar quando os requisitos de sensibilidade são elevados. Na Figura 4.12 são representados acelerómetros MEMS com eixo sensível fora de plano nos quais uma massa de prova está suspensa numa mola torsional, sobre um substrato de vidro, que roda quando sujeito a acelerações perpendiculares ao plano do sensor. A versatilidade do empacotamento destes sensores, podendo ser montados de forma planar, constitui a sua grande atractividade. Quando existe a necessidade de integrar um sensor com mais de um eixo sensível em volumes muito pequenos, a utilização destes dois tipos de acelerómetros (in-plane e out-of-plane) possibilita um empacotamento muito reduzido e planar. Por exemplo, a utilização de um elemento sensível fora do plano e de dois laterais no plano, com os eixos de entrada ortogonais entre si, origina um acelerómetro triaxial da dimensão de um pequeno circuito integrado. (a) Malha aberta. (b) Malha fechada. Figura 4.12: Imagem SEM de um acelerómetro de massa pendular fora do plano (extraído de [10]). Acelerómetros ressonantes. Esta classe de sensores engloba a categoria de VBA que podem ser configurados para serem sensíveis a acelerações que actuam segundo direcções que podem estar no plano da estrutura do sensor, ou perpendiculares ao mesmo. A aceleração é medida como o resultado da mudança da frequência de ressonância das oscilações da barra, que se encontra sujeita à carga inercial da massa de prova, ao contrário 66 Capítulo 4. Arquitectura Proposta para um Catamaran do que se verifica nos acelerómetros de massa pendular onde, é medido o deslocamento da massa de prova. A fabricação deste tipo de acelerómetros já foi conseguida com sucesso recorrendo, quer ao silício, quer ao quartzo, como matéria prima. Na Figura 4.13(a) ilustra-se um VBA no plano produzido em silício (silicon oscillating accelerometer, SOA) que foi desenvolvido no Draper Laboratory. Neste caso, a configuração básica é uma estrutura monolítica (i.e., formado por um cristal único) em diapasão com uma grande massa de prova em silício, cuja oscilação é forçada de forma electrostática. A barra é carregada axialmente e quando uma aceleração é aplicada no plano do movimento oscilatório (no plano da bolacha de silício), a frequência de ressonância altera-se. A oscilação ressonante e a captura da frequência da barra em vibração é conseguida com uma estrutura em pente de silício, tal como se ilustra na Figura 4.13(b). (a) Vista alargada. (b) Sensor e actuador em forma de pente. Figura 4.13: Imagem SEM de um VBA no plano (extraído de [10]). O processo de fabricação do acelerómetro SOA é silício sobre vidro; sendo perfeitamente elástico, o silício permite elevada estabilidade e precisão no controlo de frequência de oscilação. O sensor é empacotado em vácuo num invólucro cerâmico que providencia um elevado factor de qualidade do oscilador (tipicamente > 100000) o que possibilita sensores com cerca de 1µg de estabilidade das polarizações. Por todo o mundo, inúmeras arquitecturas de acelerómetros MEMS estão a ser desenvolvidas por universidades, organizações governamentais e pela indústria. 4.5.3 Magnetómetro A presente subsecção pretende somente descrever, de forma sucinta, os princípios físicos que possibilitam a medição de campos magnéticos, em particular, o Campo Magnético Terrestre (CMT) (a sua utilização na navegação, foi abordada na Secção 3.4.1). Existem vários tipos de sensores que recorrem a diferentes efeitos para a medição de um campo magnético (e.g. efeito de Hall, efeito magnetoresistivo; por indução magnética, fluxgate; ou mesmo baseado na tecnologia SUperconducting Quantum Interference Device, SQUID). Como consequência da referida variedade, surgem sensores com valores diferentes de resolução, precisão, intervalo de medida, etc. Os sensores de efeito de Hall são incapazes de detectar o CMT visto tratar-se de um campo de baixa intensidade. Os 4.5. Sensores 67 sensores SQUID são possivelmente os que apresentam maior sensibilidade, mas necessitam de ser arrefecidos a temperaturas muito baixas, o que os torna inadequados para muitas aplicações. Para a medição do CMT (com intensidade de aproximadamente 0.5 a 0.6 Gauss) os sensores mais comuns, devido ao seu desempenho e condições de operação, são os magnetómetros magnetoresistivos e os fluxgate. Os primeiros têm vindo a conhecer um elevado crescimento nas aplicações relacionadas com navegação muito por causa da união de um desempenho acima das especificações e uma capacidade de integração que permite a sua implementação como um circuito integrado de pequeno volume. O magnetómetro Honeywell HMR3300, utilizado neste trabalho, é um exemplo de um sensor que faz uso da tecnologia magnetoresistiva para medição de um campo magnético Designados na literatura anglo-saxónica por sensores Anisotropic Magnetoresistive (AMR), têm a capacidade de medir campos magnéticos estáticos bem como a sua magnitude e direcção. Estes sensores são constituídos por uma película fina thin film de uma liga metálica de níquel-ferro (liga permalloy) depositado numa bolacha de silício e é moldado como um tira resistiva. As propriedades da película fina de níquel-ferro fazem com que sofra uma alteração de cerca de 2 a 3 % na sua resistividade na presença de um campo magnético. Tipicamente, quatro resistências deste tipo são ligadas numa configuração conhecida com ponte Wheatstone para que seja possível medir simultaneamente magnitude e direcção de um campo magnético ao longo de um eixo. Podem ter uma largura de banda de medida de cerca de 1 MHz e são também capazes de ser manufacturadas em grandes lotes em bolachas de silício e encapsulados em packages de circuitos integrados já existentes na indústria. Outra solução bastante popular e de bom desempenho, são os magnetómetros fluxgate que se encontram em utilização desde a década de 1920. Conseguem detectar campos magnéticos da ordem dos poucos mG bem como a magnitude e direcção de campos estáticos. Podem ter uma largura de banda que pode atingir 1 kHz. As desvantagens prendem-se com questões de falta de robustez, dimensão, e capacidade de integração muito inferior aos sensores que empregam tecnologia magnetoresistiva (baseado em [5]). Capítulo 5 Filtro de Navegação O presente Capítulo dedica-se à apresentação detalhada do filtro complementar de navegação proposto. Introduz-se o conceito da filtragem complementar aplicada à navegação, bem como a sua origem histórica. São também enunciadas algumas alternativas de algoritmos de navegação com utilização comum em aplicações da industria aeroespacial e em aplicações académicas. 5.1 Introdução e Motivação É razoável afirmar-se que os sistemas de navegação encontram aplicações num grande número de áreas, que vão desde os transportes, aplicações militares, aplicações aeroespaciais, etc. Assim, ao longo de muitos anos de investigação, surgem naturalmente muitas metodologias algorítmicas, que de alguma forma, tentam produzir, recorrendo ao conjunto de sensores disponíveis, a melhor estimativa do estado de um veículo. Em seguida, apresentam-se algumas dessas alternativas. Soluções de Filtros de Navegação Passaram já algumas décadas desde que foi apresentado na literatura uma análise unificada do erro dos sistemas de navegação inerciais [94], contudo, no que diz respeito às arquitecturas de filtragem para sistemas de navegação (que permita fusão sensorial), é impossível afirmar que exista uma única solução, muito menos que exista uma solução com desempenho sempre superior às outras. Um dos algoritmos mais popular, é o Filtro de Kalman Estendido (EKF) [95], que continua a encontrar muitas aplicações (consultar [96, 97, 98, 99, 100] e as referências aí incluídas). Contudo o EKF, devido à linearização e à incerteza na condição inicial, é frequente ter problemas de divergência, o que constitui uma dificuldade comum na sua implementação. Embora existam alternativas robustas descritas na literatura [101], é vulnerável a problemas numéricos quando implementado de forma não cuidada [102]. O Unscented Kalman Filter (UKF) foi proposto como uma alternativa ao EKF [97, 103, 104], que aproxima numericamente o valor médio e a covariância da estimação do estado parametrizado em espaços Euclidianos. Tem também sido crescente o interesse no desenvolvimento de observadores não lineares cuja estabilidade teórica pode ser provada e que originam regiões explícitas de atracção [105, 106, 107]. 68 69 5.1. Introdução e Motivação Uma metodologia que se tem revelado bastante eficaz, designa-se por filtragem complementar. Segundo [108], o princípio da filtragem complementar surgiu em 1953 no artigo [109], embora o termo "filtro complementar" tenha sido introduzido pela primeira vez em [110], no âmbito de uma aplicação relacionada com a aterragem por instrumentos de aeronaves (Instrumented Landing System, ILS). A teoria da filtragem complementar encontra suporte no trabalho do matemático Norbert Wiener (1894-1964) [111]: um sinal desconhecido pode ser estimado recorrendo a medidas corrompidas por ruído de um ou mais sensores cuja informação esteja naturalmente presente em bandas independentes e complementares do espectro de frequência [112, 108, 113]. A estrutura de um filtro complementar, enquadra-se adequadamente com o desenvolvimento de sistemas de navegação baseados em medidas auxiliares (como é o caso de sistemas de navegação inercial auxiliado por medidas de GPS e magnetómetro). Nesta estrutura estão enraizadas ideias chave tais como, a natureza complementar em frequência dos sensores, observabilidade e modelos linearizados para variáveis de erro estocásticas. Em seguida é apresentada uma descrição mais detalhada do conceito da filtragem complementar. Conceito da Filtragem Complementar Tal como foi referido anteriormente, foi Wiener [111] que primeiro resolveu o problema de estimação minimizando o erro quadrático médio (critério minimum mean-square estimation, MMSE). A filtragem complementar consiste em explorar as características da resposta em frequência de dois tipos de sensores segundo o critério MMSE, ou seja, um filtro complementar é um meio de combinar leituras de sensores redundantes em que a informação se encontra em frequências distintas e complementares sem distorcer o sinal [108]. Com este método consegue-se, de forma eficaz, rejeitar as bandas do espectro de frequência mais ruidosas (rejeição de perturbações), ao mesmo tempo que se tira partido das bandas onde se encontra a informação. Tal como é discutido, de forma convincente em [112], a perda de optimalidade dos filtros complementares, devido a ignorar-se a descrição estocástica do ruído, é ligeira, podendo até ser benéfica para os casos especiais onde é melhor considerar medidas irregulares que ocorrem fora da variância esperada. Analiticamente, o conceito de filtragem complementar, pode ser descrito como o problema de combinar duas medidas ruidosas, y1 (t) e y2 (t), do mesmo sinal s(t) com ruídos aditivos n1 (t) e n2 (t) y1 (t) = s(t) + n1 (t), y2 (t) = s(t) + n2 (t), (5.1) que são filtradas de forma independente através de funções de transferência H1 (s) e H2 (s). A porção de sinal s(t) pode ser determinística ou não-estacionária, contudo, não se dispõe de um modelo para s(t). Este tipo de abordagem é apresentado, de forma genérica, na Figura 5.1(a). A saída do filtro no domínio do tempo é descrita por ŝ(t) = H1 (s)[y1 (t)] + H2 (s)[y2 (t)], (5.2) onde H1 (s)[y1 (t)] e H2 (s)[y2 (t)] devem ser lidos como os sinais z1 (t) e z2 (t) que representam as saídas dos filtros com função de transferência H1 (s) e H2 (s) respectivamente, quando têm à entrada os sinais y1 (t) e y2 (t) respectivamente. 70 Capítulo 5. Filtro de Navegação O objectivo é sintetizar os filtros H1 (s) e H2 (s) para estimar de forma óptima o sinal s(t), a partir das medidas ruidosas y1 (t) e y2 (t). No domínio da frequência, se as características espectrais de s(t) fossem conhecidas e estacionárias, fica-se na presença do chamado problema de filtragem de Wiener. No domínio da frequência, a equação (5.2) pode ser reescrita na forma Ŝ(s) = H1 (s) (S(s) + N1 (s)) + H2 (s) (S(s) + N2 (s)) = (H1 (s) + H2 (s)) S(s) + H1 (s)N1 (s) + H2 (s)N2 (s), (5.3) onde S(s) e Ŝ(s) são, respectivamente, a transformada de Laplace do sinal a estimar e da sua estimativa e, N1 (s) e N2 (s) são as transformadas de Laplace do ruído aditivo às medidas s1 (t) e s2 (t). Para não introduzir distorção no sinal s(t), reparando na segunda linha de (5.3) faz-se a função de transferência H2 (s), complementar de H1 (s) H1 (s) + H2 (s) = 1 ⇐⇒ H2 (s) = 1 − H1 (s), para todo o s, (5.4) e reescreve-se a equação (5.3) da seguinte forma (5.5) Ŝ(s) = S(s) + (H1 (s)N1 (s) + (1 − H1 (s))N2 (s)) Na Figura 5.1(b) ilustra-se a aplicação de filtragem com a restrição complementar. (a) Aplicação com dois graus de liberdade. (b) Aplicação com um grau de liberdade, restrição complementar. Figura 5.1: Aplicações de filtragem. Este resultado afirma que os filtros são complementares, que ŝ(t) vai ser constituído por uma cópia do sinal s(t) e que os ruídos n1 (t) e n2 (t) vão ser filtrados pelas função de transferência H1 (s) e pela sua complementar (1 − H1 (s)), respectivamente. Visto que se assumiu que as medidas dos sensores são corrompidas por ruídos com largura de banda complementares, se N1 é ruído na banda alta, N2 tem de ser ruído de banda baixa. Então, se H1 (s) é um filtro passa-baixo, vai rejeitar o ruído n1 (t) e, de forma análoga, H2 (s) = (1 − H1 (s)) vai ser um filtro passa-alto, rejeitando portanto n2 (t). Analiticamente, fica Ŝ(s) = S(s) + (H1 (s)N1 (s) + (1 − H1 (s))N2 (s)) ≃ S(s) (5.6) porque H1 (s)N1 (s) ≃ 0 e (1 − H1 (s))N2 (s) ≃ 0. Portanto, enquanto que o filtro complementar não introduz distorção ao sinal, tem a capacidade de remover as componentes 71 5.1. Introdução e Motivação de ruído. Esta abordagem apresenta-se como uma solução invariante no tempo muito eficiente, sendo os seus parâmetros definidos tendo em conta as características de largura de banda complementares dos sensores cuja informação se pretende fundir. Para uma melhor compreensão, considere-se que H1 (s) é um filtro passa-baixo de primeira ordem k , (5.7) H1 (s) = s+k então (5.5) é reescrita como Ŝ = S + k s N1 + N2 . s+k s+k (5.8) Da equação (5.8), torna-se trivial perceber que o parâmetro k vai determinar a frequência de corte que molda o filtro, e que necessita de ser ajustado tendo em conta a largura de banda do ruído. As alterações em k vão somente afectar a filtragem do ruído, no entanto, o sinal s(t) não vai sofrer qualquer alteração. Ficando assim ao cargo de quem determina o valor de k, tendo em conta as características dos sensores disponíveis, o efeito que os termos de ruído têm na estimativa ŝ(t). Pode-se afirmar que a determinação do parâmetro k é independente dos parâmetros que modelam o método de síntese. Os referidos parâmetros podem ser vistos como botões de afinação, relacionados com um determinado critério que moldam a resposta em frequência. A análise das funções de transferência pode ser feita recorrendo aos clássicos diagramas de Bode. O exemplo apresentado nos parágrafos anteriores é demasiado simples (i.e., tem poucos graus de liberdade), assim, para cumprir com restrições adicionais de algumas aplicações (como a aplicação em sistemas de navegação), a ordem do filtro pode ser estendida. A extensão da ordem do filtro vai possibilitar novos graus de liberdade para moldar a resposta em frequência, podendo melhorar a filtragem do ruído, sem nunca introduzir distorção no sinal. Aplicação da Filtragem Complementar em Sistemas de Navegação Os filtros complementares têm sido bastante utilizados na resolução de problemas de fusão sensorial em sistemas de navegação. A sua formulação no domínio da frequência e estrutura simples, permite uma implementação e teste pouco complexa em hardware digital ou até mesmo analógico, como é o caso das primeiras aplicações na década de 1950 [110, 81, 78]. São algoritmos muito apelativos, visto que, não têm requisitos de hardware computacional muito dispendiosos, são simples, fiáveis e robustos. Portanto, a sua implementação em veículos autónomos representa uma escolha lógica. Alguns exemplos de trabalhos publicados com plataformas autónomas, que recorrem a filtros complementares, são: veículos oceânicos [114, 115, 116], helicópteros de aeromodelismo [117], aeronaves de asa fixa [44, 118]. A característica da largura de banda complementar está presente nos sensores utilizados. Para a posição, o sinal do GPS e a dupla integração da força específica são complementares. Para a atitude sucede o mesmo entre as medidas obtidas a partir do sensor magneto-pendular e as medidas da integração das leituras dos giroscópios. 72 Capítulo 5. Filtro de Navegação O filtro determina um sinal de erro entre a estimativa e uma referência calculada directamente a partir de um dos sensores. Um valor escalado deste erro é de seguida realimentado. Sendo sensores inerciais, quer os giroscópios, quer os acelerómetros fornecem medidas relativas ao referencial inercial expressas no referencial do corpo. Deste modo, o filtro complementar apresenta a estimação da posição e da orientação em relação a um referencial inercial. A medida dos giroscópios e dos acelerómetros é afectada por polarizações que têm de ser compensadas introduzindo a dinâmica baseada nas relações cinemáticas de um corpo rígido no modelo do filtro. Nas Secções 5.2 e 5.3 vão ser apresentados em detalhe os filtros complementares de atitude e posição respectivamente. Os filtros de navegação propostos estão também descritos em duas publicações [119, 120], em que o autor do presente trabalho é co-autor. É dada especial ênfase às características de estabilidade (a região de atracção é caracterizada explicitamente), desempenho e implementação prática do algoritmo do filtro. A estrutura do sistema de navegação baseado em filtros complementares, apresentada na Figura 5.2, consiste num filtro de atitude e num filtro de posição. Formulado em tempo discreto, as entradas do filtro de atitude são as leituras dos giroscópios de velocidade, corrompidas por polarizações e uma medida instantânea de atitude baseada em observações vectoriais (campo magnético terrestre e medidas pendulares). O filtro de posição recorre às medidas dos acelerómetros e a medidas de GPS, para estimar a velocidade no referencial do Corpo e a posição no referencial da Terra. "$ " # " Figura 5.2: Arquitectura global do sistema de navegação. A representação da orientação através de ângulos de Euler é escolhida como variáveis de estado para o filtro de atitude, devido à sua simplicidade, e são adoptados ganhos de realimentação estacionários na síntese de filtro. As características intrínsecas multi-ritmo do conjunto de sensores utilizados são tratadas analiticamente e uma metodologia de síntese baseada em resultados de optimalidade para sistemas periódicos é apresentada. O algoritmo que produz as medidas instantâneas de atitude, designado por Estimador 73 5.2. Filtro Complementar de Atitude de Atitude Magneto-Pendular (denominado na literatura anglo-saxónica por MagnetoPendular Sensor, MPS) [121], foi descrito na Secção 3.4.2. 5.2 Filtro Complementar de Atitude Na presente secção, propõe-se um filtro complementar com o propósito de estimar a atitude da plataforma. As suas características de estabilidade e desempenho são também deduzidas, sendo também justificada a utilização de ferramentas de análise no domínio da resposta em frequência, atendendo às características espectrais dos sensores inerciais e dos sensores auxiliares. Com o objectivo de facilitar a leitura texto, definem-se novamente i h do presente ′ algumas grandezas importantes. Seja λ̄ = ψ̄ θ̄ φ̄ o vector que contém os ângulos de Euler designados por ângulos de yaw, pitch e roll, respectivamente [60]. A cinemática dos ângulos de Euler é descrita por 0 sin φ sec θ cos φ sec θ ˙ = Q(λ̄)ω̄, Q(λ) = λ̄ cos φ − sin φ . 0 1 sin φ tan θ cos φ tan θ (5.9) onde ω̄ é a velocidade angular do corpo expressa nas coordenadas do referencial do corpo. O equivalente em tempo discreto do sistema (5.9) aqui considerado, é obtido com recurso ao método de Euler [122] com a parcela do lado direito sujeita a um retentor de amostras (sample-and-hold ), resulta em λ̄k+1 = λ̄k + T Q(λ̄k )ω̄ k , (5.10) onde T é o período de amostragem e o índice k é a abreviação a constante de tempo t = kT . Neste trabalho, a estimação da atitude é conseguida explorando a velocidade angular e as medidas de atitude fornecidas pelos sensores inerciais. A velocidade angular é obtida através das medidas fornecidas pelos giroscópios de velocidade que são afectadas por ruído e por polarizações do tipo random-walk [108], ω r k = ω̄ k + b̄ω k + wωr k , b̄ω k+1 = b̄ω k + wb k , (5.11) onde wωr ∼ N (0, Ξω ) é ruído branco Gaussiano com valor esperado igual a zero e b̄ω é a polarização do sensor excitado por ruído branco Gaussiano wb ∼ N (0, Ξb ). Reescrevendo a cinemática dos ângulos de Euler (5.10-5.11) no formato de variáveis de estado, fica " # # " #" # " # " #" I −T Q(λ̄k ) λ̄k λ̄k+1 T Q(λ̄k ) −T Q(λ̄k ) 0 wωr k . (5.12) = + ωr k + 0 I wb k b̄k+1 0 0 I b̄k 74 Capítulo 5. Filtro de Navegação Considere-se o seguinte sistema realimentado não linear como o filtro de atitude proposto " # " #" # " # λ̂k+1 I −T Q(λ̄k ) λ̂k T Q(λ̄k ) = + ωr k b̂k+1 0 I b̂k 0 " # Q(λ̄k )(K1λ − I) + Q(λ̄k−1 ) + (yλ k − ŷλ k ), K2λ ŷλ k = Q−1 (λ̄k−1 )λ̂k , (5.13a) yλ k = Q−1 (λ̄k−1 )λ̄k + vλ k , (5.13b) onde yλ k é o vector dos ângulos de Euler observados e transformados para o espaço das velocidades angulares e corrompidas por ruído branco Gaussiano de observação vλ ∼ N (0, Θλ ), e K1λ , K2λ ∈ M(3, 3) representam as matrizes dos ganhos de realimentação. O diagrama de blocos do filtro de atitude proposto é apresentado na Figura. 5.3. Figura 5.3: Filtro complementar de atitude. A observação de atitude yλ pode ser determinada a partir de dois vectores medidos no referencial do corpo, tais como o Campo Gravítico e Magnético terrestres ou também por observações fornecidas por outros dispositivos como por exemplo sensores de visão ou star trackers. O problema de determinar a atitude com o auxílio de medidas vectoriais é conhecido, na literatura, como o Problema Procrustes Ortogonal [123] ou como o Problema de Wahba [124] tendo sido objecto de intensivo estudo, o que originou várias soluções propostas ao do longo tempo (consultar [97, 123] e referências inclusas). A solução proposta neste trabalho calcula as observações dos ângulos de Euler fazendo uso de uma abordagem do tipo TRIAD [125] determinística. Considere-se o seguinte sistema linear invariante no tempo auxiliar " # " #" # " #" # xλ k+1 I −T I xλ k −T I 0 wωr k = + , 0 I xb k+1 0 I xb k wb k # " h i x λk + vλ k , yx k = I 0 xb k (5.14) 5.2. Filtro Complementar de Atitude 75 que vai ser utilizado seguidamente como o setup para o desenvolvimento no domínio da resposta em frequência para o filtro de atitude variante no tempo (5.13). Na técnica de síntese proposta, os ganhos de realimentação K1λ e K2λ em (5.13) são identificados com os ganhos de Kalman estacionários para o sistema (5.14), onde as matrizes da covariância Ξω , Ξb e Θλ representam como que botões de afinação (tuning knobs) para moldar a resposta em frequência desejada do filtro de atitude. O sistema invariante no tempo (5.14) adoptado para a determinação dos ganhos de realimentação e da resposta em frequência do filtro, é similar à cinemática de atitude (5.12) para Q(λ) = Q(0). Embora, numa primeira análise, este facto sugira que as propriedades do filtro proposto possam ser limitadas ao caso especifico de λk = 0, o filtro é na realidade assimptoticamente estável para qualquer trajectória de atitude parametrizada por configurações não-singulares de ângulos de Euler. As propriedades de estabilidade para o caso específico dos ângulos de Euler Z-Y-X são derivadas no teorema que se apresenta seguidamente. No entanto a extensão deste resultado é imediata para outras convenções de ângulos de Euler [60]. Teorema 1. Seja K1λ e K2λ os ganhos de Kalman estacionários para o sistema (5.14) e assuma-se que o ângulo de roll descrito pela plataforma é majorado, |θ| ≤ θmax < π2 . Então, o filtro complementar de atitude (5.13) uniformemente assimptoticamente estável (UAE). Demonstração. Seja λ̃k = λ̄k − λ̂k , b̃ω k = b̄ω k − b̂ω k a representação dos erros de estimação. A dinâmica de erro associada é dada por # " #" # " Q(λ̄k )(I − K1λ )Q−1 (λ̄k−1 ) −T Q(λ̄k ) λ̃k λ̃k+1 = −K2λ Q−1 (λ̄k−1 ) I b̃k b̃k+1 " #" # −T Q(λ̄k ) 0 wωr k + wb k 0 I # " Q(λ̄k )(I − K1λ ) − Q(λ̄k−1 ) vλ k . (5.15) + −K2λ Por definição, o filtro é dito como sendo UAE se a origem do sistema (5.15) é UAE na ausência de ruídos de observação e de estado [126]. Contudo, os ruídos de estado e de observação são explicitados por conveniência. O sistema (5.14) pode ser escrito de forma mais compacta na sua formulação em espaço de estados h onde xk = x′λ k xk+1 = Fxk + Gwk , yk = Hxk + vk , i′ h i′ x′b k , wk = wω′ r k wb′ k , yk = yx k , vk = vλ k , " # " # h i I −T I −T I 0 F= , G= , e H= I 0 . 0 I 0 I (5.16) É relativamente simples provar que [F, H′ ] é detectável e [F, G] é completamente estabilizável, então o sistema em malha fechada x̃k+1 = (F − KH)x̃k + Gwk − Kvk , (5.17) 76 Capítulo 5. Filtro de Navegação h i′ ′ ′ onde K = K1λ , é UAE [127]. Defina-se a transformação de variáveis de Lyapunov K2λ " # " # x̃λ k λ̃x k , = Tk x̃b k b̃x k " # Q(λ̄k−1 ) 0 Tk = , 0 I (5.18) que está bem definida [128] porque θ é assumido limitado. Aplicando a transformação de variáveis Tk a (5.17) fica " " # # λ̃x k+1 −1 λ̃x k + Tk+1 Gwk − Tk+1 Kvk = Tk+1 (F − KH)Tk b̃x k b̃x k+1 " #" # Q(λ̄k )(I − K1λ )Q−1 (λ̄k−1 ) −T Q(λ̄k ) λ̃x k = −K2λ Q−1 (λ̄k−1 ) I b̃x k # # " " Q(λ̄k )K1λ −T Q(λ̄k )wωr k vλ k . − + K2λ wb k (5.19) A origem de (5.17) é UAE e, pelas propriedades das transformações de Lyapunov, a origem de (5.19) é UAE . Então, a origem de (5.15) é uniformemente assimptoticamente estável, com pretendido. Os resultados de estabilidade do Teorema 1 podem facilmente ser estendidos para o caso em que se têm ganhos de Kalman variantes no tempo. Contudo, o filtro complementar proposto é desenhado no domínio da frequência, através de uma formulação invariante no tempo (5.14), para obter a função de transferência desejada que consiga fundir os conteúdos espectrais de baixa frequência das observações de atitude com a informação de alta frequência contida nas medidas dos sensores angulares de velocidade. São adoptados ganhos de Kalman estacionários para se obter um filtro assimptoticamente estável, que permite uma fácil implementação e teste em hardware de baixo custo. De notar que, em condições de operação encontradas em algumas aplicações terrestres e oceânicas, o filtro proposto (5.13) é também óptimo. Este resultado é apresentado no teorema seguinte. Teorema 2. Sejam as perturbações em (5.12) e (5.13b) caracterizadas pelos ruídos brancos Gaussianos wωr ∼ N (0, Ξω ), wb ∼ N (0, Ξb ) e vλ ∼ N (0, Θλ ), respectivamente, e assuma-se que os ângulos de pitch e roll são constantes. Então, o filtro de atitude complementar (5.13) é o filtro de Kalman estacionário para o sistema (5.12) no sentido em que os ganhos de realimentação de Kalman Kopt k convergem assimptoticamente tal como se apresenta em seguida # " Q(λ̄k )(K1λ − I) + Q(λ̄k−1 ) (5.20) lim Kopt k − = 0. k→∞ K2λ Demonstração. A matriz da covariância do erro de estimação do filtro de Kalman para o sistema (5.14) satisfaz ′ Pxλ k+1|k = FPxλ k|k−1 F′ + GΞG′ − FPxλ k|k−1 H′ S−1 P λ k HPxλ k|k−1 F , (5.21) 77 5.2. Filtro Complementar de Atitude onde SP λ k = HPxλ k|k−1 H′ + Θλ , Ξ = Ξ0ω Ξ0b , consultar referências [126, 127] para a demonstração de (5.21). h Dadas i as variáveis de transformação (5.18), a matriz da covariλ̃x k+1 ′ ância Σxλ k+1|k = E b̃ [ λ̃x k+1 b̃′x k+1 ] é dada por Σxλ k+1|k = Tk+1 Pxλ k+1|k T′k+1 e, x k+1 utilizando (5.21), satisfaz ′ T−1 k+1 Σxλ k+1|k Tk+1 −1 ′ − FT−1 k Σxλ k|k−1 Tk ′ = FT−1 k Σxλ k|k−1 Tk −1 −1 −1 H′ S−1 P k HTk Σxλ k|k−1 ⇓ F′ + GΞG′ −1 ′ F T′k Σxλ k+1|k = Zk Σxλ k|k−1 Z′k + Tk+1 GΞG′ T′k+1 −1 ′ −1 ′ − Zk Σxλ k|k−1 T′k H SΣλ k HT−1 k Σxλ k|k−1 Zk , ′ −1 onde SΣλ k = HT−1 H′ + Θλ , e Zk = Tk+1 FT−1 k Σxλ k|k−1 (Tk ) k . Com um ligeiro abuso de notação, sejam K1λ k e K2λ k a representação dos ganhos óptimos variantes no tempo para o sistema (5.14). Formulando o filtro de atitude (5.13) com ganhos variantes no tempo, obtém-se " # #" # " # " T Q(λ̄k ) I −T Q(λ̄k ) λ̂k λ̂k+1 ωr k + = b̂k b̂k+1 0 0 I " # Q(λ̄k )(K1λ k − I) + Q(λ̄k−1 ) + (yλ k − ŷλ k ). K2λ k (5.22) A prova de optimalidade é conseguida mostrando que i) Σxλ k+1|k é a covariância do erro do filtro de atitude (5.22) e que ii) Σxλ k+1|k é a covariância do erro do filtro óptimo para a cinemática da atitude (5.12). Se estas condições forem verificadas, o filtro de Kalman óptimo e estacionário para a cinemática de atitude (5.12) são respectivamente dados pelos filtros de atitude complementares (5.13) e (5.22). Para uma discussão sobre a optimalidade do filtro de Kalman e sobre a unicidade dos ganhos óptimos, sugere-se a leitura de [126, 127]. A condição de ângulos de pitch e de roll constantes implica que Q(λ̄k+1 ) = Q(λ̄k ), e ′ ′ portanto as cinemáticas (5.15) e (5.19) são idênticas, [λ̃x k b̃′x k ]′ = [λ̃k b̃′k ]′ and Σxλ k+1|k é a covariância do erro do filtro de atitude (5.22). A matriz Σxλ k+1|k é a covariância do erro do filtro de Kalman para o sistema zk+1 = Zk zk + Tk+1 Gwz k , yz k = HT−1 k zk + vz k , (5.23) onde zk ∈ R6 , wz ∼ N (0, Ξ), vz ∼ N (0, Θλ ). Utilizando Q(λ̄k+1 ) = Q(λ̄k ), as matrizes do sistema (5.23) são dadas por " # " # I −T Q(λ̄k ) −T Q(λ̄k ) 0 Zk = , Tk+1 G = , 0 I 0 I h i −1 (λ̄ HT−1 = , Q ) 0 k−1 k que são as matrizes de espaço de estados da cinemática de atitude (5.12) com a observação de atitude dada por (5.13b). Consequentemente, o filtro de atitude (5.22) produz a 78 Capítulo 5. Filtro de Navegação matriz da covariância do erro de estimação óptima Σxλ k+1|k para o sistema (5.12) e, pela unicidade do filtro óptimo, o filtro de atitude (5.22) é um filtro de Kalman. Recorrendo a K1λ k → K1λ e K2λ k → K2λ quando k → ∞, obtém-se (5.20), que completa a prova. Os resultados de optimalidade do filtro complementar apresentados no Teorema 2 são válidos para aplicações onde os ângulos de pitch e de roll são constantes ou, por razões práticas, podem ser considerados aproximadamente constantes. Para o caso de ângulos de picth e de roll variantes no tempo, o desempenho do filtro complementar e dos filtros óptimos pode ser comparada offline calculando as covariâncias dos erros de estimação dos filtros, como está detalhado em [127]. Mais à frente neste trabalho, a optimalidade dos ganhos de realimentação adoptados no processamento dos dados experimentais obtidos a bordo do catamaran DELFIMx é analisada. Embora os resultados de optimalidade para o filtro complementar sejam apresentados no Teorema 2, a síntese dos ganhos de realimentação é conseguida no domínio da resposta em frequência devido às características dos sensores auxiliares de atitude em estudo. Esta abordagem explora a região das baixas frequências onde as observações de atitude são tipicamente mais precisas, sendo a região das altas frequências preenchida pela integração dos giroscópios de velocidade, onde originam medidas de melhor qualidade. 5.3 Filtro de Posição A cinemática em tempo continuo é dada por p̄˙ = v̄, v̄˙ = R̄B ā, (5.24) onde p̄ e v̄ são a posição e a velocidade no referencial da Terra, B ā é a aceleração no referencial do corpo e R̄ representa a matriz de rotação entre o referencial do corpo {B} e o referencial da Terra {E}, logo R̄ = E B R.O equivalente em tempo discreto é obtido por sample-and-hold das entradas [122] e é dado por p̄k+1 = p̄k + T v̄k + T2 B R̄k āk , 2 v̄k+1 = v̄k + T R̄k B āk . (5.25) Tal como foi apresentado na Secção 3.2.2 o acelerómetro mede uma grandeza denominada por força especifica, que se define como a diferença entre as acelerações inercial e gravítica do corpo rígido [94], B ak e B gk respectivamente, expressas no referencial do corpo, fk = B ak − B gk + wf , (5.26) onde wf ∼ N (0, Ξa ) é um ruído branco Gaussiano de média zero. A cinemática de posição (5.25), recorrendo às medidas dos acelerómetros, é descrita por " # # " #" # " T2 R̄ I T R̄k p̄k+1 p̄k k 2 (f + R̄′k E ḡ) = + ′ ′ B v̄ B v̄ T R̄ R̄ 0 R̄ R̄ k+1 k k+1 k k+1 k " # #" T2 I − 2 R̄k wp k + , ′ 0 −T R̄k+1 R̄k wf k (5.27) 79 5.3. Filtro de Posição onde B v̄k = R̄′k v̄k+1 é a velocidade expressa no referencial do corpo e wp ∼ N (0, Ξp ) é um ruído branco Gaussiano de média zero que modela pequenas perturbações na posição. O observador da cinemática de posição, ilustrado na Figura 5.4, é escrito como " # " #" # " # T2 I T R̄k p̂k+1 R̄ p̂k k 2 = + (f + R̄′k E ḡ) ′ B v̂ ′ B 0 R̄k+1 R̄k T R̄k+1 R̄k v̂k k+1 # " K1 p (yp k − ŷp k ), + ′ R̄k+1 K2 p ŷp k = p̂k , (5.28a) (5.28b) yp k = p̄k + vp k , onde yp k é a medida de posição fornecida pelo receptor de GPS e vp ∼ N (0, Θp ) é ruído Gaussiano de observação de média zero. A força de propulsão do veículo é, em geral, orientada fisicamente ao longo dos eixos que se encontram solidários com o corpo, produzindo movimentos cujas direcções são predominantes ao longo dos eixos do mesmo. Como Figura 5.4: Filtro complementar de posição. exemplo, atente-se na situação em que os propulsores estão montados e actuam ao longo do eixo do x do corpo, as principais variações de velocidade são naturalmente expressas ao longo desse eixo. Também elevadas velocidades, devido a manobras agressivas, introduzem alterações de alta frequência na velocidade quando expressa no referencial da Terra, enquanto a velocidade no referencial do corpo mantém-se alinhada com direcção predominante de movimento do veículo. Como exemplo, se a velocidade medida no referencial do corpo de um navio se mantém constante enquanto este descreve um movimento circular uniforme, as componentes do vector de velocidade no referencial da Terra são sinusoidais. Consequentemente, as estimativas de velocidade do filtro de posição são expressas nas coordenadas do referencial do corpo, em oposição a serem expressas no referencial da Terra, com o objectivo de reduzir os requisitos de largura de banda em situações de variações de atitude e actuação no veículo. 80 Capítulo 5. Filtro de Navegação Os termos de realimentação K1 p e K2 p são identificados como aos ganhos de Kalman para o sistema # #" # " # " #" " 2 wp k I − T2 I T I xp k xp k+1 , + = wv k 0 −T xv k 0 I xv k+1 " # (5.29) h i x pk yx k = I 0 + vp k , xv k onde wv ∼ N (0, Ξa ) é um ruído branco Gaussiano de média nula com a covariância do ruído do acelerómetro war . Na síntese do filtro de posição, as matrizes da covariância Ξp , Ξa , e Θp são utilizadas como tuning knobs para moldar a resposta em frequência do filtro. A estabilidade e desempenho do filtro complementar de posição (5.28) são abordadas nas proposições seguintes. Teorema 3. Sejam K1 p e K2 p os ganhos de Kalman estacionários para o sistema (5.29). Então o filtro complementar de posição (5.28) é UAE. Demonstração. A estrutura da prova é semelhante à do Teorema 1. Definam-se os erros de estimação p̃k = p̄k − p̂k e B ṽk = B v̄k − B v̂k . A cinemática associada é descrita por " #" # # " I − K1p T R̄k p̃k p̃k+1 = B ṽ −K2p R̄′k+1 R̄k B ṽk k+1 # " # #" " 2 K1p wp k I − T2 R̄k − vp k . + R̄′k+1 K2p 0 −T R̄′k+1 R̄k war k (5.30) A formulação compacta em espaço de estados para o sistema (5.29) é descrito como xk+1 = Fxk + Gwk , yk = Hxk + vk , (5.31) h i′ h i′ onde xk = x′p k x′v k , wk = wp′ k wv′ k , yk = yx k , vk = vp k , F = [ 0I TII ], G = h i h i 2 I − T2 , e H = I 0 . Os pares [F, H′ ] e [F, G] são detectáveis e completamente 0 −T estabilizáveis, respectivamente. Logo, o sistema em malha fechada x̃k+1 = (F − KH)x̃k + Gwk − Kvk , (5.32) ′ onde K = K′1p K′2p , é UAE [127]. Defina-se a transformação de variáveis de Lyapunov, adoptada em [129], dado por " # " # x̃p k p̃k , = Tk x̃v k ṽk Tk = " # I 0 , 0 R̄k (5.33) e considere-se wv k = R̄k war k . Aplicando a transformação de Lyapunov a (5.32) fica (5.30), então a origem de (5.30) é uniformemente assimptoticamente estável pela propriedades das transformações de Lyapunov [128]. 5.3. Filtro de Posição 81 No seguinte teorema mostra-se que o filtro de posição é óptimo para a cinemática de posição (5.28), sob o pressuposto ligeiro de que os ruídos brancos Gaussianos da tríade de acelerómetros são estocasticamente independentes, e caracterizados pela mesma variância. Esta condição verifica-se em setups realísticos onde as medidas de força especifica são fornecidas por três acelerómetros, do mesmo fabricante e modelo, montados ortogonalmente. Teorema 4. Sejam as perturbações em (5.27) e (5.28b) caracterizadas por ruídos brancos Gaussianos wp ∼ N (0, Ξp ), war ∼ N (0, ξa I), e vp ∼ N (0, Θp ). Então o filtro complementar de posição (5.28) é o filtro de Kalman estacionário para o sistema (5.27) no sentido em que o ganhos de Kalman de realimentação Kopt k converge assimptoticamente como se segue # " K 1p (5.34) lim Kopt k − = 0. ′ k→∞ R̄k+1 K2 p Demonstração. A matriz da covariância do erro de estimação do filtro de Kalman para o sistema (5.31) satisfaz ′ Pxp k+1|k = FPxp k|k−1 F′ + GΞG′ − FPxp k|k−1 H′ S−1 (5.35) P p HPxp k|k−1 F , onde SP p = HPxp k|k−1 H′ + Θ, Ξ = Ξ0p Ξ0a . Fazendo uso de um ligeiro abuso de notação, sejam K1p k e K2p k a representação dos ganhos óptimos variantes no tempo do sistema (5.29). Formule-se o filtro de posição (5.28) com ganhos variantes no tempo " # " #" # " # T2 p̂k+1 p̂k I T R̄k R̄k 2 = + (f + R̄′k E ḡ) B v̂ B v̂ ′ ′ R̄ 0 R̄ R̄ T R̄ k+1 k k+1 k k+1 k " # K1p k + (yp k − ŷp k ), R̄′k+1 K2p k (5.36) Aplicando de Lyapunov (5.33), a matriz da covariância Σpk+1|k = h i a transformação p̃k+1 ′ ′ E ṽk+1 [ p̃k+1 ṽk+1 ] é dada por Σpk+1|k = Tk+1 Px k+1|k T′k+1 e satisfaz ′ −1 ′ ′ F Tk+1 + Tk+1 GΞG′ T′k+1 Σpk+1|k = Tk+1 FT−1 k Σpk|k−1 Tk −1 ′ −1 ′ −1 ′ −1 ′ ′ − Tk+1 FT−1 Σ H S HT Σ T F Tk+1 , T p k|k−1 pk|k−1 k k k Σp k k (5.37) ′ −1 onde SΣp k = HT−1 H′ + Θ. Assumindo que a matriz da covariância do k Σpk|k−1 (Tk ) ruído dos acelerómetros é diagonal, Ξa = ξa I, as matrizes em (5.37) são dadas por # " h i I T R̄k −1 −1 , HTk = I 0 , Tk+1 FTk = 0 R̄′k+1 R̄k # " Ξp 0 ′ ′ G′ T′k+1 Tk+1 GΞG Tk+1 = Tk+1 G 0 Ξa # " Ξp 0 G′ T′k+1 = Tk+1 G ′ 0 R̄k Ξa R̄k #" #" #′ " 2 2 I − T2 R̄k Ξp 0 I − T2 R̄k , = 0 Ξa 0 −T R̄′k+1 R̄k 0 −T R̄′k+1 R̄k 82 Capítulo 5. Filtro de Navegação o que evidencia que Σpk+1|k é a matriz da covariância do erro óptima para a cinemática de posição (5.27). Utilizando K1p k → K1p e K2p k → K2p quando k → ∞ produz (5.34) e completa a prova. Embora sejam apresentados resultados de optimalidade para o filtro de posição, o sistema em malha fechada é obtido com síntese no domínio da frequência, e os ganhos de realimentação K1 p e K2 p são os ganhos de Kalman estacionários para o sistema (5.29). Neste enquadramento, os conteúdos espectrais de alta frequência das medidas dos acelerómetros são explorados, removendo por filtragem os erros na compensação da gravidade e das polarizações. Completa-se o espectro da saída do filtro fazendo uso da informação de baixa frequência disponibilizada pelas observações de posição do GPS. 5.4 Implementação 5.4.1 Estimador de Atitude Magneto-Pendular Por conveniência na leitura, apresenta-se em seguida, de forma sintética, os passos da implementação analítica do MPS: • Remoção da aceleração centrípeta das leituras do acelerómetro f = [fx , fy , fz ]′ f̂ = f − ω × B v. • Cálculo dos ângulos de pitch (θ) e roll (φ) com f̂ = [fˆx , fˆy , fˆz ]′ φ = arctan2 −fˆy , −fˆz , ! ˆx sin φ f , sin φ 6= 0 arctan − fˆ y ! θ= . ˆx cos φ f , cos φ 6= 0 arctan − fˆ (5.38) (5.39) z • Cálculo do ângulo de yaw (ψ) Medida do magnetómetro B mr = R′X (φ)R′Y (θ)R′Z (ψ)E m̄ + nm . Medida do magnetómetro projectada no plano x-y do referencial {E} Ea m = RY (θ)RX (φ)B mr . (5.40) (5.41) Ângulo de yaw ψ = arctan2 E m y Ea m x − E m x Ea m y , E m x Ea m x + E m y Ea m y . (5.42) onde E m̄ é conhecido e representa o campo magnético Terrestre expresso no referencial {E}, nm é o ruído na medida do magnetómetro, RX (φ), RY (θ), e RZ (ψ) representam as matrizes de rotação elementares de roll, pitch, e yaw, respectivamente. 5.4. Implementação 5.4.2 83 Acoplamento do Filtro Complementar O sistema de navegação proposto integra os filtros complementares de atitude e de posição para produzir uma estimativa da atitude e da posição do veículo. Os blocos apresentados no diagrama da Figura 5.2 já foram detalhados anteriormente neste trabalho: os filtros complementares de atitude e posição são descritos nas Secções 5.2 e 5.3 e são ilustrados nas Figuras 5.3 e 5.4, respectivamente, e os blocos do Sensor Magneto-Pendular e da Remoção da Aceleração Centrípeta são descritos na Secção 3.4.2. Os termos de atitude na cinemática do filtro de posição e a utilização de medidas pendulares no MPS produzem acoplamentos entre os filtros de atitude e posição, ilustrado pelas ligações entre blocos na Figura 5.2, e que são descritos de seguida. A matriz de rotação de atitude R̄k e o termo de actualização (update) de atitude ′ R̄k+1 R̄k são adoptados na cinemática do filtro de posição (5.28), como ilustrado no diagrama de blocos da Figura 5.4. O termo de atitude R̄k é obtido pelo filtro de atitude, pois é a melhor estimativa de atitude disponível na implementação prática do sistema de navegação. O termo de actualização descrito por R̄′k+1 R̄k ≈ e−T [ωr k −b̂ω k ×] é obtido utilizando a medida do giroscópio de velocidade e a estimativa da sua polarização, onde [a×] é a matriz skew simétrica definida pelo vector a ∈ R3 de forma a que [a×] b = a × b, b ∈ R3 . Da mesma forma, a matriz Q(λ̄k ) é construída recorrendo à melhor estimativa de atitude a cada instante k, que é dado pelo filtro de atitude. As medidas gravíticas utilizadas no cálculo da medida de atitude yλ são sujeitas à distorção causada pelas acelerações lineares e angulares. Como uma forma de tornar mais robusta a medida de atitude yλ , as acelerações angulares são compensadas recorrendo às velocidades angular e linear como se mostra em (5.38), permitindo leituras válidas do MPS mesmo na presença de acelerações centrípetas que ocorrem até em condições de trimming tais como, trajectórias helicoidais. As propriedades teóricas de estabilidade e desempenho dos filtros de posição e atitude demonstradas nas Secções 5.2 e 5.3 não podem ser generalizadas para o sistema de navegação total devido ao acoplamento do filtro e devido à utilização de medidas pendulares na observação auxiliar de atitude. Esta limitação é consequência dos sensores de atitude auxiliares escolhidos, sendo possível garantir a estabilidade e desempenho com outros setups experimentais, e.g. recorrendo a sensores não pendulares, sensores auxiliares baseados em visão e desacoplando os filtros de atitude e de posição fazendo uso de unidades de referência de atitude externas. Para a implementação do sistema de navegação proposto, simulações de Monte Carlo intensivas mostraram que na prática a arquitectura é estável. 5.4.3 Filtragem Multi-Ritmo Em geral, a frequência de amostragem do GPS é inferior à frequência de amostragem dos sensores inerciais. Neste contexto, os ganhos de realimentação óptimos são obtidos considerando o filtro de posição multi-ritmo como um estimador periódico, e adoptando os resultados de optimalidade para sistemas periódicos demonstrados em [130]. Por motivos de clareza, a estrutura multi-ritmo para o filtro de posição será descrita de forma breve nas linhas seguintes. Sejam os períodos de amostragem do GPS e dos sensores inerciais representados por TGPS e TINS , respectivamente, e defina-se o rácio nT = TTGPS , nT ∈ N. INS 84 Capítulo 5. Filtro de Navegação O sistema (5.14) é periódico com periodo nT e pode ser escrito de forma compacta como xk+1 = Fxk + Gwk , (5.43) yk = Hk xk + vk , h i′ h i′ onde xk = x′λ k x′b k , wk = wω′ k wb′ k , yk = yx k , vk = vλ k , F = 0I −TI I , G = −T0 I 0I , e a matriz de observação do sistema é dada por ( [I 0] if nkT ∈ N0 , Hk = (5.44) [0 0] otherwise. O sistema (5.43) pode ser associado com um sistema invariante no tempo que modela a dinâmica do estado no instante k = inT , i ∈ N0 , descrito por xk+1 = F xk + G wk , (5.45) yk = H xk + D wk + vk , onde xk = xknT , xk ∈ R6 , wk = h ′ wkn T ′ wkn T +1 ... ′ w(k+1)n t −1 i′ h i′ ′ ′ ′ vk = vkn v ... v knT +1 (k+1)nt −1 , T h i′ ′ ′ ′ yk = ykn y ... y knT +1 (k+1)nt −1 , T , wk ∈ R6nT , vk ∈ R3nT , yk ∈ R3nT , são os vectores de ruídos e de medidas aumentados, respectivamente, e F = FnT , F ∈ M(6, 6), h i G = FnT −1 G FnT −2 G ... G , G ∈ M(6, 6nT ), i′ h H = H′0 F′ H′1 ... FnT −1 ′ H′nT −1 , H ∈ M(3nT , 6), 0 0 ··· ··· 0 .. H1 G 0 . .. , D ∈ M(3n , 6n ), D= T T H2 FG H2 G 0 . .. . . . . . . .. . . HnT −1 FnT −1 G ··· ··· HnT −1 G 0 que define um sistema invariante no tempo, com ruídos de medida e de estado correlacionados [130]. O ganho de realimentação óptimo para o sistema invariante (5.45) é dado por −1 K = [F P H′ + G Ξ D′ ] [Θ + D Ξ D′ + H P H′ ] , (5.46) onde K ∈ M(6, 3nT ), Ξ = E(wk w′k ), Θ = E(vk v′k ), e a matriz P representa a covariância estacionária do erro de estimação óptimo, dada pela solução da equação de Riccati P = F∗ P F′∗ + G∗ G′∗ − F∗ P H′ S−1 H P F′∗ , 85 5.4. Implementação −1 onde S = Θ + D Ξ D′ + H P H′ , G∗ G′∗ = G Ξ G′ − G Ξ D′ [Θ + D Ξ D′ ] D Ξ G′ e F∗ = ′ −1 F − GΞD′ [Θ + D Ξ D i a segmentação do ganho de realimentação h ] H. Considerando (5.46) dado por K = K0 K1 ... KnT −1 , Ki ∈ M(6, 3), i ∈ N0 , para o sistema (5.435.44), pode ser facilmente provado h i que D = 0, Ki = 0, i 6= 0, e que então o ganho de ′ realimentação Kp = K′1 p K′2 p é simplesmente obtido por selecção da sub-matriz K0 e propagando para trás até ao instante de tempo da medida de GPS, i.e. Kp = F1−nT K0 . Para mais detalhes sobre a síntese de estimadores óptimos para sistemas periódicos lineares de tempo discreto, remete-se o leitor para [130] e referências incluídas. Uma metodologia de análise em frequência canal a canal de um filtro multi-ritmo pode ser encontrada em [116]. Capítulo 6 Resultados e Análise de Dados Reais O presente Capítulo pretende apresentar, analisar e discutir os resultados experimentais obtidos com a implementação do algoritmo de navegação (para atitude e posição) proposto no Capítulo 5, na arquitectura de hardware do catamaran DELFIMx, proposta no Capítulo 4. Os presentes testes de mar foram efectuados na baía de Sesimbra, no mês de Junho de 2008 (latitude 38o 26’N, longitude 9o 6’W). É também apresentado e discutido, o comportamento do sistema de navegação na presença de falhas nas medidas de GPS. 6.1 Síntese dos Parâmetros dos Filtros Os filtros de atitude e de posição, apresentados no Capítulo 5, são sintetizados para produzir uma resposta em frequência em malha fechada que funde os conteúdos espectrais complementares dos sensores inerciais e dos sensores auxiliares. Neste contexto, as matrizes, que definem a ponderação entre o estado e as medidas, são utilizadas como parâmetros de afinação e os ganhos do filtro são identificados com os ganhos estacionários de Kalman. A ponderação (ou os pesos) adoptados e os ganhos correspondentes são apresentados com detalhe na Tabela 6.1. Tabela 6.1: Parâmetros do filtro complementar. Ponderação do Estado Ponderação da Observação Ganho do Filtro Filtro de Atitude Ξω = 3I Ξb = 10−10 I Θλ = 0.8 × 10−2 I K1 λ = 2.97 × 10−1 I K2 λ = 9.41 × 10−5 I Filtro de Posição Ξp = 5 × 10−2 I Ξa = 10I Θp = I K1 p = 0.59I K2 p = 0.14I A frequência de amostragem dos sensores inerciais (acelerómetros e giroscópios) é de 56 Hz, as leituras do magnetómetro são obtidas a 8 Hz e as medidas de posição do GPS têm frequência de 4 Hz. Para os testes experimentais, e porque a área de trabalho é restrita, assume-se que a Terra é plana, que não tem movimento de rotação e que a 86 6.1. Síntese dos Parâmetros dos Filtros 87 força gravítica é constante. A atitude determinada é descrita no referencial geográfico, a posição é descrita no referencial do plano tangente e a velocidade é descrita no referencial do corpo. Visto que o referencial de navegação é local, é necessário definir a sua origem. Habitualmente, uma de duas opções é escolhida. A primeira recorre às coordenadas que definem a posição da estação fixa de GPS (para adquirir dados que possibilitam pós-processamento e para transmitir correcções em tempo real) que foi instalada nas proximidades da área da missão (esta localização pode ser obtida com elevada precisão). A segunda passa por obter uma média (com dados de alguns minutos, durante a calibração da IMU) das leituras de posição fornecidas pelo GPS da plataforma, enquanto ainda está em terra. Nos testes efectuados, a primeira opção foi escolhida. Em qualquer dos casos, o resultado obtido, torna-se a localização, no referencial da Terra, da origem do referencial local. Embora existam métodos de conversão precisos de conversão entre as coordenadas geodésicas do referencial da Terra e as coordenadas rectangulares do referencial tangente local, a precisão obtida não compensa os custos computacionais. Uma aproximação útil pode ser escrita como xN orte = U (L − L0 ) (6.1) yEste = U cos(L0 )(λ − λ0 ), onde xN orte e yN orte representam as coordenadas rectangulares no referencial tangente local, U = 1852 × 60 = 1111201 metros por grau de latitude, L e λ representam a latitude e longitude medidas (no ECEF em coordenadas geodésicas) em graus e L0 e λ0 representam a origem do referencial local (no ECEF em coordenadas geodésicas) em graus. A resposta em frequência complementar dos filtros em malha fechada é apresentada na Figura 6.1 e foi obtida considerando Q(λ) = Q(0) e R̄k = I, ou seja, a resposta em frequência do sistema invariante no tempo (5.14) e (5.29) utilizado na síntese do filtro. Como ilustrado na Figura 6.1, a região de baixa frequência do MPS e do GPS são fundidas com os conteúdos de alta frequência da integração temporal em malha aberta das medidas inerciais, que são dadas por λω k+1 = λω k + T Q(0)ω r k , 2 pf k+1 = pf k + T vf k + T2 fr k , vf k+1 = vf k + T fr k . (6.2) As funções de transferência complementares são validadas, na prática, com dados experimentais obtidos a bordo do catamaran DELFIMx. Tal como foi discutido na Secção 5.2, o filtro de atitude proposto é óptimo para ângulos de pitch e roll constantes e, para o caso de ângulos de pitch e roll variantes no tempo, a degradação da performance pode ser analisada utilizando a propagação das equações da covariância apresentadas em detalhe no Anexo A. Uma comparação numérica da covariância do erro de estimação óptima e da covariância do erro de estimação obtida é ilustrada na Figura 6.2, considerando os pesos apresentados na Tabela 6.1. Como se pode observar pela Figura 6.2(b), a covariância do erro de estimação do filtro complementar proposto está menos que 1% acima da covariância do erro de estimação óptima para trajectórias com ângulos de pitch e roll agressivas ilustradas na Figura 6.2(a). 1 Um arco minuto de latitude é aproximadamente igual a uma milha náutica (1852 m) na superfície da Terra. 88 Capítulo 6. Resultados e Análise de Dados Reais 5 5 0 0 −5 Magnitude [dB] Magnitude [dB] −5 −10 −10 −15 −20 −15 −25 −20 T1 (z) = λ̂(z)/λMP S (z) T2 (z) = λ̂(z)/λω (z) T1 (z) + T2 (z) −25 0 −35 1 10 T1 (z) = p̂(z)/p GP S (z) T2 (z) = p̂(z)/p a (z) T1 (z) + T2 (z) −30 0 10 1 10 Frequência [Hz] 10 Frequência [Hz] (a) Filtro de atitude. (b) Filtro de posição. Figura 6.1: Funções de transferência do filtro complementar. 1.6 Yaw Pitch Roll 1.4 1.009 1.008 1.2 Opt k+1|k ) 1.007 )/tr(Σ 0.8 Filt k+1|k Atitude [rad] 1 tr(Σ 0.6 1.006 1.005 1.004 1.003 0.4 1.002 0.2 0 11 1.001 12 13 14 k*T [s] (a) Atitude. 15 16 17 1 11 12 13 14 (b) Rácio da covariância do erro Figura 6.2: Desempenho do filtro de atitude (T = 6.2 15 16 17 k*T (s) tr(ΣFilter ) tr(ΣOptimal ) 1 s). 56 Análise dos Resultados Experimentais Esta secção apresenta os resultados de estimação do sistema de navegação obtidos com dados experimentais recolhidos a bordo do catamaran DELFIMx durante testes de mar, utilizando a arquitectura hardware apresentada anteriormente. A trajectória descrita pelo veículo DELFIMx é caracterizada principalmente por segmentos de rectas e curvas, como ilustra a Figura 6.3(a), para aferir a performance do sistema de navegação num cenário operacional realista. Os resultados de atitude, posição e velocidade são apresentados nas Figuras 6.4, 6.5 e 6.6 respectivamente, onde as posições e medidas de yaw obtidas pelo receptor de GPS são também incluídas para comparação. Os resultados de estimação de atitude são os esperados, nomeadamente a estimativa do ângulo de yaw é consistente com as manobras em curva executadas pela plataforma e com as medidas de yaw fornecidas pelo GPS, e o valor médio dos ângulos de pitch e 89 6.2. Análise dos Resultados Experimentais −300 350 s −350 −400 400 s 300 s 250 s 200 s 150 s 100 s 0 s 50 s 450 s 986 s 500 s 750 s 550 s −450 X [m] 700 s 950 s 650 s 800 s 600 s −500 −550 900 s −600 850 s Filtro Comp. GPS −650 −200 −100 0 100 Y [m] 200 300 400 (a) Trajectória estimada, medidas de GPS a 4 (b) Vista aérea da trajectória na baía de Sesimbra. Hz. Figura 6.3: Resultados da trajectória estimada do DELFIMx. 8 0.15 0.1 6 0.05 Atitude [rad] Yaw [rad] 4 2 0 −0.05 −0.1 0 −0.15 −2 Filtro Comp. GPS −4 0 100 200 300 400 500 600 Tempo [s] (a) Yaw. 700 800 900 −0.2 −0.25 0 Pitch Roll 100 200 300 400 500 600 Tempo [s] 700 800 900 (b) Pitch e roll. Figura 6.4: Resultados da estimação de atitude. roll estimados correspondem aos ângulos de instalação da arquitectura de navegação. De notar que as medidas de yaw fornecidas pelo GPS são somente utilizadas com o propósito de validação dos resultados, não sendo introduzidas no filtro. De salientar também que, as variâncias dos ângulos de roll e pitch são 1.42o e 0.95o respectivamente, o que sugere que a degradação da performance do filtro de atitude, devido às variações temporais, seja pequena. Os resultados de estimação das polarizações dos giroscópios de velocidade são apresentados na Figura 6.7(a) e provam que o filtro complementar de atitude tem a capacidade de compensar polarizações de variação lenta no tempo, através de uma matriz Ξb de valor baixo no cálculo do ganho de realimentação, consultar Tabela 6.1 para maior detalhe. Contudo, a incerteza inicial nas polarizações devem estar próximos da covariância estacionária das polarizações, i.e. o erro de calibração das polarizações deve ser pequeno para o Ξb adoptado. Como se apresenta na Figura 6.7(b), uma ponderação de valor superior para o parâmetro Ξb torna possível a compensação por parte do filtro de erros de cali- 90 Capítulo 6. Resultados e Análise de Dados Reais −300 400 Filtro Comp. GPS −42 Filtro Comp. GPS −350 −42.5 Filtro Comp. GPS 300 −43 −400 −43.5 100 z Py[m] P [m] −44 −450 x P [m] 200 −500 −44.5 −45 0 −45.5 −550 −46 −100 −600 −46.5 −650 0 100 200 300 400 500 600 Tempo [s] 700 800 900 −200 0 100 200 300 400 500 600 Tempo [s] 700 800 −47 0 900 100 200 300 400 500 600 Tempo [s] 700 800 900 (a) Eixo do x do referencial da (b) Eixo do y do referencial da (c) Eixo do z do referencial da Terra (px ). Terra (py ). Terra (pz ). Figura 6.5: Resultados da estimação de posição. 0.6 3 B v 2.5 0.4 x B v y B Velocidade no Corpo [m/s] Velocidade Angular [rad/s] v 0.2 0 −0.2 −0.4 ω −b rx ry z 1.5 1 0.5 0 ωx ω −b −0.6 2 ωy −0.5 ωr z−bω z −0.8 0 100 200 300 400 500 600 Tempo [s] 700 (a) Velocidade angular. 800 900 −1 0 100 200 300 400 500 600 Tempo [s] 700 800 900 (b) Velocidade linear. Figura 6.6: Resultados da estimação das velocidades linear e angular. bração das polarizações, tendo como custo um aumento da covariância estacionária. O compromisso entre a possibilidade de compensar erros grosseiros de calibração e a precisão a longo prazo da estimação das polarizações deve ser tida em atenção no processo de desenvolvimento. Uma simples técnica de comutação de ganhos, utilizando valores grandes para Ξb , na inicialização do filtro e, valores pequenos para Ξb , no longo prazo, pode ser considerada nos casos em que é necessária calibração no decorrer de uma operação. 6.2.1 Desempenho dos Filtros com Falhas de GPS O problema das falhas ou bloqueios nas medidas de GPS é estudado, cancelando a realimentação das mesmas em intervalos de tempo seleccionados, quando o veículo executa trajectórias circulares ou entra em trajectórias rectilíneas longas, como é detalhado na Tabela 6.2. Os resultados das estimativas de posição durante os bloqueios de GPS são apresentados na Figura 6.8 e com maior detalhe em Figura 6.9. Os resultados do sistema de navegação, apresentados na Tabela 6.2, mostram que a velocidade de deriva de posição é pequena durante as falhas de GPS, e que o filtro de posição opera sem depender demasiado das observações de posição fornecidas pelo GPS, explorando a informação dada pelas medidas inerciais. 91 0.02 0.02 0.018 0.018 0.016 0.016 0.014 0.014 0.012 0.012 bω[rad/s] bω[rad/s] 6.2. Análise dos Resultados Experimentais 0.01 0.008 0.006 0.006 0.004 0.002 bω x 0.004 bω y 0.002 bω z 0 0 0.01 0.008 100 200 300 400 500 600 Tempo [s] 700 800 900 bω x bω y b ωz 0 0 50 100 150 200 250 Tempo [s] 300 350 400 (a) Compensação da polarização com variação (b) Compensação do erro de calibração, Ξb = temporal lenta,Ξb = 10−10 . 10−7 . Figura 6.7: Resultados da estimação da polarização do giroscópio de velocidade. Tabela 6.2: Deriva da posição final e média devido a falhas de GPS. Intervalo de Tempo [s] [370 380] [480 550] [615 750] [800 820] 6.2.2 Final [m] Média [m/s] 2.38 1.91 15.37 7.14 0.238 0.027 0.114 0.357 Validação dos Filtros no Domínio da Frequência A validação, no domínio da frequência das funções de transferência complementares, é realizada utilizando a função de Matlab spectrogram para calcular a magnitude da Transformada de Fourier de tempo curto (short-time Fourier transform) das estimativas de posição e atitude, das medidas dos sensores auxiliares, e da integração das medidas dos sensores inerciais. Recorrendo a uma janela de Hamming de 512 amostras de comprimento e 500 segmentos sobrepostos [131], os conteúdos espectrais dos sinais de atitude e posição seleccionados são analisados. Para ilustrar a fusão no domínio da frequência das medidas do magnetómetro e medidas pendulares com as leituras inerciais, os ângulos de yaw e pitch calculados pelo MPS, pela integração em relação ao tempo do giroscópio de velocidade, e pelo filtro de atitude são apresentadas na Figura 6.10 e na Figura 6.11. A filtragem da posição é demonstrada no domínio da frequência na Figura 6.12, onde os conteúdos em frequência da posição px dada pela observação de GPS, pela integração temporal das leituras dos acelerómetros e pela posição fornecida pelo filtro, são apresentados. Embora uma análise rigorosa, no domínio da frequência utilizando um espectrograma, esteja comprometida pela formulação multi-ritmo do sistema de navegação, o espectrograma indica que as estimativas de atitude e de posição são obtidas pela fusão de informação de baixa frequência das observações dos sensores auxiliares, com a informação de alta frequência da integração temporal das medidas inerciais. Assim, os parâmetros de síntese do filtro originam a fusão sensorial desejada no domínio 92 Capítulo 6. Resultados e Análise de Dados Reais −300 −350 −300 350 s −400 400 s 300 s 250 s 200 s 150 100 s s 0 s 50 s −400 450 s 986 s X (m) 500 s 750 s 550 s −450 Px[m] −350 700 s 950 s −500 650 s 800 s 600 s −500 −450 −550 −550 900 s −600 850 s Comp. Filter GPS Unit Comp. Filter, no GPS −650 −100 0 100 Y (m) 200 −600 −650 0 300 Filtro Comp. GPS Filtro Comp., sem GPS 100 200 300 (a) Trajectória estimada com bloqueio do sinal de GPS. 500 600 Tempo [s] 700 800 900 (b) px . −42 400 300 400 Filtro Comp. GPS Filtro Comp., sem GPS −43 −44 −45 200 Pz[m] Py[m] −46 100 −47 −48 0 −49 −50 −100 −51 −200 0 100 200 300 400 500 600 Tempo [s] (c) py . 700 800 900 −52 0 Filtro Comp. GPS Filtro Comp., sem GPS 100 200 300 400 500 600 Tempo [s] 700 800 900 (d) pz . Figura 6.8: Resultados da estimativa de posição com falhas nas medidas de GPS. da frequência, e produzem boas estimativas de atitude, de posição e das polarizações dos giroscópios de velocidade no domínio do tempo. 93 6.2. Análise dos Resultados Experimentais −290 −390 −400 −300 475 s −410 −310 495 s −420 385 s 345 s X [m] X [m] 365 s −320 325 s −330 515 s −430 535 s −440 555 s −450 −460 −340 Filtro Comp. GPS Filtro Comp., sem GPS −350 −80 −60 −470 Filtro Comp. GPS Filtro Comp., sem GPS −480 −40 −20 0 20 −80 −60 −40 −20 Y [m] Y [m] (a) Falha de GPS em [370 380] s. 0 20 40 (b) Falha de GPS em [480 550] s. 980 s −400 −350 760 s 960 s 780 s −450 −400 940 s −450 740 s 780 s 680 s X [m] X [m] 760 s 720 s 700 s 660 s 920 s 640 s −500 820 s −550 620 s 600 s 800 s −500 900 840 s s −550 −600 Filtro Comp. GPS Filtro Comp., sem GPS 0 50 100 150 200 Y [m] 250 300 (c) Falha de GPS em [615 750] s. 350 Filtro Comp. GPS Filtro Comp., sem GPS 150 200 250 300 880 s860 s 350 Y [m] 400 450 500 (d) Falha de GPS em [800 820] s. Figura 6.9: Detalhes da trajectória estimada com falhas nas medidas de GPS. (a) Medida auxiliar (MPS). (b) Integração do giroscópio de velocidade. (c) Estimativa do filtro. Figura 6.10: Espectrogramas das medidas de yaw e da estimativa do filtro. (a) Medida auxiliar (MPS). (b) Integração do giroscópio de velocidade. (c) Estimativa do filtro. Figura 6.11: Espectrogramas das medidas de picth e da estimativa do filtro. (a) Medida auxiliar (GPS). (b) Integração do acelerómetro. (c) Estimativa do filtro. Figura 6.12: Espectrogramas das medidas de px e da estimativa do filtro. Capítulo 7 Conclusões e Trabalho Futuro 7.1 Conclusões O esforço de desenvolver e testar um ASC, para fins científicos, levado a cabo pelo DSOR, e no qual este trabalho se inseriu, resultou numa arquitectura de hardware (sensores e actuadores e respectiva interface, sistemas de energia, comunicações) e de software (algoritmos de navegação, controlo, comando e comunicações) capaz de transformar a estrutura mecânica de um catamaran, num veículo marinho autónomo de superfície operacional. No que aos filtros de navegação diz respeito, foi proposto um filtro complementar de atitude e outro de posição e foram derivadas as suas propriedades de estabilidade, bem como o seu desempenho. Recorrendo à parametrização da orientação por ângulos de Euler, o filtro de atitude tem a capacidade de compensar dinamicamente as polarizações dos giroscópios de velocidade e é estável para trajectórias descritas por configurações não singulares. O filtro de posição estima a velocidade no referencial do corpo e a posição no referencial da Terra e é assimptoticamente estável. Os filtros de atitude e posição foram integrados para produzir um sistema de navegação completo, cuja estrutura pode ser representada num diagrama de blocos simples, recorrendo a ganhos de realimentação estacionários.A estrutura proposta foi facilmente implementada em hardware de baixo custo e baixo consumo energético. Os ganhos do filtro foram sintetizados no domínio da frequência para moldar uma resposta em frequência que explorasse os conteúdos espectrais de baixa frequência dos sensores auxiliares e a informação contida nas altas frequências dos giroscópios de velocidade. Aspectos relacionados com a implementação de todo o sistema de navegação foram detalhados, nomeadamente uma medida auxiliar de atitude baseada em medidas magnéticas e pendulares e o problema de diferentes frequências de amostragem foi abordado recorrendo a resultados óptimos para sistemas periódicos. O sistema de navegação foi validado com dados experimentais, em testes de mar com o catamaran autónomo DELFIMx. As polarizações dos giroscópios de velocidade foram compensadas, e os conteúdos espectrais complementares dos sensores auxiliares e inerciais produziram boas estimativas de atitude e posição. Foi também verificado que, o sistema de navegação produz bons resultados, apresentando uma deriva pequena, na presença de falhas de curta duração nas leituras de GPS. Em conjunto, a solução de hardware e software desenvolvida de raiz no DSOR e para a qual este trabalho contribuiu, provou ser extremamente fiável quando posta à 98 7.2. Trabalho Futuro 99 prova nas diversas missões levadas a cabo pelo veículo marinho autónomo de superfície DELFIMx. 7.2 Trabalho Futuro Propriedades de estabilidade e desempenho foram derivadas separadamente para os filtros de atitude e de posição. O passo seguinte será generalizar estas propriedades ao sistema de navegação completo, ou mesmo tentar desacoplar os filtros de atitude e posição. A estimação offline das polarizações dos acelerómetros, adoptada neste trabalho, é somente adequada para missões de curta ou média duração do ASC, portanto, métodos de calibração online devem ser estudados num futuro próximo. Outra direcção de trabalho bastante pertinente na área da fusão sensorial, é uma caracterização aprofundada dos sensores inerciais recorrendo a ferramentas que permitem obter uma melhor descrição estocástica dos seus erros, tal como a Allan Variance. A calibração de alguns parâmetros, tais como factores de escala, polarizações, não ortogonalidade entre eixos, com o auxílio de uma mesa de calibração, representa outro factor que pode levar a um aumento significativo do desempenho de todo o sistema de navegação. A caracterização em temperatura dos referidos parâmetros (excepto a não ortogonalidade) e da arquitectura de aquisição de sinal, constitui mais um refinamento, essencial para sistemas de alta precisão. No que diz respeito à calibração e modelação do erro do magnetómetro, sugere-se, como trabalho futuro, a realização de mais testes experimentais que possibilitem aumentar o grau de confiança nos modelos e nos algoritmos apresentados neste trabalho. De salientar a importância de se obter uma medição de yaw de grande exactidão (recorrendo a manobras que tirem partido das leituras de GPS) para assim ser possível aferir a validade dos modelos. Sugere-se, também, a continuação do estudo das perturbações no espaço dos três eixos do magnetómetro quando o veículo perfaz trajectórias no espaço de atitude com ângulos de roll e de pitch diferentes de zero. Quando representada no espaço das três coordenadas do sensor, esta perturbação traduz-se no aparecimento de um elipsóide onde, em condições ideais, deveria surgir uma superfície esférica. Apêndice A Desempenho do Filtro Atitude O sistema (5.15) pode ser reescrito de forma compacta como " # " # " # λ̃k+1 λ̃k wω k = (Fk − Kk Hk ) + Gk − Kk Q(λ̄k−1 )vλ k , b̃k+1 b̃k wb k (A.1) onde " # " I −T Q(λ̄k ) −T Q(λ̄k ) Fk = , Gk = 0 I 0 " # Q(λ̄k )(K1λ − I)Q−1 (λ̄k−1 ) + I Kk = , Hk K2λ Q−1 (λ̄k−1 ) # 0 , I h i = I 0 . É conhecidoh [127] que do erro de estimação, representada por i a covariância λ̃k+1 ′ ′ Σk+1|k = E b̃ [ λ̃k+1 b̃k+1 ] , satisfaz a equação da propagação k+1 Σk+1|k = (Fk − Kk Hk )Σk|k−1 (Fk − Kk Hk )′ + Gk ΞG′k + Kk Q(λ̄k−1 )ΘQ(λ̄k−1 )′ K′k . (A.2) A covariância do erro de estimação do filtro de Kalman para a cinemática de atitude (5.12), representada por Pk+1|k , satisfaz ′ Pk+1|k = Fk Pk|k−1 F′k + Gk ΞG′k − Fk Pk|k−1 H′k S−1 P k Hk Pk|k−1 Fk , (A.3) onde SP k = Hk Pk|k−1 H′k + Θ. O desempenho do filtro de atitude proposto pode ser estudada offline, comparando a covariância do erro de estimação dada por (A.2) com a covariância do erro óptima descrita em (A.3), tal como é ilustrado na análise apresentada no Capítulo 6. 101 Apêndice B Magnetómetro: Modelação do Erro e Calibração B.1 Descrição e Modelação das Fontes de Erro Nos parágrafos seguintes é apresentada uma descrição sucinta das principais fontes de erro que afectam as leituras de um magnetómetro. Declinação Magnética Tal como foi referido anteriormente, o não conhecimento da declinação magnética na região onde se está a navegar, pode levar a erros graves na obtenção de uma medida de heading (rumo). Em geral, o fenómeno de declinação magnética não representa um problema de difícil resolução, visto que é relativamente fácil a obtenção dos valores de correcção para um determinado local de interesse. Distorção Hard Iron Neste tipo de distorção, estão envolvidos os materiais ferromagnéticos com propriedades magnéticas permanentes, isto é, materiais que sofreram, no passado, o efeito de um campo magnético (deliberadamente ou não) que os magnetizou. Devido a serem materiais duros (hard iron), com menor permeabilidade magnética relativa, são de difícil desmagnetização, comportando-se assim como ímanes permanentes. Estes materiais geram campos magnéticos que se sobrepõem ao campo magnético da Terra perturbando a sua leitura. Os materiais que podem gerar erros de leitura podem existir em dois locais, ou estão no ambiente ou pertencem à estrutura do veículo. Das fontes de campo magnético perturbador do meio envolvente, identificam-se os materiais com propriedades magnéticas que se encontram no solo e no subsolo, e possíveis estruturas metálicas que existam perto das trajectórias do veículo. Consoante a sua localização, as perturbações fazem-se sentir de forma diferente pelo sensor. As ambientais, de origem geológica, originam perturbações invariantes no tempo e em geral pode-se afirmar que também o são no espaço, já que estes fenómenos abrangem áreas normalmente superiores às cobertas por uma missão normal de um veículo 103 104 Anexo B. Magnetómetro: Modelação do Erro e Calibração autónomo. Estes fenómenos, em geral, estão mapeados o que possibilita a sua calibração em offline. Distorção Soft Iron Os materiais ferromagnéticos, ditos "macios", têm a capacidade de gerar campos magnéticos quando estão sob o efeito de um campo magnético exterior. Têm a referida característica, devido à sua elevada permeabilidade magnética. Em relação às perturbações produzidas por estes campos magnéticos, estas são diferentes das originadas pelo hard iron no sentido em que dependem da atitude do veículo, já que, o campo magnético terrestre penetra o veículo de forma não uniforme, quando por exemplo o veículo tem um movimento de rotação, no plano horizontal. Distorção de Desalinhamento Surgem erros de desalinhamento quando, numa montagem não ideal, não se consegue um alinhamento perfeito da tríade de magnetómetros com o referencial do corpo do veículo. Esta fonte de erro, não sendo fácil de eliminar totalmente, pode ser bastante minimizada. No espaço de heading (yaw ), este erro revela-se como uma constante que é somada à medida heading verdadeira. Distorção Devido a Erros de Factor de Escala Em condições ditas ideais, os três magnetómetros da tríade são exactamente iguais. Na realidade, não se consegue obter os três dispositivos com uma sensibilidade perfeitamente igual. As consequências deste fenómeno são, por exemplo, leituras diferentes quando são sujeitos ao mesmo campo magnético. Distorção Devido a Equipamentos Eléctricos A existência de cablagem que transporta corrente eléctrica, motores eléctricos ou outros dispositivos electrónicos no veículo, gera campos magnéticos que se sobrepõem de forma corruptiva ao campo magnético terrestre. Este tipo de distorção não tem uma correcção algorítmica trivial, devido ao carácter não determinístico e variante no tempo dos campos magnéticos que corrompem as medidas. Assim, a solução para este problema está na colocação cuidada dos sensores em zonas do veículo com menos ruído electromagnético de forma a minimizar a exposição às referidas perturbações. Distorção Devido à Não Ortogonalidade nos Eixos do Sensor Os erros produzidos por este fenómeno podem ser desprezados, já que, a não ortogonalidade dos eixos dos magnetómetros aparece nos manuais dos mesmos como sendo da ordem de ±0.1o , não produzindo desvios que se comparem aos originados por outras fontes de erro. B.2. Modelo do Erro das Medidas do Magnetómetro B.2 105 Modelo do Erro das Medidas do Magnetómetro Em seguida apresentam-se os efeitos de algumas destas distorções no espaço de heading e no espaço das coordenadas do magnetómetro. A análise, que se apresenta, pretende caracterizar os fenómenos de distorção somente para manobras que mantenham o veículo na horizontal, portanto, com os ângulos de roll e de pitch nulos. Espaço de Heading Na literatura [132], [133] e [134], a perturbação que aparece na medida de yaw obtida a partir das leituras do magnetómetro, devido aos efeitos do hard iron, pode ser aproximada por EHI (ψm ) ≃ RHI sin(ψm + ζHI ), (B.1) onde ψm representa o heading medido com a leitura do magnetómetro, RHI e ζHI representam a amplitude e desvio de fase do sinal de erro provocado pelo hard iron, respectivamente. Depois de algumas operações trigonométricas, a equação (B.1) pode ser reescrita da seguinte forma EHI (ψm ) ≃ B sin(ψm ) + C cos(ψm ). (B.2) Este efeito é frequentemente designado por erro de ciclo único, já que a cada rotação completa, o erro é aproximado por um período de uma sinusóide. Os efeitos dos materiais ditos do tipo soft iron são responsáveis pelo aparecimento de uma sinusóide de frequência dupla, em relação à que aparece nos efeitos hard iron. Este fenómeno modela-se no espaço de heading da seguinte forma ESI (ψm ) ≃ RSI sin(2ψm + ζSI ), (B.3) onde RSI e ζSI representam a amplitude e desvio de fase do sinal de erro provocado pelo soft iron, respectivamente. Tal como foi feito para a equação (B.1), a equação (B.3) pode ser reescrita na forma ESI (ψm ) ≃ D sin(2ψm ) + E cos(2ψm ). (B.4) O desalinhamento horizontal entre o referencial do corpo e o referencial do sensor são modelados de forma exacta no espaço de heading como um offset EDesal (ψm ) = A. (B.5) Ao juntar os efeitos das fontes de erros apresentadas anteriormente, define-se um modelo aproximado para o erro no espaço de heading. O heading verdadeiro do veículo pode ser calculado com ψreal = ψm − EHI+SI+Desal (ψm ), (B.6) onde EHI+SI+Desal (ψm ) é aproximadamente dado por EHI+SI+Desal (ψm ) ≃ A + B sin(ψm ) + C cos(ψm ) + D sin(2ψm ) + E cos(2ψm ). (B.7) 106 Anexo B. Magnetómetro: Modelação do Erro e Calibração Nas Figuras B.1(a) e B.1(b), faz-se um resumo gráfico das três perturbações modeladas, sendo a Figura B.1(b)(gráfico b2 ) uma ilustração do modelo da perturbação total, definida na equação B.7, quando o veículo faz uma rotação de 360o , no plano horizontal. (b ) Erro devido ao Soft Iron (a1) Erro de Desalinhamento 1 0.3 1.5 E M ( ψm ) = 0.052 1 HI ( ψ ) = 0.209 sin(ψ ) + 0.140 cos(ψ ) m m m 0.1 0.5 [rad] [rad] E 0.2 0 0 −0.1 −0.2 −0.5 −1 −0.3 −0.4 −pi −3pi/4 −pi/2 −pi/4 0 ψm [rad] pi/4 pi/2 3pi/4 −pi −3pi/4 −pi/4 0 ψ [rad] pi/4 pi/2 3pi/4 m (b2) Erro total (Desalinhamento + Hard Iron + Soft Iron) (a2) Erro devido ao Hard Iron 0.5 0.1 E SI ( ψm ) = 0.087 sin(2ψm) + 0.026 cos(2ψm) 0.4 0.05 E M + HI + SI ( ψm ) = 0.052 + 0.209 sin(ψm) + 0.140 cos(ψm) + 0.087 sin(2ψm) + 0.026 cos(2ψm) 0.3 [rad] [rad] −pi/2 0 0.2 0.1 0 −0.05 −0.1 −0.1 −pi −3pi/4 −pi/2 −pi/4 0 ψm [rad] pi/4 pi/2 3pi/4 −0.2 −pi −3pi/4 −pi/2 −pi/4 0 ψ [rad] pi/4 pi/2 3pi/4 m (a) Perturbação de desalinhamento (a1 ) e soft iron (a2 ). (b) Perturbação de hard iron (b1 ) e total (b2 ). Figura B.1: Evolução do modelo do erro em função de yaw medido com diferentes perturbações. Espaço do Sensor Espera-se de um modelo de erro, no espaço do sensor, para além de uma descrição mais rica do fenómeno, a capacidade de modelar o sensor de uma forma mais realista, visto que se actua directamente nas medidas do sensor e não numa qualquer relação entre as mesmas, ou parte delas. Um novo modelo para o erro, no espaço do sensor que alia a teoria apresentada em [134] e em [135], é sugerido neste trabalho B M M mnão ideal = B M Rβ CSF B Rβ B CSI B mideal + B δmHI , (B.8) onde os índices B e M designam respectivamente descrição no referencial do corpo {B} M e descrição no referencial do magnetómetro {M } (sensor). As matrizes B CSF são M Rβ e definidas mais à frente. Este modelo é apresentado com mais detalhe em seguida. Em [134] sugere-se a modelação dos efeitos de hard iron e de soft iron da seguinte forma B mHI+SI = B CSI B mideal + B δmHI , (B.9) onde a matriz B CSI modela os efeitos de soft iron em {B}, B δm modela o offset provocado pelo fenómeno de hard iron em {B} e B mideal representa o campo magnético verdadeiro sem as perturbações descrito também em {B}. Em seguida, apresenta-se o modelo anterior evidenciando a estrutura da matriz B CSI 107 B.2. Modelo do Erro das Medidas do Magnetómetro m(HI+SI)x (1 + a) b c B d (1 + e) f m(HI+SI)y = B m(HI+SI)z g h (1 + k) B midealx B midealy + B midealz B δmHIx B δmHIy (B.10) B δmHIz B Os parâmetros a, b, c, d, e, f , g, h e k são responsáveis por modelar os efeitos de soft iron e B δHIx , B δmHIy e B δmHIz modelam os efeitos de hard iron. Para trajectórias no plano horizontal (roll e pitch nulos), e para um ângulo dip que se supõe igual a zero, pode-se afirmar que B midealz é também nulo. Assim sendo, é permitida a redução da dimensão do modelo para " B B m(HI+SI)x m(HI+SI)y # = " (1 + a) b d (1 + e) #" B B midealx midealy # + " B B δmHIx δmHIy # (B.11) Os pontos cardeais representados nas Figuras B.2(a), B.3(a), B.4(a) e B.5(a) representam a leitura do magnetómetro quando este está orientado segundo esses mesmos pontos cardeais, sob o efeito da distorção respectiva. Para a análise das perturbações de hard iron e de soft iron, supõe-se que o referencial {B} é coincidente com referencial {M }, sendo indiferente a utilização do índice B ou do índice M . Na Figura B.2 apresenta-se, para os parâmetros do modelo descrito anteriormente B ( δmHIx = 0.3 e B δmHIx = 0.3), as perturbações devido ao hard iron, respectivamente no referencial do sensor e no espaço de heading. No referencial do sensor, observa-se uma translação da circunferência, que está directamente relacionada com a adição às componentes horizontais do vector do campo magnético das componentes horizontais do vector de perturbação de hard iron. Representaçao da distorçao de Hard Iron no espaço de heading Representaçao da distorçao de Hard Iron no referencial do sensor 0.5 Efeito do Hard Iron Sem Distorçao Com Distorçao HI 300 0.4 B δm HI Norte Sul Este Oeste 0.3 0.2 EHI = ψm − ψreal [rad] 200 Xh [mG] 100 0 0.1 0 −0.1 −0.2 −100 −0.3 −0.4 −200 −0.5 −300 −200 −100 0 100 200 Yh [mG] (a) No referencial do sensor. 300 400 −pi −3pi/4 −pi/2 −pi/4 0 ψreal [rad] pi/4 pi/2 3pi/4 pi (b) No espaço de heading. Figura B.2: Representação da distorção de hard iron. De salientar, a diferença entre a distorção produzida pela modelação no espaço do sensor e a distorção que se sugere para o espaço de heading quando se tenta representar os efeitos de hard iron. Ao fazer-se uso dos dados produzidos pelo modelo (B.9) e se 108 Anexo B. Magnetómetro: Modelação do Erro e Calibração obtém os valores de heading respectivos, o erro originado não é uma sinusóide perfeita, o que leva a concluir que o modelo no espaço de heading é um modelo com aproximações mais grosseiras que o do espaço do sensor [134]. Na Figura B.3 apresenta-se, para os parâmetros do modelo descrito pela equação (B.11) (a = 0.4; b = 0.2; d = 0.2; e = 0.4), as perturbações devido ao soft iron, respectivamente no referencial do sensor e no espaço de heading. Representaçao da distorçao de Soft Iron no referencial do sensor Representaçao da distorçao de Soft Iron no espaço de heading 0.15 Sem Distorçao Com Distorçao SI Norte Sul Este Oeste 300 200 Efeito do Soft Iron 0.1 0.05 ψm − ψreal [rad] Xh [mG] 100 0 0 −0.05 −100 −0.1 −200 −0.15 −300 −0.2 −400 −300 −200 −100 0 Yh [mG] 100 200 300 −pi 400 −3pi/4 −pi/2 −pi/4 ψ 0 [rad] pi/4 pi/2 3pi/4 pi real (a) No referencial do sensor. (b) No espaço de heading. Figura B.3: Representação da distorção de soft iron. A perturbação relacionada com o efeito soft iron manifesta-se de uma forma diferente da que é originada pelo hard iron. Embora também introduza uma polarização nas medições, esta polarização depende do rumo, ao contrário da que é introduzida pelo hard iron, que é constante quando descrita no referencial do veículo. Para se modelar a distorção introduzida por diferentes factores de escala em cada eixo do sensor, modifica-se o modelo do erro, multiplicando pela matriz M CSF . Para o conseguir, e supondo que pode existir um desalinhamento entre o referencial do sensor e o referencial do corpo, é necessário descrever B mHI+SI em {M }. Para tal, é necessário recorrer-se à matriz de rotação M B Rβ : # cβ sβ M B M eM mmedido = M CSF M CSF = B Rβ = B Rβ mHI+SI , com −sβ cβ (B.12) onde β representa o desalinhamento horizontal entre o referencial do corpo e o referencial do sensor e Kx e Ky representam os factores de escala do magnetómetro para os eixos do x e do y respectivamente. Na Figura B.4, apresenta-se somente os efeitos de diferentes factores de escala para cada eixo do magnetómetro, quer no espaço de sensor, quer no espaço de heading. No caso apresentado (Kx > Ky ) observa-se que o eixo maior da elipse fica alinhado segundo o eixo do x do sensor, caso contrário (Kx < Ky ), este ficaria alinhado segundo o eixo do y do sensor. Na Figura B.5, apresenta-se somente os efeitos de uma instalação não rigorosa, isto é, não se conseguir um alinhamento perfeito entre o referencial do sensor e o referencial " Kx 0 0 Ky # " 109 B.3. Algoritmos de Calibração de um Magnetómetro Representação da distorção devido a diferentes factores de escala para cada eixo do magnetómetro no referencial do sensor 250 Sem Distorçao Com Distorçao Kx = 1.100, Ky = 0.900 200 Norte Sul Este Oeste 150 Representação da distorção devido a diferentes factores de escala para cada eixo do magnetómetro no espaço de heading 0.15 Efeito do Factor de Escala K = 1.100, K = 0.900 x y 0.1 0.05 [rad] 100 0 ψ −ψ Xh [mG] real 50 m 0 −0.05 −50 −100 −0.1 −150 −0.15 −200 −250 −0.2 −300 −200 −100 0 Yh [mG] 100 200 300 −pi (a) No referencial do sensor. −3pi/4 −pi/2 −pi/4 0 ψreal [rad] pi/4 pi/2 3pi/4 pi (b) No espaço de heading. Figura B.4: Representação da distorção devido a diferentes factores de escala para cada eixo do magnetómetro. do corpo. A Figura B.5 (a) ilustra este fenómeno no espaço de sensor, e a Figura B.5 (b) ilustra o mesmo fenómeno no espaço de heading. Distorçao devido ao desalinhamento representado no referencial do sensor Distorçao devido ao desalinhamento representado no espaço de heading 0.1047 250 Efeito do Desalinhamento β = 0.105 [rad] 200 0.1047 150 0.1047 100 Sem Distorçao(1) Este(1) −100 Norte (2) m −50 0.1047 real (1) Sul(1) ψ −ψ Xh [mG] Norte 0 [rad] Com Distorçao(2) β = 0.105 [rad] 50 0.1047 Oeste(1) 0.1047 Sul(2) Este(2) −150 Oeste (2) 0.1047 −200 −250 0.1047 −300 −200 −100 0 Yh [mG] 100 (a) No referencial do sensor. 200 300 −pi −3pi/4 −pi/2 −pi/4 ψ 0 [rad] pi/4 pi/2 3pi/4 pi real (b) No espaço de heading. Figura B.5: Representação da distorção devido ao desalinhamento no plano horizontal entre os eixos do magnetómetro e o referencial do corpo. B.3 Algoritmos de Calibração de um Magnetómetro No presente trabalho, entende-se por algoritmos de calibração, algoritmos matemáticos, implementados em software com o objectivo de obter parâmetros que permitam a correcção, segundo um determinado modelo de erro, das leituras de um magnetómetro solidário com um veículo. Embora existam procedimentos que, por ajuste, ou adição de peças magnéticas, consigam calibrar uma bússola ou magnetómetro, esse não é o objectivo deste trabalho. 110 Anexo B. Magnetómetro: Modelação do Erro e Calibração Critérios de Avaliação de um Algoritmo de Calibração Utilização de referências externas. São desaconselháveis visto que não é simples a determinação, numa qualquer localização remota, de um conjunto mínimo de pontos cardeais com um nível de exactidão elevado. Duração da calibração. Não é muito importante como critério de desenvolvimento de algoritmos, desde que se mantenha dentro de limites de duração razoáveis de poucos minutos. Utilização somente de dados do magnetómetro ou de outros sensores. É um critério importante, já que se pode estar na presença de setups de calibração em que os sensores que, supostamente poderiam ser utilizados como referência, não oferecem um grau de exactidão desejada, ou mesmo a não existência de outro sensor adequado. No caso em que se tem ao dispor sensores que possam contribuir para uma melhor calibração do magnetómetro, é aconselhado o desenvolvimento de algoritmos que integrem esses dados. Viabilidade de execução da manobra de calibração. Para a extracção de leituras do magnetómetro para calibração, pressupõe-se que se desenvolveu uma manobra que origine valores, no mesmo, que possibilitam o funcionamento do algoritmo de calibração. Estas manobras têm que ser factíveis para o veículo em questão, sendo este um factor determinante para viabilização do algoritmo de calibração. Algoritmos de Calibração para o Espaço de Heading Em geral, os algoritmos de calibração presentes na literatura ([135] e [133]), passam pela identificação dos parâmetros do modelo do erro definido na equação (B.7), normalmente recorrendo a medidas de heading fornecidas por outros sensores previamente calibrados (como por exemplo da integração de um giroscópio ou outros), ou referências externas fazendo depois uma aproximação segundo um critério de minimização que origine os parâmetros que caracterizam o modelo. Em geral, estes algoritmos são sensíveis a erros originados pela dificuldade de geração de referências externas. Outra característica menos favorável está relacionada com o facto destes métodos só servirem nas aplicações em que o magnetómetro é necessário exclusivamente para a obtenção de medidas de yaw. Algoritmos de Calibração para o Espaço do Sensor Pretende-se com o algoritmo que se apresenta em seguida, obter parâmetros que possibilitem a correcção das leituras do magnetómetro. A ênfase vai para a correcção das perturbações causadas pelos fenómenos de hard iron e de soft iron. Assume-se que os erros de factor de escala são eliminados por calibração do magnetómetro sem este estar acoplado a um veículo (os factores de escala são característicos do magnetómetro e não do seu ambiente). Neste caso, o modelo que vai gerar as perturbações nas saídas do magnetómetro para posterior calibração, reduz-se a: 111 B.3. Algoritmos de Calibração de um Magnetómetro " B m(HI+SI)x B m(HI+SI)y # = " (1 + a) b d (1 + e) #" B midealx B midealy # + " B δmHIx B δmHIy # (B.13) Supõe-se que o erro de desalinhamento foi eliminado por uma instalação rigorosa (M R β é uma matriz identidade) e que é negligenciável a diferença entre os factores de B escala dos dois eixos do sensor (M CSF é uma matriz identidade). Para estas condições, os referenciais {B} e {M } são coincidentes, sendo indiferente a utilização do índice B ou do índice M . Este algoritmo de calibração requer que o veículo experimente o maior número possível de valores de yaw, sempre com os ângulos de roll e de pitch nulos (rotação no plano horizontal). Idealmente, os valores obtidos das leituras do eixo do x e do y descreveriam uma circunferência quando representados no plano xy do referencial do sensor (consultar a Figura 3.9 no Capítulo 3), na realidade isso não sucede. Este algoritmo, tenta transformar o que na realidade se pode obter (uma elipse descentrada e rodada no caso em que as perturbações são mais complexas), no que em condições ideais se deveria obter (uma circunferência centrada na origem), não pretendendo identificar os parâmetros do modelo da equação (B.13). Para o conseguir, recorre-se ao algoritmo de ajuste de elipses descrito em [136]. Este algoritmo fornece parâmetros que caracterizam a referida elipse (deslocamento do seu centro em relação à origem - M δ m̂HIx e M δ m̂HIx -, dimensão do eixo maior e do eixo menor e o ângulo - η - do eixo maior em relação ao eixo Yh do referencial do sensor) que melhor se ajusta aos dados obtidos, segundo o critério dos mínimos quadrados. Depois de obtidos estes parâmetros, consegue-se corrigir ainda no espaço das variáveis do sensor, todos as futuras leituras. Para tal, aplica-se o seguinte conjunto de operações a cada leitura: - Remoção da distorção hard iron # # " # " " B B B δ m̂HIx m(HI+SI)x m(HI)x corrigido . (B.14) − B = B B δ m̂HIy m(HI+SI)y m(HI)y corrigido - Rotação " # = fc 0 1 #" B m′(HI)x corrigido B m′(HI)y corrigido " cos(η) − sin(η) sin η cos η #" B m(HI)x corrigido B m(HI)y corrigido # (B.15) - Escalamento " m′′(HI)x corrigido B ′′ m(HI)y corrigido B # = " m′(HI)x corrigido B ′ m(HI)y corrigido B # , com fc = - Rotação Inversa " # " #" B m(HI+SI)x corrigido cos(η) sin(η) = B − sin η cos η m(HI+SI)y corrigido max max B m′(HI)y corrigido B m′ (HI)x corrigido B m′′(HI)x corrigido B m′′(HI)y corrigido (B.16) # (B.17) 112 Anexo B. Magnetómetro: Modelação do Erro e Calibração Em seguida, na Figura B.6, apresenta-se este procedimento de uma forma gráfica. Para tornar a notação mais simples designa-se o eixo do sensor que coincide com o eixo do x do referencial do corpo por Xh e por Yh o eixo do sensor que coincide com o referencial do y do mesmo referencial. (a) Remoçao da perturbaçao devido ao Hard Iron (b) Rotaçao das leituras do magnetometro Hard Iron Nao Corrigido Hard Iron Corrigido δB Norte Sul Este Oeste 400 300 Nao Rodada Rodada Norte Sul Este Oeste 300 200 200 100 Xh [mG] Xh [mG] 100 0 0 −100 −100 −200 −200 −300 −300 −400 −300 −200 −100 0 100 Yh [mG] 200 300 400 500 −400 −300 (a) Correcção da polarização do hard iron. −200 −100 0 Yh [mG] 100 200 300 400 (b) Rotação da elipse. (c) Escalamento (d) Rotaçao inversa das leituras do magnetometro 400 400 300 300 Nao Escalada Escalada Norte Sul Este Oeste 200 100 200 Rodada (1) 100 Nao Rodada Xh [mG] Xh [mG] (2) 0 Norte 0 (1) Sul (1) Este (1) −100 −100 Oeste(1) Norte −200 (2) Sul(2) −200 Este (2) −300 Oeste(2) −300 −400 −400 −500 −400 −300 −200 −100 0 Yh [mG] 100 (c) Escalamento. 200 300 400 500 −500 −400 −300 −200 −100 0 Yh [mG] 100 200 300 400 500 (d) Rotação inversa. Figura B.6: Ilustração do processo de correcção das perturbações que afectam as medidas do magnetómetro quando o mesmo completa uma volta de 360o no plano horizontal. Os pontos cardeais representados na Figura B.6 representam a leitura do magnetómetro quando este está orientado segundo esses mesmos pontos cardeais, sob o efeito da distorção e depois da respectiva transformação. Quando se obtém o valor de heading a partir das leituras do magnetómetro, antes e depois da correcção, observa-se uma melhoria significativa, tal como se demonstra na Figura B.7. Os resultados provam a validade algorítmica deste método de calibração. Mais à frente, apresentam-se resultados de simulação que evidenciam o aumento do desempenho ao nível da obtenção do heading recorrendo às medidas corrigidas do magnetómetro. Este algoritmo, para além de não se basear num modelo de erro aproximado, tem as seguintes vantagens: 113 B.3. Algoritmos de Calibração de um Magnetómetro (a) Erro no heading obtido das leituras do magnetometro antes e depois da correcçao −8 0.4 1 ψm − ψreal [rad] (Mag. corrigido) ψm − ψreal [rad] (Mag. corrigido) ψm − ψreal [rad] (Mag. nao corrigido) 0.3 Erro no heading obtido das leituras do magnetometro depois da correcçao x 10 0.8 0.6 0.2 0.4 ψm − ψreal [rad] [rad] 0.1 0 −0.1 0.2 0 −0.2 −0.4 −0.2 −0.6 −0.3 −0.8 −0.4 −pi −3pi/4 −pi/2 −pi/4 0 ψreal [rad] pi/4 pi/2 3pi/4 pi (a) Comparação antes e depois da correcção. −1 −pi −3pi/4 −pi/2 −pi/4 0 ψreal [rad] pi/4 pi/2 3pi/4 pi (b) Pormenor depois da correcção. Figura B.7: Efeito da calibração no erro da medida de heading a partir do magnetómetro. - As correcções são feitas directamente nas saídas do magnetómetro e não em outras medidas obtidas com base nas primeiras - Não necessita de outros sensores. - Obriga à execução de uma manobra de calibração que, para a generalidade dos veículos, é simples de executar. Como desvantagens, pode-se afirmar que: - As correcções são feitas directamente nas saídas do magnetómetro e não em outras medidas obtidas com base nas primeiras. - O algoritmo de calibração pode ser pesado, quer ao nível da capacidade computacional, quer ao nível de utilização de memória que, conforme o sistema utilizado, se pode tornar num problema ou não. - O desempenho do algoritmo degrada-se com o aumento dos ângulos de roll e de pitch. Considera-se que, para veículos com trajectórias predominantemente no plano horizontal, este algoritmo de calibração produza bons resultados. Considerações Finais Sobre Algoritmos de Calibração Quando se executa um procedimento de calibração, é aconselhável ter presente que os resultados do mesmo só são válidos para as mesmas condições, ou seja, para os mesmos sensores, veículo e instalação nesse mesmo veículo. Quando se altera a instalação do magnetómetro, é de esperar que o procedimento de calibração produza resultados diferentes. Apêndice C Descrição do Hardware C.1 Placa MC-XAS3 A placa MC-XAS3 é parte de uma arquitectura, com uma topologia caracterizada pelo empilhamento de várias placas de igual dimensão partilhando o mesmo barramento, que contêm dispositivos com as mais diversas aplicações, o que torna o sistema muito flexível. C.1.1 Características Gerais Trata-se de uma placa microcontroladora de uso geral, com capacidade de comunicação série de tempo real (CAN 2.0) e série RS-232, sendo vocacionada para aplicações de controlo distribuído em tempo real onde o tamanho e o consumo energético são de extrema importância. Na Figura C.1, apresenta-se a placa MC-XAS3. Figura C.1: Placa MC-XAS3. É utilizado o microcontrolador Philips XA-S3. Este circuito pertence à família Semiconductors XA (eXtendend Architecture) da Philips e consiste num microcontrolador de 16 bit com 24 linhas de endereços a funcionar a 30 MHz. O microcontrolador contém um ADC, três timers/counters, a função de Watchdog, PCA (Programmable Counter 115 116 Anexo C. Descrição do Hardware Array), uma interface com o barramento I2 C (Inter-Integrated Circuit 1 ), duas portas universal asynchronous receiver/transmitter (UART) e alguns portos entrada/saída que o tornam adequado para um leque variado de funções. C.1.2 - Características Específicas Um microcontrolador de 16 bit Philips XAS3. Dois controladores CAN Intel 82527. Uma XPLA Philips/Xilinx PZ5128. Até 512 kbyte de memória flash e permite 1 Mbyte de memória RAM estática. Uma única fonte alimentação de 5 V. Até 15 Mbyte de memória externa mapeada para periféricos. A informação anterior foi extraída de [137]. Na Figura C.2 apresenta-se o diagrama de blocos da placa. Figura C.2: Diagrama de blocos da placa MC-XAS3 (extraído de [11]). C.1.3 1 Características do Microcontrolador Philips XAS3 Compatibilidade com núcleo 8051. Espaço de endereçamento de 24 bit (16 Mbyte de código e dados). CPU estático de 16 bit. Instruções rápidas de multiplicação e divisão. Conversor analógico-digital (ADC) de 8 bit de resolução e 8 canais. Duas enhanced UART com taxas de transmissão independentes. Frequência de relógio do microprocessador até 30 MHz. O Inter-Integrated Circuit é um barramento série multi-master criado pela Philips que é utilizado para conectar periféricos de baixa velocidade a uma placa mãe, ligar circuitos integrados em sistemas embebidos, etc. 117 C.2. Arquitectura de Aquisição de Sinal - Duração típica de 100 ns por instrução. - Modos de operação com poupança de energia. Suporte para CAN na Especificação 2.0: - Comunicações CAN até 1 Mbit/s. Duas interfaces CAN Bus independentes. Controlador CAN Intel 82527 a 16 MHz. Philips 82C250 CAN transceiver com slope control. Capacidades de endereçamento. Interface de 16 bit. C.2 C.2.1 Arquitectura de Aquisição de Sinal Características Gerais Cada placa AD24B3C dispõe de três Texas Instruments ADS1210 Sigma-Delta 24 bit Analog to Digital Converter (ADC) com entradas analógicas diferencias. Para se obter um melhor desempenho, as tensões de alimentação digital e analógicas estão separadas. Várias placas AD24B3C, até um máximo de quatro, podem ser empilhadas formando uma arquitectura com a capacidade de obter amostras de doze canais independentes dispondo cada um deles de entradas diferenciais. Permite uma amostragem sincronizada, quer ao nível de cada placa, quer ao nível da arquitectura completa, visto que a fonte de relógio dos ADC é partilhada no barramento. A placa AD24B3C é apresentada na Figura C.3. (a) Camada superior. (b) Camada inferior. Figura C.3: Placa AD24B3C. A arquitectura completa e é composta por quatro placas AD24B3C que são empilhadas mecanicamente é apresentada na Figura C.4. Esta solução de montagem permite a este sistema ser mecanicamente flexível e expansível. 118 Anexo C. Descrição do Hardware Figura C.4: Arquitectura de aquisição de sinal analógico composta por placas AD24B3C empilhadas. A interface com esta arquitectura é conseguida através de um barramento desenvolvido especificamente para o efeito que permite ao utilizador endereçar individualmente (recorrendo a um dispositivo de lógica programável em cada placa) cada conversor ADS1210. C.2.2 Características Específicas ADC Texas Instruments ADS1210 Estes circuitos são desenhados para aplicações em que sejam necessárias medições de elevada resolução. Trata-se de conversores do tipo Delta-Sigma de alta resolução (24 bit) funcionando com uma única fonte de alimentação de 5 V. Aceitam entradas diferenciais que são ideais para ligações directas a transdutores ou sinais de baixa tensão. Conseguese uma resolução efectiva de 23 bit usando um amplificador de baixo ruído em taxas de conversão até aos 10 Hz. Resoluções efectivas de 20 bit conseguem-se até uma frequência de amostragem de 1 kHz através da utilização do modo Turbo (Turbo Mode). De seguida, apresenta-se uma lista mais detalhada das especificações deste circuito integrado [138]. 2 Conversor Analógico-Digital Delta-Sigma. Resolução efectiva de 23 bit a 10 Hz e de 20 bit a 1000 Hz. Entradas diferenciais. Amplificador de ganho programável (PGA). Interface com barramento Serial Peripheral Interface 2 (SPI). SPI é uma marca pertencente à Motorola, Inc. C.2. Arquitectura de Aquisição de Sinal 119 - Frequência de corte programável até 15.6 kHz. - Referência interna/externa. - Auto-calibração integrada no circuito integrado. Cada conversor é constituído por um amplificador de ganho programável (PGA), um modulador Delta-Sigma de segunda ordem, um filtro digital programável, um microcontrolador, um circuito gerador de relógio e uma tensão de referência. Para mais detalhe consultar o manual [139]. Circuito Programável Xilinx XC9536 O circuito que gera a lógica da placa MC-XAS3 e da placa AD24B3C é o XC9536 da Xilinx. Este circuito tem por função gerar alguns sinais de controlo para os dispositivos ligados, quer ao microcontrolador, quer aos ADC, desenvolver as máquinas de estados necessárias e permitir alguma flexibilidade ao sistema. O XC9536 é um circuito de lógica programável de alto desempenho e de utilização genérica que permite programação in-system. Características Específicas (extraído de [140]) - Atraso de propagação na parte lógica de 5 ns. - Frequência de operação até 100 MHz. - 36 macrocélulas com 800 portas lógicas úteis. - Até 34 pinos de entrada/saída. - Programação in-system a 5 V. - Suporte IEEE Std 1149.1 boundary-scan (JTAG). - Mode de baixo consumo enérgico configurável ao nível de cada macrocélula. - Controlo do tempo de subida em cada pino de saída. - Ligação programável de qualquer pino à massa do circuito. - Capacidade de protecção de firmware. - Capaz de fornecer até 24 mA num pino de saída. - Compatibilidade entre entradas/saídas de 3.3 V e 5 V. - Tecnologia avançada CMOS (complementary metal-oxide-semiconductor ) 5 V Fast flash. - Capacidade de ser programado em paralelo com outros dispositivos da mesma familia. 120 C.2.3 Anexo C. Descrição do Hardware Caracterização do Desempenho da Placa AD24B3C Existem técnicas específicas para medir e quantificar o desempenho de ADC. Dois testes básicos incluem o uso de histogramas e a Fast Fourier Transform (FFT). Cada tipo de teste fornece uma perspectiva única do desempenho do circuito. O tipo de teste a usar é baseado no parâmetro a medir. Por exemplo, os histogramas são utilizados para medir a exactidão em DC ou características estáticas como o offset, por outro lado as FFT são uma ferramenta para medir o desempenho dinâmico, como por exemplo a linearidade. Neste caso, os sinais são na sua maioria de baixa frequência e filtrados (filtro passabaixo), por isso optou-se por apenas usar os histogramas para medir e quantificar o desempenho dos conversores. A saída de um ADC varia para uma entrada constante devido ao ruído. O ruído é definido por uma Função Densidade de Probabilidade (PDF) que representa a probabilidade de eventos discretos. A forma da PDF descreve a exactidão da saída do ADC e a sua característica de ruído. Os testes realizados às três placas utilizadas foram feitos nas mesmas condições, fios de sinal blindados, afastados de possíveis fonte de ruído e curto-circuitados entre si. Para caracterizar cada ADC utilizaram-se medidas como a Resolução Efectiva (Effective Resolution,(ER)), bits livres de ruído (Noise Free Bits ou Peak-to-Peak Resolution,(NFb)) e Relação Sinal Ruído (Signal to Noise Ratio,SNR). As equações, para calcular estes valores, apresentam-se de seguida. O peso de cada LSB (Least Significative Bit) é dado por VF S , (C.1) LSB[V] = VQ = 2N onde N representa o número de bits na palavra digital de saída (24 bit) e VF S representa o alcance de medida máximo do ADC (Full-Scale Range Voltage), que para a presente aplicação é igual a 10 V. O valor quadrático médio (Root Mean Square, RMS) do ruído de uma sequência discreta de amostras de um ADC é dado por Vrms[V] = std (sADC (k) × VQ ) , (C.2) onde std representa o cálculo do desvio padrão (standard deviation) e sADC (k) representa uma sequência de amostras do ADC em estudo. A Resolução Efectiva (ER) pode ser expressa em duas unidades diferentes: em bits RMS (referenciado à saída digital) ou em volt RMS (referenciado à entrada analógica). A ER, em unidades de bit é dada por [138] 10 20 log − 1.76 Vrms[V] ER[bitrms] = , (C.3) 6.02 e a resolução Noise Free Bits é dada por [138] NFb[bit rms] = ER[bit rms] − 2.723. (C.4) 121 C.2. Arquitectura de Aquisição de Sinal Analiticamente, define-se o SNR por SNR[dB] = 20 log 10 6.6 × Vrms[V] (C.5) . Neste anexo apenas se apresenta os resultados do teste de uma das placas utilizadas. Para informação sobre o desempenho das restantes placas consultar [139]. Analisando os histogramas da Figura C.5(a), Figura C.5(b), Figura C.6 (depois de subtraída a média das leituras) e a Tabela C.1, conclui-se que se desenvolveu uma placa de aquisição de sinal analógico de elevado desempenho. Para aplicações em sistema de navegação, é fundamental poder contar com conversores de elevada resolução, pois todo o processamento de sinal e cálculo posterior é baseado nos valores fornecidos por estes. Para além disso, é fundamental que a limitação de exactidão não esteja do lado dos conversores, mas sim dos sensores utilizados, de modo a conseguir-se obter o melhor desempenho das medidas que estes fornecem. (a) ADC 0 (b) ADC 1 Figura C.5: Histogramas dos ADC0 e ADC1 da placa AD24B3C. Figura C.6: Histograma do ADC2 da placa AD24B3C. 122 Anexo C. Descrição do Hardware Tabela C.1: Desempenho da placa AD24B3C. Effective Resolution Signal to Noise Ratio Noise Free bits C.3 C.3.1 ADC0 ADC1 ADC2 19.0488 100.043 16.326 18.872 98.9788 16.1493 18.997619 99.734787 16.274882 Unidades [bit] [dB] [bit] Placa ASHDG14If - Interface com GPS Ashtech Características Gerais A placa ASHDG14If foi projectada para fazer a interface entre a placa de circuito impresso receptora do Sistema de Posicionamento Global Ashtech DG14 e o barramento ao qual está ligado a placa MC-XAS3. Visto que o DG14 funciona com lógica de 3 V, e a placa MC-XAS3 com lógica de 5 V, esta placa faz a conversão bidireccional entre os níveis lógicos 3 V e 5 V. Figura C.7: Placa ASHDG14If. C.3.2 Características Específicas - Interface do GPS com o barramento da placa MC-XAS3. - Interface do GPS com um dispositivo RS-232 externo. - Fornece o sinal Pulso Por Segundo (PPS) à placa MC-XAS3 e dispositivos externos. - Escolha pelo utilizador da interrupção na placa MC-XAS3. - Permite a escolha da tensão eléctrica de alimentação da antena (3 V ou 5 V). - Escolha pelo utilizador da interrupção na placa MC-XAS3. - Alimentação externa ou através do barramento da placa MC-XAS3. - Conversão interna de 5 V para 3 V. C.4. Placa DSPIf - Interface com D.Module.VC33 C.4 123 Placa DSPIf - Interface com D.Module.VC33 C.4.1 Características Gerais A placa DSPIf foi desenvolvida para fazer a interface com o módulo de processamento digital D.Signt.T D.Module.VC33 e a placa MC-XAS3. A razão que levou ao desenvolvimento desta placa prende-se com a falta de capacidade de processamento da placa MC-XAS3 (baseada num microcontrolador de 16 bit). Com a placa D.Module.VC33, incorporou-se nesta arquitectura de tempo real toda a capacidade computacional de um a sete DSP de 32 bit, de vírgula flutuante com desempenho até 150 MFLOPS (Milhões de Operações de Vírgula Flutuante por Segundo). A filosofia do conceito de interface ilustra-se na Figura C.8 que se caracteriza por um canal de comunicação implementado com uma memória RAM de dois portos. Figura C.8: Diagrama conceptual da interface entre a placa MC-XAS3 e o D.Module.VC33. C.4.2 Características Específicas Os circuitos integrados mais importantes nesta placa são: - IDT High Speed 2 k × 16 Dual-Port SRAM. - Xilinx XCR5128 Complex Programmable Logic Device. Com a integração da placa DSPIf, conseguiu-se criar um canal de comunicação entre dois sistemas com características bastante diferentes, tendo-se recorrido a uma memória RAM de dois portos. Ao contrário da maioria dos sistemas de memória partilhada (que são de acesso multiplexado), este tipo de memória tem dois portos independentes fisicamente disponíveis, com as respectivas linhas de controlo, barramentos de dados e de 124 Anexo C. Descrição do Hardware (a) Diagrama de blocos da placa DSPIf. (b) Placa DSPIf. Figura C.9: Diagrama de blocos e imagem da placa DSPIf. endereçamento. Na Figura C.9(a) apresenta-se o diagrama funcional da placa DSPIf com a memória de dois portos que, a partir deste momento, vai ser designada por DP-RAM. A Complex Programmable Logic Device XPLA funciona como ponte na interface entre a placa MC-XAS3 e a DP-RAM, e entre o D.Module.VC33 e a DP-RAM, gerando para cada tipo de acesso, os sinais de controlo correspondentes. A placa DSPIf oferece um canal de informação entre o D.Module.VC33 e a placa MC-XAS3 que possibilita do lado da MC-XAS3 uma taxa de transferência de dados mínima de cerca de 1 Mbyte/s, podendo a do DSP ser mais de 10 vezes superior. C.5 C.5.1 Placa D.Signt.T D.Module.VC33 Características Gerais O D.Module.VC33 é uma placa de processamento digital de sinal de vírgula flutuante de desempenho médio, que pertence à família D.Module (consultar Figura C.10). O seu objectivo são aplicações embebidas do tipo stand-alone que requerem funcionalidade e flexibilidade máximas e baixo consumo de potência. Os requisitos de baixo consumo tornam possível a sua utilização em aplicações móveis alimentadas a baterias. Dispõem de um conjunto de funções denominado por D.Module.BIOS que permite tratar da programação de baixo nível de hardware. Uma CPLD programável pelo utilizador providencia 32 sinais de entrada/saída que possibilitam a interface flexível com dispositivos ou barramentos standard. A manutenção em campo é facilitada pela Set-Up Utility que permite armazenar parâmetros específicos a cada aplicação por meio de ficheiros de texto recorrendo à memória Flash. É compatível ao nível de código objecto com o DSP TMS320C31 o que permite duplicar o desempenho de sistemas antigos já que se passa de 75 MFLOPS (C31) para 150 MFLOPS (VC33). - DSP TMS320VC33 a 150 MHz, vírgula flutuante 32/40 bit, vírgula fixa 24/32 bit, C.5. Placa D.Signt.T D.Module.VC33 125 Figura C.10: Placa D.Module.VC33. DMA. - Memória: 34k × 32 bit de memória de acesso duplo interna ao DSP 64k ou 256k x 32 bit de memória SRAM na placa, 1 wait state (33 ns) 512 kbyte de memória flash não volátil, arquitectura de sectores uniformes - 1 UART 16C650 com taxas de transmissão até 460 kbyte, FIFO (First In, First Out) de transmissão e recepção 32 words , RTS/CTS e Xon/Xoff Auto-Flow-Control, suporte DMA, interface RS-232 (opção RS422/485). - 2 timers internos do DSP de 32 bit, geração de relógio, pulsos ou contagem de eventos externos. - 1 porto série síncrono de transmissão e 1 porto série síncrono de recepção interno ao DSP com taxa de transmissão até 32 Mbit/s, 2 timers de 16 bit para geração de relógio e sincronização de tramas ou relógios externos. - Barramento externo de 32 bit de dados 8 M de espaço de endereçamento. - 32 portos de entrada/saída programáveis pelo utilizador (CPLD XCR3064XL programável in-system com 64 macrocélulas e pinos de entrada, saída ou bi-direccionais). - 4 interrupções externas, 7 interrupções internas com disparo ao flanco descendente multiplexadas com a UART e a CPLD. - Tensões de alimentação únicas de 3.3 V a 5 V, com consumo em modo idle de 6 mA, consumo típico de 100 mA com todas as interfaces tolerantes a 5 V. - Sofware D.Module.BIOS que permite fazer inicialização e configuração do módulo, inicialização da UART e das comunicações, programar a memória flash e com funções de Boot-Loader. - Software Set-Up Utility que permite fazer o upload de ficheiros ASCII (American Standard Code for Information Interchange) e binários, programar a CPLD, configurar o módulo, memory dump, alterar a memória e executar programas/funções. - Watchdog e supervisor de tensões de alimentação, interface JTAG para in-circuit emulation. 126 Anexo C. Descrição do Hardware C.5.2 Características Específicas DSP Texas Instruments TMS320VC33 O TMS320VC33 é um processador digital de sinal de vírgula flutuante de 32 bit, fabricado com a tecnologia 0.18 µm four-level-metal CMOS Timeline. O TMS320VC33 faz parte da geração TMS320C3X de DSP da Texas Instruments. O barramento interno dos TMS320C3X e o conjunto de instruções especiais de processamento digital de sinal permite executar 150 (MFLOPS). A optimização, em termos de velocidade de execução, é fruto da implementação em hardware de funções habitualmente implementadas em software ou microcode. Este tipo de abordagem permite um desempenho até agora inexistentes num único circuito integrado. O TMS320VC33 pode executar multiplicações em paralelo com operações da Arithmetic and Logic Unit (ALU) em inteiros ou vírgula flutuante num ciclo único. O TMS320VC33 suporta uma vasta gama de aplicações que vão desde processador principal a co-processador dedicado, disponibilizando um largo espaço de endereçamento, suporte de linguagens de alto nível, modos de endereçamento e conjunto de instruções flexíveis. Com o TMS320VC33 ganhase em relação ao TMS320C31 1 Mbit de SRAM interna. Dispõe também de um porto série, 2 timers de 32 bit entre outros. - Ciclo de instrução de 13 ns. - 150 Milhões de Operações de Vírgula Flutuante por Segundo (MFLOPS). - 34k x 32 bit (1.1 Mbit) de SRAM de acesso duplo configurada em 2 × 16k mais 2 × 1k blocos para aumentar o desempenho interno. - Baixo consumo: < 200 mW a 150 MFLOPS. - Operações de inteiros de 16-/32 bit e de vírgula flutuante de 32-/40 bit. - Interrupções externas seleccionáveis EDGEMODE. - Endereços de 24 bit e instruções de words de 32 bit. - 8 registos de precisão estendida. - Periféricos mapeados internamente. - 1 porto série. - 2 timers de 32 bit. - Acesso directo à memória (DMA). - Execução paralela da ALU e do multiplicador num único ciclo. - 2 modos de baixo consumo. - Boot-Program Loader. A informação anterior foi extraída de [141] e [142]. 127 C.6. Placa MC_AVRCAN128 C.6 C.6.1 Placa MC_AVRCAN128 Características Gerais A placa MC_AVRCAN128 foi desenvolvida em torno do microcontrolador Atmel AVR AT90CAN128 com o propósito de constituir um sistema de utilização genérica para interface a sensores e actuadores com a capacidade de interface com o CAB bus. As camadas superior e inferior da placa MC_AVRCAN128 são apresentadas na Figura C.11. O integrado AT90CAN128 é descrito com maior detalhe em C.6.2. (a) Camada superior. (b) Camada inferior. Figura C.11: Placa MC_AVRCAN128. C.6.2 Características Específicas Com o objectivo de aumentar a flexibilidade de integração num qualquer sistema, os periféricos do microcontrolador AVR AT90CAN128 foram disponibilizados em conectores para permitir fazer a interface com o exterior. As interfaces possíveis são: - Interface com CAN bus. - Interface Two-Wire Interface. 3 (TWI) (compatível com I2 C). - Interface SPI. - 2 canais de geração e 1 captura de PWM (Pulse Width Modulation) de 16 bit. - Porto paralelo de entrada/saída de uso genérico (com interrupções). TWI (Two-Wire Interface) é na sua essência igual ao barramento I2 C e é utilizado por vários fabricantes de circuitos integrados, tais como a Atmel, com uma designação alternativa para evitar questões relacionadas com direitos de patente. 3 128 Anexo C. Descrição do Hardware Atmel AVR AT90CAN128 - Arquitectura RISC (Reduced Instruction Set Computer ) avançada. Memória de programa e de dados não volátil. Interface JTAG (compatível com a norma IEEE std.1149.1). Controlador CAN 2.0A e 2.0B. Watchdog timer programável com oscilador integrado. Temporizador/Contador síncrono de 8 bit. Temporizador/Contador assíncrono de 8 bit. 2 temporizadores/contadores de 16 bit. ADC de aproximações sucessivas de 10 bit. 3 tipos de interfaces série (TWI, 2 USART, SPI). 8 interrupções externas, oscilador interno RC, 5 modos de baixo consumo. Tensão eléctrica de operação de 2.7 V a 5.5 V. Frequência máxima de operação (8 MHz a 2.7 V, 16 MHz a 4.5 V). Interface CAN Bus - 15 Message Objects com identificadores e máscaras independentes. Modos de transmissão, recepção, resposta automática e Frame Buffer Taxa de transmissão máxima de 1 Mbit/s com oscilador de 8 MHz. Time stamping, TTC, Listening Mode (Spying ou Autobaud ) 129 C.7. Placa HMR_MB - Interface com HMR3300 C.7 C.7.1 Placa HMR_MB - Interface com HMR3300 Características Gerais A placa HMT_MB foi desenvolvida para fazer a interface com a placa do magnetómetro Honeywell HMR3300. Fornece interface mecânico, eléctrico e electrónico ao HMR3300 permitindo a este dispositivo ser facilmente integrado numa larga variedade de arquitecturas distribuídas visto que possibilita acesso ao CAN bus e ao protocolo RS-232. As camadas superior e inferior da placa HMR_MB são apresentadas na Figura C.12. O integrado AT90CAN128 é descrito com maior detalhe em C.6.2. (a) Camada superior. (b) Camada inferior. Figura C.12: Placa HMR_MB. Na Figura C.13 apresenta-se uma ilustração do empilhamento da placa do magnetómetro na placa HMR_MB. Figura C.13: Placa do HMR3300 empilhada na placa HMR_MB. 130 Anexo C. Descrição do Hardware C.7.2 Diagrama de Blocos Na Figura C.14 apresenta-se o diagrama de blocos da placa HMR_MB. Figura C.14: Diagrama de blocos da placa HMR_MB. 131 C.8. Placa BatMonit C.8 C.8.1 Placa BatMonit Características Gerais A placa BatMonit, contém como circuitos principais, o microcontrolador Atmel AVR AT90CAN128 e o Fuel Gauge MAX1660 da Maxim. Foi desenvolvida para monitorizar a carga e descarga de baterias e dispõe da capacidade de detectar condições perigosas de carga e de descarga das mesmas. Quando estas situações são detectadas, consegue, protegendo a bateria, desligar o carregador ou a carga a que está conectada. As camadas superior e inferior da placa BatMonit são apresentadas na Figura C.15. O integrado AT90CAN128 é descrito com maior detalhe em C.6.2. (a) Camada superior. (b) Camada inferior. Figura C.15: Placa BatMonit. C.8.2 Características Específicas Circuito Integrado Fuel Gauge (Maxim MAX1660) O MAX1660 é um contador de cargas eléctricas digital que executa duas funções extremamente importantes na manutenção de baterias recarregáveis: fuel gauging e protecção contra excesso de corrente. Monitoriza a corrente de carga e descarga de um pack de baterias e regista cada uma delas em dois contadores de Coulomb independentes. - 1% de precisão num intervalo de medição de corrente dos 600 µA a 4 A (RSEN SE = 30 Ohm) - Tensão de offset de entrada de 5 µV (máximo de 28 µV). - Interface série SMBus 2-Wire (interrupção opcional). - Referência de precisão interna de 2.00 V. 132 Anexo C. Descrição do Hardware - Regulador linear de 3.3 V para alimentar circuitos externos. 2 modos de baixo consumo (< 1 µA Shutdown Current). Contadores de 32 bit independentes para carga e descarga. Protecção de sobrecarga e sobredescarga. Protecção da bateria contra curto-circuito. Drivers integrados para MOSFET (Metal Oxide Semiconductor Field Effect Transistor ) de potência. - 80 µA de corrente de operação. C.8.3 Diagrama de Blocos Na Figura C.16 apresenta-se o diagrama de blocos da placa BatMonit. Figura C.16: Diagrama de blocos da placa BatMonit. 133 C.9. Placa SWLNPWR C.9 Placa SWLNPWR C.9.1 Características Gerais A placa SWLNPWR contém quatro fontes de alimentação comutadas de alta eficiência desenvolvidas para gerarem tensões de alimentação reguladas a partir de uma única fonte de tensão que pode variar entre 2.7 V e 24 V. As tensões de saída de cada fonte comutada é individualmente configurada através de um circuito resistivo e pode variar entre os 3 V e os 24 V. A camada superior da placa SWLNPWR é apresentada na Figura C.17. O circuito integrado AT90CAN128 é descrito com maior detalhe em C.6.2. Figura C.17: Placa SWLNPWR. C.9.2 - Características Específicas Tensão de entrada de 2.7 V a 24 V. Tensão de saída de 3 V a 24 V. Corrente máxima de saída de 1.5 A (750 mA com regulador linear). Tensões de saída positivas e negativas. Tensão de saída opcional de muito baixo ruído 1µV (0.1 Hz - 10 Hz) a 15 mA. 134 Anexo C. Descrição do Hardware C.9.3 Diagrama de Blocos Na Figura C.18 apresenta-se o diagrama de blocos da placa SWLNPWR. #$' #$ !" !" !" !" #$( #$ #$) #$* Figura C.18: Diagrama de blocos da placa SWLNPWR. Apêndice D Especificações Técnicas dos Sensores D.1 Acelerómetro Crossbow CXL02TG3 O princípio de funcionamento do acelerómetro pode socorrer-se de diversos conceitos físicos. No entanto, a grandeza medida é independente da tecnologia utilizada portanto, conceptualmente, o dispositivo equivale ao sistema físico que consiste numa massa ligada a uma mola cuja frequência natural é muito superior à frequência máxima de funcionamento do acelerómetro, como referido em [80]. Da segunda lei de Newton, uma massa sujeita a acelerações sofre uma força que resulta na distensão da mola, originando uma força elástica de sentido contrário. Medindo o comprimento da mola determina-se a aceleração segundo o eixo de leitura do acelerómetro. Como qualquer massa está constantemente sujeita à força gravítica, os acelerómetros medem uma aceleração que não existe, de sentido contrário à gravidade. Assim a medida designada por força específica, resulta da aceleração do veículo menos a aceleração gravítica. Um modelo possível para as medidas de um acelerómetro em movimento é dado por f= d Bv + ω × B v − B g, dt B (D.1) onde ddtv é a aceleração linear, ω × B v é a aceleração centrípeta, e B g é o vector de gravidade no referencial {B}. Para este trabalho, foi escolhido o acelerómetro CXL02TG3 da Crossbow Technology, Inc. cuja fotografia é apresentada na Figura D.1. Trata-se de um acelerómetro triaxial de alto desempenho com um intervalo de medição entre −2 g e +2 g. O sensor fornece medidas em formato de sinal analógico já com condicionamento de sinal interno o que facilita, de forma significativa, a integração noutros sistemas de aquisição de sinal, visto que não necessita de mais circuitos externos de condicionamento. Emprega tecnologia MEMS tendo um elemento sensível capacitivo diferencial com 3 camadas de silício o que lhe confere grande estabilidade e muito baixo ruído nas medições. Para funcionar necessita somente de uma fonte de alimentação única que pode ir de 3.3 V a 5.5 V. Dispõe também de um sensor de temperatura interno que permite a sua operação com grande precisão em condições de temperatura extremas. É uma escolha bastante viável e atractiva para sistemas operados por baterias (tal como é a plataforma desenvolvida neste trabalho) visto que apresenta um consumo de corrente eléctrica de somente 1.5 mA. A Tabela D.1 apresenta um resumo das principais características do Crossbow CXL02TG3. 135 136 Anexo D. Especificações Técnicas dos Sensores Figura D.1: Acelerómetro CXL02TG3 da Crossbow Technology, Inc.. Tabela D.1: Especificações técnicas do acelerómetro Crossbow CXL02TG3 (extraído de [13]). Especificação Intervalo de medição Sensibilidade Densidade de ruído Ruído a Largura de Banda de 100 Hz Resposta em frequência Temperatura de Operação Resistência ao choque Resistência à vibração (20 a 500 Hz) Tensão eléctrica de operação Corrente eléctrica de operação Mínimo 767 Típico ±2 833 20 0.6 200 −40 3.3 1.5 Máximo 900 +125 6000 20 5.5 2 Unidades [g] [mV/g] √ [µg/ 2 Hz] [mg] rms [Hz] [o C] [g] [g] rms [V] [mA] Em termos mecânicos, este sensor apresenta também boas características para utilização em plataformas móveis, visto que se apresenta sob a forma de uma pequena caixa de alumínio anodizado industrial que é resistente à humidade e robusta mecanicamente. D.2 Giroscópio de Velocidade Silicon Sensing Systems CRS03 Este sensor transforma velocidades angulares num valor analógico de tensão eléctrica que é proporcional à grandeza física medida. É alimentado electricamente por uma fonte de tensão de 5 V e é conhecido por ter um bom desempenho em condições severas de vibração, choque e temperatura, o que o torna uma boa opção para plataformas marinhas onde são abundantes as variações de temperatura e vibrações mecânicas. Na Figura D.2 apresenta-se uma ilustração do giroscópio Silicon Sensing CRS03. 137 D.2. Giroscópio de Velocidade Silicon Sensing Systems CRS03 Figura D.2: Giroscópio de velocidade CRS03 da Silicon Sensing Systems. Tabela D.2: Especificações técnicas do giroscópio de velocidade Silicon Sensing Systems CRS03 (extraído de [14]). Especificação Valor Unidades Intervalo de medição Factor de escala Variação com a temperatura do factor de escala Polarização (depois de power-up) Polarização (com a temperatura) Tempo de resposta Largura de banda Quiescent noise (típico) Temperatura de operação Resistência ao choque Tensão eléctrica de operação Corrente eléctrica de operação Massa ±100 20 ±3 ±100 ±10 0.5 10 1 −25o Ca + 85 200 4.75 a 5.25 < ±50 25 [o /s] [mV/o /s] [%] [mV] [o /s] [s] [Hz] [mV] (rms) [o C] [g] (1 [ms] 1/2sin) [V] (ratiometric) [mA] [g] 138 D.3 Anexo D. Especificações Técnicas dos Sensores Magnetómetro Honeywell HMR3300 O HMR3300 Digital Compass Solutions apresentado na Figura D.3, é um dispositivo que inclui toda a electrónica e sensores básicos para fornecer uma leitura digital de rumo. Para tal, faz uso de 3 sensores magnéticos e um acelerómetro biaxial que fornece leituras Figura D.3: Magnetómetro HMR3300 (extraído de [12]). de pitch e roll visto que a sua instalação coloca os dois eixos de medida na horizontal da placa. A Tabela D.3 apresenta de forma compacta algumas das principais características deste sensor. Tabela D.3: Características do Honeywell HMR3300 Digital Compass (extraído de [12]). Características Benefícios Solução compacta numa Placa de Tamanho reduzido para integração Circuito Impressa de 2.54 × 3.81 cm com placas mãe Bússola precisa Precisão ±1o no plano horizontal, resolução ±0.1o Compensação de Tilt compensação de ângulos de pitch e roll até ±60o (com acelerómetros) Repetibilidade 0.5o Sensores magnetoresistivos para consistência Frequência de amostragem Rápida computação do rumo de 8 Hz essencial em aplicações de controlo Compensação interna de Calibração a pedido do utilizador Hard-Iron e posterior correcção de offsets Temperatura de Operação Utilização comercial e o o entre −40 e +85 C industrial Comunicações UART e Linguagem de comandos SPI intuitiva Este tipo de dispositivos é utilizado em aplicações onde é necessária uma elevada precisão na medida de um rumo. Esta precisão é fornecida através da utilização de sensores magnetoresistivos o que torna esta solução uma bússola digital de estado sólido. A 139 D.3. Magnetómetro Honeywell HMR3300 integração deste dispositivo noutros sistemas é trivial visto só ser necessário uma interface com lógica de 5 V e a troca de comandos no formato ASCII. O seu baixo consumo energético (máximo de 24 mA a 6 V), faz com que seja uma boa opção para sistemas com recursos energéticos limitados. O HMR3300 inclui acelerómetros MEMS (microelectromechanical systems) que lhe possibilitam fazer leituras tri-axiais do campo magnético terrestre com compensação de tilt, isto é, permite obter leituras de rumo mesmo quando o dispositivo não se encontra na horizontal. As Tabelas D.4, D.5 e D.6 resumem as especificações técnicas do HMR3300. Tabela D.4: Especificações técnicas para a medida de yaw do Honeywell HMR3300 Digital Compass (extraído de [12]). Características (rumo) Condições Mínimo Nivelado 0o a ±30o ±30 a ±60o Precisão Resolução Histerese Repetibilidade Típico 1 3 4 0.1 0.2 0.2 Máximo Unidades [o ] (rms) [o ] (rms) [o ] (rms) [o ] [o ] [o ] 0.4 0.4 Tabela D.5: Especificações técnicas para a medida de roll e pitch do Honeywell HMR3300 Digital Compass (extraído de [12]). Características Condições Intervalo de medição Precisão Pitch e Roll 0o a ±30o ±30 a ±60o Resolução Histerese Repetibilidade Mínimo Típico Máximo Unidades [o ] [o ] [o ] [o ] [o ] [o ] ±60 0.5 1.2 0.4 1.0 0.1 0.2 0.2 Tabela D.6: Especificações técnicas para a medida de campo magnético do Honeywell HMR3300 Digital Compass (extraído de [12]). Características Condições Campo magnético Densidade de fluxo do campo magnético máximo Resolução Mínimo Típico Máximo [Gauss] ±2 0.1 Unidades 0.5 [mGauss] 140 D.4 Anexo D. Especificações Técnicas dos Sensores GPS Thales Navigation DG14 O receptor de GPS DG14 processa sinais da constelação de satélites do Sistema de Posicionamento Global (Global Positioning System,GPS), de satélites geoestacionários da rede Satellite-based Augmentation System (SBAS) incluindo: Wide Area Augmentation System network (WAAS), da rede European Geostationary Navigation Overlay System (EGNOS), da rede Japanese Multi-function Transport System System (MSAS), e de transmissões de beacons de 300 kHz para fornecer medidas em tempo real de posição, velocidade e tempo. Na Figura D.4 apresenta-se uma ilustração do referido GPS. O DG14 utiliza catorze canais discretos e paralelos para efectuar medidas de código e fase de Coarse/Acquisition (C/A) (para obter pseudo-ranges) e para fazer medidas de fase da portadora L1 (1575.42 MHz). Para medições de WAAS, EGNOS, ou MSAS, pode utilizar dois dos canais paralelos. O DG14 recebe sinais de satélites através de uma antena de banda-L e de um amplificador de baixo ruído. Foi desenvolvido para operar em modo autónomo ou em modo diferencial (DGPS), tendo a capacidade de desempenhar a função de estação base de referência ou de estação móvel, fornecendo ou utilizando correcções diferenciais em tempo real no formato RTCM (Radio Technical Commission for Maritime Services) SC-104 (versão 2.2). O formato RTCM SC-104 é um formato standard para transmissão de correcções diferenciais. Figura D.4: GPS DG14 da Thales. Para além das aplicações relacionadas com navegação de veículos (posicionamento), este dispositivo encontra também aplicações como solução de baixo custo em sistemas de atitude ou monitorização de deformações em estruturas. D.4. GPS Thales Navigation DG14 141 Em seguida, apresenta-se de forma sumariada algumas das características técnicas do GPS Thales DG14: - - Receptor GPS de 14 canais (12 para código e fase, 2 para SBAS (WAAS/EGNOS/MSAS)). Tensão de alimentação: 5 V. Consumo energético de cerca de 1.2 watt). Datums definidos pelo utilizador e outros predefinidos. Comunicações série bi-direccionais por três portos RS-232. Saída de dados raw (código e fase). Captura precisa da fase da portadora. Saída no formato NMEA-0183 V3.0. Frequência de amostragem configurável para posição e dados raw até 20 Hz. Informação sobre a latência da medida de posição. Saída de dados raw (código e fase). Saída 1 Pulso Por Segundo (5 V TTL) com precisão: 200 ns (autónomo) 50 ns (diferencial). Algoritmos baseados em filtragem de Kalman. Velocidade máxima: 514 m/s. Altitude máxima: 18.288 km. Precisão na velocidade: 95 %: 0.0514 m/s. Time To First Fix Re-acquisition 3 s Hot start 11 s Warm start 35 s Cold start 90 s Precisão da posição em tempo real: • Autónomo: CEP: 3.0 m 95%: 5.0 m • Diferencial: - Estação base local: CEP: 40 cm 95%: 90 cm - Beacon: CEP: 70 cm 95%: 1.6 m - SBAS: CEP: 1.0 m 95%: 3.0 m Bibliografia [1] Projecto EFACEC/IST, 1991. [2] National Aeronautics and Space Administration. http://www.nasa.gov, 2008. [3] Schiebel Group. http://www.schiebel.net/, 2008. [4] The Institute of Navigation Museum. http://www.ion.org/museum, 2008. [5] Caruso, M. A New Perspective on Magnetic Field Sensing. Honeywell Inc., 1998. [6] National Oceanic and Atmospheric Administration. http://www.ngdc.noaa.gov/, 2008. [7] Alves, J. Arquitecturas distribuídas para controlo de veículos autónomos. Master’s thesis, Instituto Superior Técnico, Abril 2006. [8] IEEE Std 1431-2004. IEEE Standard Specification Format Guide and Test Procedure for Coriolis Vibratory Gyros. IEEE Aerospace and Electronic Systems Society, 2004. [9] Silicon Sensing Systems. http://www.siliconsensing.com, 2008. [10] Titterton, D. and Weston, J. Strapdown Inertial Navigation Technology. EE Radar, Sonar, Navigation and Avionics Series, 2004. [11] Alves, J. and Silvestre, C. A Distributed Architecture For Realtime Control. Technical Report, IST/ISR, 1999. [12] Honeywell. Digital Compass Solutions HMR3200/HMR3300, December 2005. [13] Crossbow Technology, Inc. CXL-TG Series-High performance accelerometer triad, 2006. [14] Silicon Sensing Systems Limited. CRS03 rate gyro datasheet, 2000. [15] Committee on Autonomous Vehicles in Support of Naval Operations. Autonomous Vehicles in Support of Naval Operations. The National Academic Press, Washington, D.C., 2005. [16] Lobo Pereira, F. Sistemas e veículos autónomos - aplicações na defesa. Curso de Defesa Nacional, 2005. 143 144 BIBLIOGRAFIA [17] Joint Robotics Program. FY2004 Joint Robotics Master Plan. OUSD Defense Systems/Land Warfare and Munitions,Pentagon, Washington, D.C., 2004. [18] Pascoal, A., Silvestre, C., Oliveira, P., Bjerrum, A., Ayela, G., Paul-Pignon, J., Bruun, S., and Petzelt, C. Marius: An autonomous underwater vehicle for coastal oceanography. IEEE Robotics and Automation Magazine, Special Issue on Robotics and Automation in Europe: Projects funded by the Commission of the European Union, pages 46–59, December 1997. [19] Blidberg, D. The development of autonomous underwater vehicles (auvs): A brief summary. AUSI, ICRA, Seoul, Korea, May 2001. [20] Instituto de Sistemas e Robótica, Lisboa. http://www.isr.ist.utl.pt, 2008. [21] Instituto Superior Técnico, Lisboa. http://www.ist.utl.pt, 2008. [22] Woods Hole Oceanography Institution. http://www.whoi.edu/, 2008. [23] National Oceanography Centre, Southampton,Underwater Systems Laboratory. http://www.noc.soton.ac.uk, 2008. [24] Bluefin Robotics Corporation. http://www.bluefinrobotics.com, 2008. [25] MIT Sea Grant’s AUV Lab. http://auvlab.mit.edu, 2008. [26] Autonomous Undersea Systems Institute. http://www.ausi.org, 2008. [27] Falmouth Scientific, Inc. http://www.falmouth.com, 2008. [28] Marine and Industrial Dynamic Analysis Research Group, University of Plymouth, Plymouth, UK . http://www.tech.plymouth.ac.uk/sme/springerusv, 2008. [29] Marine Robotic Vessels International. http://www.mrvint.com, 2008. [30] Robotic Marine Systems, LLC . http://www.maribotics.com, 2008. [31] CNR-ISSIA, University of Genova, Italy. http://www.charlie.ge.issia.cnr.it, 2008. [32] Pascoal, A., Oliveira, P., Silvestre, C., Sebastião, L., Rufino, M., Barroso, V., Gomes, J., Coince, P., Ayela, G., and others. Robotic ocean vehicles for marine science applications: the european asimov project. Oceans, 2000. [33] Bell Helicopter. http://www.bellhelicopter.com, 2008. [34] General Atomics Aeronautical Systems, Inc. http://www.ga-asi.com, 2008. [35] Aerosonde Pty, Ltd. http://www.aerosonde.com/, 2008. [36] General Atomics Aeronautical Systems, Inc. http://www.is.northropgrumman.com, 2008. [37] Boeing. http://www.boeing.com, 2008. 145 BIBLIOGRAFIA [38] Mettler, B., Tischler, M. B., and Kanade, T. System identification of small-size unmanned helicopter dynamics. In Presented at the American Helicopter Society 55th Forum, May 1999. [39] Mettler, B., Tischler, M. B., and Kanade, T. System identification modeling of a small-scale unmanned helicopter. Journal of the American Helicopter Society, October 2001. [40] Evans, J., Inalhan, G., Jang, J. S., Teo, R., and Tomlin, C. Dragonfly:a versatile uav platform for the advancement of aircraft navigation and control. In 20th IEEE Digital Avionics Systems Conference, October 2001. [41] Jang, J. S. and Tomlin, C. Design and implementation of a low cost, hierarchical and modular avionics architecture for the dragonfly uavs. In AIAA Guidance, Navigation, and Control Conference, Monterey, August 2002. [42] Shim, H. Hierarchical Flight Control System Synthesis for Rotorcraft-based Unmanned Aerial Vehicles. PhD thesis, University of California, Berkeley, December 2000. [43] Gavrilets, V., Shterenberg, A., Dahleh, M. A., and Feron, E. Avionics System For A Small Unmanned Helicopter Performing Aggressive Maneuvers. MIT Cambridge, 2000. [44] Sanghyuk, P. Avionics and Control System Development for Mid-Air Rendezvous of Two Unmanned Aerial Vehicles. PhD thesis, MIT Cambridge, February 2004. [45] Kahn, A. D. The design and development of a modular avionics system. Master’s thesis, Georgia Institute of Technology, April 2001. [46] Dittrich, J. S. Design and integration of an unmanned aerial vehicle navigation system. Master’s thesis, Georgia Institute of Technology, May 2002. [47] DragonFly UAV Project, http://airtraffic1.stanford.edu/~uav, 2008. Stanford University. [48] Stanford University. http://www.stanford.edu, 2008. [49] Yamaha Motor Co. Ltd. http://www.yamaha-motor.co.jp/global/, 2008. [50] Autonomous Helicopter Project, Carnegie Mellon Robotics Institute. http://www-2.cs.cmu.edu/afs/cs/project/chopper/www/heli_project.html, 2008. [51] Carnegie Mellon University. http://www.cmu.edu, 2008. [52] Massachusetts Institute of Technology. http://web.mit.edu, 2008. [53] Projecto AVATAR: Autonomous Vehicle Aerial Tracking And Reconnaissance. The Robotic Embedded Systems Laboratory. http://robotics.usc.edu/~avatar/index.html, 2008. 146 BIBLIOGRAFIA [54] The Robotic Embedded Systems Laboratory, University of Southern California. http://asimov.usc.edu/resl/index.html, 2008. [55] University of Southern California. http://www.usc.edu, 2008. [56] Unmanned Aerial Vehicle Research Facility, Georgia Institute of Technology. http://controls.ae.gatech.edu/uavrf, 2008. [57] Georgia Institute of Technology. http://www.gatech.edu, 2008. [58] Projecto BEAR, University of California http://robotics.eecs.berkeley.edu/bear, 2008. at Berkeley. [59] University of California at Berkeley. http://www.berkeley.edu, 2008. [60] Craig, J. J. Introduction to Robotics: Mechanics and Control. Prentice-Hall, 3 edition, 2003. [61] Craig, J. Introduction to Robotics: Mechanics and Control, Second Edition. Addison-Wesley Publishing, 1986. [62] Savage, P. G. Strapdown Analytics, volume 1. Strapdown Associates, Inc., Maple Plain, MN, 2000. [63] Farrel, J. Integrated Aircraft Navigation. New York. Academic Press Inc., 1976. [64] Savage, P. Strapdown inertial navigation integration algorithm design part 1: Attitude algorithms. Journal of Guidance, Control and Dynamics, 21(1):19–18, 1998. [65] Bortz, J. E. A new mathematical formulation for strapdown inertial navigation. IEEE Transactions on Aerospace and Electronic Systems, AES-7(1):61–66, 1971. [66] Farrel, J. Aided Navigation, GPS with High Rate Sensors. The McGraw-Hill Companies, 2008. [67] Marques, S. Small satellites attitude determination methods. Master’s thesis, Instituto Superior Técnico,Universidade Técnica de Lisboa, 2001. [68] Groves, P. D. Principles of GNSS, Inertial and Multi-Sensor Integrated Navigation Systems. Artech House, 2008. [69] Miranda, J. M., Luis, J. F., Costa, P. T., and Santos, F. M. Manual de Fundamentos de Geofísica. Faculdade de Ciências da Universidade de Lisboa, 2004. [70] Antunes, C. Apontamentos das Aulas de Introdução à Geodesia. Faculdade de Ciências da Universidade de Lisboa. [71] The Johns Hopkins Applied Research Lab. http://sd-www.jhuapl.edu/Transit, 2008. [72] NIMA. DoD World Geodetic System 1984 (WGS-84)-Its Definition and Relationships with Local Geodetic Systems, NIMA TR 8350.2, January 2000. BIBLIOGRAFIA 147 [73] Andrews, W. J. A chronicle of timekeeping. Scientific American, 2002. [74] Grewal, M. S., Weill, L. R., and Andrews, A. P. Global Positioning Systems, Inertial Navigation, and Integration, 2nd Edition. John Wiley & Sons, 2007. [75] Hellman, H. The development of inertial navigation. Journal of the Institute of Navigation, 9(2):81–93, 1962. [76] Draper, C. S. Origins of inertial navigation. AIAA Journal of Guidance and Control, 4(5):449–463, 1981. [77] Lawrence, A. Modern Inertial Technology: Navigation, Guidance and Control. Springer Verlag, New York, 1998. [78] Kayton, M. and Fried, W. R. Avionics Navigation Systems. John Wiley & Sons,New York, 1997. [79] Advisory Group for Aerospace Research & Development (AGARD/NATO). Multilingual aeronautical dictionary. ftp://ftp.rta.nato.int/PubFullText/AGARD/Misc/AGARD-Misc-MAD, 1980. [80] Kelly, A. Modern Inertial and Satellite Navigation Systems. Carnegie Mellon University, 1994. [81] Merhav, S. Aerospace Sensor Systems and Applications. Springer-Verlag New York Inc., 1996. [82] Grewal, M. S., Weill, L. R., and Andrews, A. P. Global Positioning Systems, Inertial Navigation, and Integration. John Wiley & Sons, January 2001. [83] European Space Agency. http://www.esa.int, 2008. [84] COSPAS-SARSAT. http://www.cospas-sarsat.org, 2008. [85] Pires, A. and Ferraz, N. Sistema de navegação para helicóptero autónomo por integração insgps. Projecto de Final de Curso, Instituto Superior Técnico, 2002. [86] Calvário, J. and Vasconcelos, J. Estratégias de fusão sensorial para sistemas de navegação com aplicação a helicópteros autónomos. Projecto de Final de Curso, Instituto Superior Técnico, 2003. [87] ISO. Iso international standard 11898: Road vehicles - interchange of digital information - controller area network (can) for high-speed communication. Technical report, International Organization for Standarization (ISO), November 1993. [88] Can specification version 2.0. Technical report, Robert Bosch GmbH, September 1991. [89] Draper Laboratory. http://www.draper.com, 2008. 148 BIBLIOGRAFIA [90] Bernstein, J., Cho, S., King, A. T., Kourepenis, A., Maciel, P., and Weinberg, M. A micromachined comb-drive tuning fork rate gyroscope. Proc IEEE Micro Electro Mechanical Systems Workshop (MEMS ’93) Fort Lauderdale, pages 143– 148, February 1993. [91] Sumitomo Precision Products. http://www.spp.co.jp, 2008. [92] Atlantic Inertial Systems . http://www.atlanticinertialsystems.com, 2008. [93] BAE Systems. http://www.baesystems.com, 2008. [94] Britting, K.R. Inertial Navigation Systems Analysis. John Wiley & Sons, Inc., 1971. [95] Gelb, A. Applied Optimal Estimation. The M.I.T. Press, 1974. [96] Kinsey, J. C., Eustice, R. M., and Whitcomb, L. L. A survey of underwater vehicle navigation: Recent advances and new challenges. In Proceedings of the 7th IFAC Conference of Manoeuvring and Control of Marine Craft (MCMC), Lisbon, Portugal, 2006. [97] Crassidis, J. L., Markley, F. L., and Cheng, Y. Survey of nonlinear attitude estimation methods. Journal of Guidance, Control, and Dynamics, 30(1):12–28, JanuaryFebruary 2007. [98] Markley, F. L. Attitude error representations for Kalman filtering. Journal of Guidance, Control, and Dynamics, 26(2):311–317, March-April 2003. [99] Pittelkau, M. E. Rotation vector in attitude estimation. Journal of Guidance, Control, and Dynamics, 26(6):855–860, November-December 2003. [100] Dissanayake, G., Sukkarieh, S., Nebot, E., and Durrant-Whyte, H. The aiding of a low-cost strapdown inertial measurement unit using vehicle model constraints for land vehicle applications. IEEE Transactions on Robotics and Automation, 17(5):731–747, Oct 2001. [101] Bierman, G. J. Factorization Methods for Discrete Sequential Estimation. New York. Academic Press Inc., 1977. [102] Grewal, M. S. and Andrews, A. P. Kalman Filtering : Theory and Practice Using MATLAB, 2nd Edition. John Wiley & Sons, January 2001. [103] Julier, S. J. and Uhlmann, J. K. Unscented filtering and nonlinear estimation. Proceedings of the IEEE, 92(3):401–422, Mar 2004. [104] Crassidis, J. L. Sigma-point Kalman filtering for integrated GPS and inertial navigation. IEEE Transactions on Aerospace and Electronic Systems, 42(2):750–756, 2006. BIBLIOGRAFIA 149 [105] Mahony, R. and Hamel, T. Advances in Unmanned Aerial Vehicles: State of the Art and the Road to Autonomy, volume 33 of Intelligent Systems, Control and Automation: Science and Engineering, chapter 11 - Robust Nonlinear Observers for Attitude Estimation of Mini UAVs. Springer, 2007. [106] Rehbinder, H. and Ghosh, B. K. Pose estimation using line-based dynamic vision and inertial sensors. IEEE Transactions on Automatic Control, 48(2):186–199, February 2003. [107] Rehbinder, H. and Hu, X. Nonlinear state estimation for rigid body motion with low-pass sensors. Systems and Control Letters, 4(3):183–190, July 2000. [108] Brown, R. and Hwang, P. Introduction to Random Signals and Applied Kalman Filtering. John Wiley & Sons, February 1997. [109] Anderson, W. G. and Fritze, E. H. Instrument approach system steering computer. Proceedings of Institute of Radio Engineers, 41(2):219–228, February 1953. [110] Wirkler, W. H. Aircraft course stabilization means. U.S. Patent 2,548,278, 1951. [111] Wiener, N. Extrapolation, Interpolation and Smoothing of Stationary Time Series. John Wiley and Sons, New York, 1949. [112] Brown, R. G. Integrated navigation systems and Kalman filtering: A perspective. Journal of the Institute of Navigation, 19(4):335–362, 1972. [113] Higgins, W. T. A comparison of complementary and Kalman filtering. IEEE Transactions on Aerospace and Electronic Systems, AES-11(3):321–325, 1975. [114] Yun, X., Bachmann, E. R., McGhee, R. B., Whalen, R. H., Roberts, R. L., Knapp, R. G., Healey, A. J., and Zyda, M. J. Testing and evaluation of an integrated gps/ins system for small auv navigation. Oceanic Engineering, IEEE Journal of, 24(3):396–404, Jul 1999. [115] Whitcomb, L. L., Yoerger, D. R., and Singh, H. Combined Doppler/LBL based navigation of underwater vehicles. In Proceedings of the 11th International Symposium on Unmanned Untethered Submersible Technology, New Hampshire, USA, August 1999. [116] Pascoal, A., Kaminer, I., and Oliveira, P. Navigation system design using time varying complementary filters. IEEE Aerospace and Electronic Systems, 36(4):1099–1114, October 2000. [117] Roberts, J., Corke, P., and Buskey, G. Low-cost flight control system for a small autonomous helicopter. In Proceedings of IEEE Int. Conf. on Robotics and Automation, pages 546–551, Taipai, September 2003. [118] Jung, D. and Tsiotras, P. Inertial attitude and position reference system development for a small UAV. In AIAA Infotech at Aerospace, Rohnert Park, CA, May 2007. 150 BIBLIOGRAFIA [119] Vasconcelos, J. F., Cardeira, B., Silvestre, C., Oliveira, P., and Batista, P. Discretetime complementary filters for attitude and position estimation: Design, analysis and experimental validation. Submetido e aceite com pequenas alterações na IEEE Transactions on Control Systems Technology, 2009. [120] Vasconcelos, J. F., Silvestre, C., Oliveira, P., Batista, P., and Cardeira, B. Discrete time-varying attitude complementary filter. Submetido e aceite na American Control Conference, 2009. [121] Vasconcelos, J. F., Calvário, J., Oliveira, P., and Silvestre, C. GPS aided IMU for unmanned air vehicles. In Proceedings of the 5th IFAC/EURON Symposium on Intelligent Autonomous Vehicles, Instituto Superior Técnico, Lisboa, Portugal, July 2004. [122] Franklin, G. F., Powell, J. D., and Workman, M. Digital Control of Dynamic Systems. Addison Wesley, 3rd edition, 1998. [123] Gower, J. C. and Dijksterhuis, G. B. Procrustes Problems. Number 30 in Oxford Statistical Science Series. Oxford University Press, USA, 2004. [124] Wahba, G. A least-squares estimate of satellite attitude. SIAM Review, 7(3):409 problem 65–1, 1965. [125] Bar-Itzhack, I. Y. and Harman, R. R. Optimized TRIAD algorithm for attitude determination. Journal of Guidance, Control and Dynamics, 20(1):208–211, January 1997. [126] Jazwinski, A. H. Stochastic Processes and Filtering Theory. Academic Press, 1970. [127] Anderson, Brian D. O. and Moore, John B. Optimal Filtering. Dover Publications, 1979. [128] Rugh, W. J. Linear System Theory. Prentice-Hall, 2 edition, 1995. [129] Batista, P., Silvestre, C., and Oliveira, P. Position and velocity navigation filters for marine vehicles. In Proceedings of the 17th IFAC World Congress, Seoul, South Korea, July 2008. [130] Bittanti, S., Colaneri, P., and Nicolao, G. An algebraic riccati equation for the discrete-time periodic prediction problem. Systems & Control Letters, pages 71–78, 1990. [131] Oppenheim, A. V., Schafer, R. W., and Buck, J. R. Discrete-Time Signal Processing. Signal Processing. Prentice-Hall, 2 edition, 1999. [132] Bowditch, N. The American Practical Navigator. Defense Mapping Agency, Hydrographic/Topographic Center, Bethesda, Maryland, USA, 1995. [133] Mach, J. J. Toward auto-calibration of navigation sensors for miniature autonomous underwater vehicles. Master’s thesis, Faculty of the Virginia Polytechnic Institute and State University, Blacksburg, Virginia, 2003. BIBLIOGRAFIA 151 [134] Denne, W. Magnetic Compass Deviation and Correction. Brown, Son, & Ferguson Ltd., 1979. [135] Elkaim, G. H., Gebre-Egziabher, D., Powell, J. D., and Parkinson, W. B. A nonlinear, two-step estimation algorithm for calibrating solid-state strapdown magnetometers. 8th St. Petersburg Conference on Navigation Systems (IEEE/AIAA), St. Petersburg, Russia, May 2001. [136] Fitzgibbon, A. W., Pilu, M., Fisher, R. B., and Parkinson, W. B. Direct leastsquares fitting of ellipses. IEEE Transactions on Pattern Analysis and Machine Intelligence, 21(5):476–480, May 1999. [137] Philips Semiconductors. XA-S3 Datasheet, Dezembro 2001. [138] Burr-Brown. ADS1210 Datasheet, September 2005. literature number SBAS034B. [139] Baltazar, F., Cardeira, B., and Dias, P. Manuais da arquitectura de navegação. Relatório Interno, ISR-DSOR, 2004. [140] Xilinx. XC9500 In-System Programmable CPLD Family, April 2006. DS063 (v5.4). [141] Texas Instruments. TMS320VC33 Datasheet, January 2004. literature number SPRS087E. [142] Texas Instruments. TMS320C3X User’s Guide, March 2004. literature number SPRU031F.