Ficheiro PDF - Departamento de Engenharia Mecânica

Transcrição

UNIVERSIDADE TÉCNICA DE LISBOA
INSTITUTO SUPERIOR TÉCNICO
Arquitecturas para Navegação Inercial/GPS com
Aplicação a Veículos Autónomos
Bruno Miguel Simões Carvalho Cardeira
(Licenciado)
Dissertação para a obtenção do Grau de Mestre
em Engenharia Electrotécnica e de Computadores
Orientador:
Co-Orientador:
Júri:
Presidente:
Vogais:
Doutor Carlos Jorge Ferreira Silvestre
Doutor Paulo Jorge Coelho Ramalho Oliveira
Doutor
Doutor
Doutor
Doutor
Fernando Duarte Nunes
Jorge Manuel Miranda Dias
Carlos Jorge Ferreira Silvestre
Paulo Jorge Coelho Ramalho Oliveira
Fevereiro de 2009
Agradecimentos
O presente relatório sumariza um trabalho que se estendeu ao longo de cerca de
dois anos, tendo nesse período, contado com a ajuda e amizade de diversas pessoas
às quais gostaria de agradecer. As primeiras palavras dirigem-se para os Professores
Carlos Silvestre e Paulo Oliveira cuja inspiração originou este trabalho, pelas importantes
contribuições e pelo apoio e incentivo continuado.
Agradeço também aos colegas e amigos do DSOR, Rita Cunha, Manuel Rufino,
Luís Sebastião, João Alves, Alex Peñas, André Oliveira, Pedro Gomes, Bruno Guerreiro,
Pedro Serra, pela disponibilidade e ajuda prestadas. Uma palavra de agradecimento é
também devida ao colega Pedro Baptista pela sua contribuição neste trabalho.
Estendo o presente agradecimento a todos os amigos que por proporcionarem bons
momentos de descontratação e boa disposição, que são essenciais nos momentos de maior
tensão, contribuíram para a concretização deste esforço. Uma palavra especial para o
amigo e colega do DSOR José Vasconcelos, cujo apoio e colaboração em alturas mais
críticas do trabalho foi bastante importante.
Não posso deixar de agradecer aos meus pais e familiares por terem respeitado
o meu trabalho, tolerado ausências forçadas em momentos importantes e telefonemas
esquecidos, para eles, muito obrigado!
i
ii
Resumo
Esta tese aborda o desenvolvimento e integração de um sistema de navegação inercial para a determinação da posição e orientação de um veículo autónomo recorrendo a
um receptor de Global Positioning System (GPS) e a conjuntos de acelerómetros, magnetómetros e giroscópios tridimensionais. No presente trabalho, recorre-se a técnicas de
filtragem complementar para implementar um sistema de navegação com estimativa de
posição parametrizada em coordenadas do referencial da Terra, estimativa de velocidade
parametrizada no referencial do Corpo e estimativa de atitude descrita em ângulos de
Euler. A filtragem complementar permite abordar explicitamente o problema da fusão
de dados com origem nos sensores instalados a bordo da plataforma, cuja informação se
encontra em regiões complementares do espectro de frequência. Algumas das características especiais desta metodologia incluem a estimação e compensação de polarizações dos
sensores inerciais. Um dispositivo auxiliar para determinação da orientação, designado
por Estimador Magneto-Pendular é apresentado e descrito em detalhe. É esboçada a
síntese de filtros complementares, multi-ritmo, com propriedades de estabilidade e de desempenho, para a resolução do problema de determinação da posição e da orientação. Os
parâmetros dos filtros propostos são desenhados com recurso a critérios de optimalidade,
tendo em conta a caracterização dos sensores disponível, que poderá ser estocástica ou
no domínio da frequência. É ainda apresentada e discutida de forma breve uma transformação não linear com aplicação à análise de estabilidade e de desempenho dos filtros
complementares de posição e atitude. Formulados em tempo discreto, os filtros complementares de atitude e posição, permitem uma implementação prática recorrendo a
hardware de processamento digital convencional, preservando a validade das propriedades de estabilidade e desempenho.
Descreve-se uma arquitectura de hardware de tempo real para a implementação
do sistema navegação e discutem-se questões de integração, tanto de índole electromagnética como de índole mecânica, que surgem da interacção entre os diferentes módulos. Apresentam-se sucintamente os sistemas integrados a bordo bem como a consola de
terra desenvolvidos a partir de módulos Commercial-Off-The-Shelf (COTS) e de hardware/software especificamente concebidos para a presente aplicação.
Finalmente, o desempenho do sistema de navegação bem como a sua instalação são
avaliadas em simulação e testes de campo recorrendo ao catamaran DELFIMx, desenvolvido no pólo de Lisboa do Instituto de Sistemas e Robótica.
Palavras-Chave: Sistema de Navegação, Filtragem Complementar, Sistemas de
Navegação Inercial, Arquitecturas de Sistemas de Tempo Real, Veículos Autónomos.
iii
Abstract
This thesis addresses the development and integration of a strapdown navigation
system to determine the position and attitude of unmanned vehicles, using accelerometers,
magnetometers and rate gyros triads aided by Global Positioning System (GPS) measurements. The current work resorts to Complementary Filtering techniques to implement
the navigation system developed on Earth frame coordinates for the position estimation,
with the velocity estimated in the body frame and with the attitude described using
Euler angles. Complementary filters explicitly tackle the problem of merging information
provided by the vehicle sensor suite over distinct, yet complementary frequency regions.
Special features include bias estimation and removal in inertial sensors. An attitude aiding device, referred to as Magneto-Pendular Sensor, is implemented and the synthesis
of the multirate complementary filters is outlined. Stability and performance properties
of the proposed filters are derived to solve the position and attitude estimation problem.
The proposed filters parameters are synthesized based on optimality results, regarding
the available sensor suite characteristics, that can be stochastic or frequency based. It
is also presented and briefly discussed a nonlinear transformation that finds application
in the stability and performance analysis of the position and attitude complementary
filters. Formulated in discrete-time, the position and attitude complementary filters allow for practical implementation without requiring high performance signal processing
hardware and maintaining all their stability and performance properties.
The hardware architecture for the implementation of the real-time navigation system is presented and the different hardware modules are described. Integration issues, both electromagnetic and mechanical, that arise from the interaction of different systems are also addressed. The on-board systems and ground station design
made from Commercial-Off-The-Shelf (COTS) sub-systems and custom developed hardware/software modules are briefly presented.
Finally, the overall system performance is evaluated both in simulation and in sea
trials using the DELFIMx catamaran developed at the Institute for Systems and Robotics
- Lisbon.
Keywords: Inertial Navigation Systems, Complementary Filters, Strapdown Systems, Inertial Sensors, Avionic Systems, Autonomous Vehicles.
v
vi
Conteúdo
Agradecimentos
i
Resumo
iii
Abstract
v
Conteúdo
vii
Lista de Figuras
xi
Lista de Tabelas
xv
Nomenclatura
xvii
1 Introdução
1.1 Veículos Autónomos . . . . . . . . . . . .
1.1.1 Características Gerais . . . . . . .
1.1.2 Estrutura de um Veículo Autónomo
1.1.3 Veículos Marinhos Autónomos . . .
1.1.4 Veículos Aéreos Autónomos . . . .
1.1.5 Veículos Terrestres Autónomos . .
1.1.6 Aplicações . . . . . . . . . . . . . .
1.2 Objectivos . . . . . . . . . . . . . . . . . .
1.3 Contribuições . . . . . . . . . . . . . . . .
1.4 Organização da Tese . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
2 Representação da Orientação e Referenciais
2.1 Representação da Orientação . . . . . . . . .
2.1.1 Matriz de Rotação . . . . . . . . . .
2.1.2 Ângulos de Euler . . . . . . . . . . .
2.1.3 Vector de Rotação . . . . . . . . . .
2.1.4 Quaterniões . . . . . . . . . . . . . .
2.2 Definição dos Referenciais . . . . . . . . . .
2.2.1 Referencial Inercial . . . . . . . . . .
2.2.2 Referencial da Terra . . . . . . . . .
2.2.3 Referencial Geográfico . . . . . . . .
2.2.4 Referencial Geocêntrico . . . . . . . .
vii
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
de
. .
. .
. .
. .
. .
. .
. .
. .
. .
. .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
1
1
1
2
4
7
9
10
13
14
14
Navegação
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
16
16
16
18
21
21
25
25
25
27
27
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
viii
CONTEÚDO
2.3
2.2.5 Referencial do Plano Tangente . . .
2.2.6 Referencial do Corpo . . . . . . . .
A Forma da Terra e Modelo da Gravidade
2.3.1 Campo Gravitacional . . . . . . . .
2.3.2 Campo Gravítico . . . . . . . . . .
2.3.3 O Geóide . . . . . . . . . . . . . .
2.3.4 Elipsóide WGS84 . . . . . . . . . .
2.3.5 Modelo Gravítico da Terra . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
3 Fundamentos de Navegação Terrestre
3.1 Introdução . . . . . . . . . . . . . . . . . . . . .
3.2 Navegação Inercial . . . . . . . . . . . . . . . .
3.2.1 Introdução . . . . . . . . . . . . . . . . .
3.2.2 Sensores Inerciais . . . . . . . . . . . . .
3.2.3 Tipos de Plataformas . . . . . . . . . . .
3.3 Navegação por Satélite . . . . . . . . . . . . . .
3.3.1 Introdução . . . . . . . . . . . . . . . . .
3.3.2 Global Positioning System . . . . . . . .
3.3.3 GLONASS . . . . . . . . . . . . . . . . .
3.3.4 Galileo . . . . . . . . . . . . . . . . . . .
3.4 Campo Magnético Terrestre . . . . . . . . . . .
3.4.1 Magnetómetro . . . . . . . . . . . . . . .
3.4.2 Estimador de Atitude Magneto-Pendular
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
28
28
29
29
30
31
31
33
.
.
.
.
.
.
.
.
.
.
.
.
.
34
34
36
36
39
42
44
44
45
46
46
47
47
49
4 Arquitectura Proposta para um Catamaran
4.1 Descrição Geral do Veículo e da Arquitectura . . . . . .
4.2 Computador de Bordo Distribuído . . . . . . . . . . . . .
4.2.1 Arquitectura de Comunicações Distribuída - CAN
4.2.2 Nós da Rede CAN Bus . . . . . . . . . . . . . . .
4.3 Monitorização, Transformação e Distribuição de Energia
4.4 Actuadores . . . . . . . . . . . . . . . . . . . . . . . . .
4.5 Sensores . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.5.1 Unidade de Medição Inercial . . . . . . . . . . . .
4.5.2 Tecnologia MEMS . . . . . . . . . . . . . . . . .
4.5.3 Magnetómetro . . . . . . . . . . . . . . . . . . . .
. . .
. . .
Bus
. . .
. . .
. . .
. . .
. . .
. . .
. . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
52
52
54
54
56
59
59
60
60
61
66
5 Filtro de Navegação
5.1 Introdução e Motivação . . . . . . . . . . . . . .
5.2 Filtro Complementar de Atitude . . . . . . . . .
5.3 Filtro de Posição . . . . . . . . . . . . . . . . .
5.4 Implementação . . . . . . . . . . . . . . . . . .
5.4.1 Estimador de Atitude Magneto-Pendular
5.4.2 Acoplamento do Filtro Complementar . .
5.4.3 Filtragem Multi-Ritmo . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
68
68
73
78
82
82
83
83
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
ix
CONTEÚDO
6 Resultados e Análise de Dados Reais
6.1 Síntese dos Parâmetros dos Filtros . . . . . . . . . . .
6.2 Análise dos Resultados Experimentais . . . . . . . . . .
6.2.1 Desempenho dos Filtros com Falhas de GPS . .
6.2.2 Validação dos Filtros no Domínio da Frequência
.
.
.
.
86
86
88
90
91
7 Conclusões e Trabalho Futuro
7.1 Conclusões . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.2 Trabalho Futuro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
98
98
99
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
A Desempenho do Filtro Atitude
101
B Magnetómetro: Modelação do Erro e Calibração
103
B.1 Descrição e Modelação das Fontes de Erro . . . . . . . . . . . . . . . . . 103
B.2 Modelo do Erro das Medidas do Magnetómetro . . . . . . . . . . . . . . 105
B.3 Algoritmos de Calibração de um Magnetómetro . . . . . . . . . . . . . . 109
C Descrição do Hardware
C.1 Placa MC-XAS3 . . . . . . . . . . . . . . . . . . . . . . .
C.1.1 Características Gerais . . . . . . . . . . . . . . . .
C.1.2 Características Específicas . . . . . . . . . . . . . .
C.1.3 Características do Microcontrolador Philips XAS3 .
C.2 Arquitectura de Aquisição de Sinal . . . . . . . . . . . . .
C.2.3 Caracterização do Desempenho da Placa AD24B3C
C.3 Placa ASHDG14If - Interface com GPS Ashtech . . . . . .
C.4 Placa DSPIf - Interface com D.Module.VC33 . . . . . . . .
C.5 Placa D.Signt.T D.Module.VC33 . . . . . . . . . . . . . .
C.6 Placa MC_AVRCAN128 . . . . . . . . . . . . . . . . . . .
C.7 Placa HMR_MB - Interface com HMR3300 . . . . . . . .
C.7.2 Diagrama de Blocos . . . . . . . . . . . . . . . . .
C.8 Placa BatMonit . . . . . . . . . . . . . . . . . . . . . . . .
C.8.3 Diagrama de Blocos . . . . . . . . . . . . . . . . .
C.9 Placa SWLNPWR . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
115
115
115
116
116
117
117
118
120
122
122
122
123
123
123
124
124
126
127
127
127
129
129
130
131
131
131
132
133
133
x
CONTEÚDO
C.9.2 Características Específicas . . . . . . . . . . . . . . . . . . . . . .
C.9.3 Diagrama de Blocos . . . . . . . . . . . . . . . . . . . . . . . . .
D Especificações Técnicas dos Sensores
D.1 Acelerómetro Crossbow CXL02TG3 . . . . . . . . . . . .
D.2 Giroscópio de Velocidade Silicon Sensing Systems CRS03
D.3 Magnetómetro Honeywell HMR3300 . . . . . . . . . . .
D.4 GPS Thales Navigation DG14 . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
133
134
135
135
136
138
140
Lista de Figuras
1.1
1.2
1.3
1.4
1.7
1.8
1.9
Exemplos de Veículos Submarinos Autónomos. . . . . . . . . . . . . . . .
Exemplos de Autonomous Surface Crafts. . . . . . . . . . . . . . . . . . .
Exemplos de Veículos Aéreos Autónomos. . . . . . . . . . . . . . . . . . .
Exemplos de plataformas aéreas de testes pertencentes a várias instituições
académicas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Exemplos de Veículos Terrestres Autónomos. . . . . . . . . . . . . . . . .
Transporte automático de materiais entre armazéns da EFACEC e postos
de trabalho (extraído de [1]). . . . . . . . . . . . . . . . . . . . . . . . . .
Sistemas avançados de resposta a incêndio (extraído de [2]). . . . . . . .
Patrulhamento de fronteiras (extraído de [3]). . . . . . . . . . . . . . . .
Inspecção automática de estruturas semi-submersas. . . . . . . . . . . . .
10
11
12
13
2.1
2.2
2.3
2.4
2.5
2.6
2.7
Ângulos de Euler Z-Y-X. . . . . . . . . . . . . . . . . . . . .
Relação entre os referenciais {I} e {E}. . . . . . . . . . . . .
Elipsóide e sistemas de coordenadas habituais. . . . . . . . .
Referencial do plano tangente e sua relação com o referencial
Eixos do referencial do corpo. . . . . . . . . . . . . . . . . .
Vector de gravidade real. . . . . . . . . . . . . . . . . . . . .
O Geóide terrestre e outras superfícies de interesse. . . . . .
18
26
27
28
29
30
32
3.1
Corte de uma girobússola desenvolvida pelo alemão Hermann AnschützKämpfe. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Algoritmos de navegação para plataformas inerciais. . . . . . . . . . . . .
Máquina de Bohnenberger e giroscópio mecânico (extraído de [4]). . . . .
Modelo simplificado de um acelerómetro. . . . . . . . . . . . . . . . . . .
Constelação de satélites do GPS. . . . . . . . . . . . . . . . . . . . . . .
Ilustração da não sobreposição entre os pólos magnéticos e os pólos geográficos terrestres (extraído de [5]). . . . . . . . . . . . . . . . . . . . . .
Mapa mundial da declinação magnética (extraído de [6]). . . . . . . . . .
Descrição do campo magnético terrestre num ponto da sua superfície. . .
Leitura de dois sensores magnéticos ortogonais (inseridos no plano horizontal) quando rodados de 360o no plano horizontal. . . . . . . . . . . . .
Inclinómetro e acelerómetro. . . . . . . . . . . . . . . . . . . . . . . . . .
1.5
1.6
3.2
3.3
3.4
3.5
3.6
3.7
3.8
3.9
3.10
4.1
4.2
. . .
. . .
. . .
{E}.
. . .
. . .
. . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Diagrama de blocos do conceito operacional do sistema DELFIMx. . . . .
Diagrama geral da arquitectura proposta para operação do sistema DELFIMx. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
xi
5
6
7
8
9
35
38
40
41
45
47
48
48
49
50
52
53
xii
LISTA DE FIGURAS
4.3
4.4
4.13
Diagrama de blocos da arquitectura distribuída. . . . . . . . . . . . . . .
Arquitectura dos nós CAN e ligação ao meio de transmissão (extraído de
[7]). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Diagrama funcional do protocolo do tipo mailbox implementado com a
DP-RAM. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Partes mecânicas, electro-mecânicas e eléctricas dos actuadores. . . . . .
Unidade de medição inercial. . . . . . . . . . . . . . . . . . . . . . . . . .
Classes de giroscópios de velocidade do tipo Coriolis Vibrating Gyroscopes
(extraído de [8]). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Primeiro protótipo funcional de um giroscópio MEMS do tipo diapasão,
desenvolvido no Draper Laboratory. . . . . . . . . . . . . . . . . . . . . .
Giroscópio de velocidade Silicon Sensing Systems CRS03 (extraído de [9]).
Imagem SEM de um acelerómetro de massa pendular no plano (extraído
de [10]). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Imagem SEM de um acelerómetro de massa pendular fora do plano (extraído de [10]). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Imagem SEM de um VBA no plano (extraído de [10]). . . . . . . . . . .
5.1
5.2
5.3
5.4
Aplicações de filtragem. . . . . . . . . . . . .
Arquitectura global do sistema de navegação.
Filtro complementar de atitude. . . . . . . . .
Filtro complementar de posição. . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
70
72
74
79
6.1
6.2
6.3
6.4
6.5
6.6
6.7
6.8
6.9
6.10
6.11
6.12
Funções de transferência do filtro complementar. . . . . . . . . . . . .
1
s). . . . . . . . . . . . . . . .
Desempenho do filtro de atitude (T = 56
Resultados da trajectória estimada do DELFIMx. . . . . . . . . . . .
Resultados da estimação de atitude. . . . . . . . . . . . . . . . . . . .
Resultados da estimação de posição. . . . . . . . . . . . . . . . . . . .
Resultados da estimação das velocidades linear e angular. . . . . . . .
Resultados da estimação da polarização do giroscópio de velocidade. .
Resultados da estimativa de posição com falhas nas medidas de GPS.
Detalhes da trajectória estimada com falhas nas medidas de GPS. . .
Espectrogramas das medidas de yaw e da estimativa do filtro. . . . .
Espectrogramas das medidas de picth e da estimativa do filtro. . . . .
Espectrogramas das medidas de px e da estimativa do filtro. . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
88
88
89
89
90
90
91
92
93
95
95
95
4.5
4.6
4.7
4.8
4.9
4.10
4.11
4.12
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
B.1 Evolução do modelo do erro em função de yaw medido com diferentes
perturbações. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
B.2 Representação da distorção de hard iron. . . . . . . . . . . . . . . . . . .
B.3 Representação da distorção de soft iron. . . . . . . . . . . . . . . . . . .
B.4 Representação da distorção devido a diferentes factores de escala para cada
eixo do magnetómetro. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
B.5 Representação da distorção devido ao desalinhamento no plano horizontal
entre os eixos do magnetómetro e o referencial do corpo. . . . . . . . . .
B.6 Ilustração do processo de correcção das perturbações que afectam as medidas do magnetómetro quando o mesmo completa uma volta de 360o no
plano horizontal. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
55
55
57
60
61
63
63
64
64
65
66
106
107
108
109
109
112
xiii
LISTA DE FIGURAS
B.7 Efeito da calibração no erro da medida de heading a partir do magnetómetro.113
C.1
C.2
C.3
C.4
Placa MC-XAS3. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
Diagrama de blocos da placa MC-XAS3 (extraído de [11]). . . . . . . . . 116
Placa AD24B3C. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
Arquitectura de aquisição de sinal analógico composta por placas AD24B3C
empilhadas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
C.5 Histogramas dos ADC0 e ADC1 da placa AD24B3C. . . . . . . . . . . . . 121
C.6 Histograma do ADC2 da placa AD24B3C. . . . . . . . . . . . . . . . . . 121
C.7 Placa ASHDG14If. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
C.8 Diagrama conceptual da interface entre a placa MC-XAS3 e o D.Module.VC33.123
C.9 Diagrama de blocos e imagem da placa DSPIf. . . . . . . . . . . . . . . . 124
C.10 Placa D.Module.VC33. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
C.11 Placa MC_AVRCAN128. . . . . . . . . . . . . . . . . . . . . . . . . . . 127
C.12 Placa HMR_MB. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
C.13 Placa do HMR3300 empilhada na placa HMR_MB. . . . . . . . . . . . . 129
C.14 Diagrama de blocos da placa HMR_MB. . . . . . . . . . . . . . . . . . . 130
C.15 Placa BatMonit. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
C.16 Diagrama de blocos da placa BatMonit. . . . . . . . . . . . . . . . . . . . 132
C.17 Placa SWLNPWR. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133
C.18 Diagrama de blocos da placa SWLNPWR. . . . . . . . . . . . . . . . . . 134
D.1
D.2
D.3
D.4
Acelerómetro CXL02TG3 da Crossbow Technology, Inc.. . .
Giroscópio de velocidade CRS03 da Silicon Sensing Systems.
Magnetómetro HMR3300 (extraído de [12]). . . . . . . . . .
GPS DG14 da Thales. . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
136
137
138
140
Lista de Tabelas
2.1
Parâmetros do WGS84. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
32
6.1
6.2
Parâmetros do filtro complementar. . . . . . . . . . . . . . . . . . . . . .
Deriva da posição final e média devido a falhas de GPS. . . . . . . . . . .
86
91
C.1 Desempenho da placa AD24B3C. . . . . . . . . . . . . . . . . . . . . . .
122
D.1 Especificações técnicas do acelerómetro Crossbow CXL02TG3 (extraído de
[13]). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
D.2 Especificações técnicas do giroscópio de velocidade Silicon Sensing Systems
CRS03 (extraído de [14]). . . . . . . . . . . . . . . . . . . . . . . . . . . 137
D.3 Características do Honeywell HMR3300 Digital Compass (extraído de [12]).138
D.4 Especificações técnicas para a medida de yaw do Honeywell HMR3300
Digital Compass (extraído de [12]). . . . . . . . . . . . . . . . . . . . . . 139
D.5 Especificações técnicas para a medida de roll e pitch do Honeywell HMR3300
Digital Compass (extraído de [12]). . . . . . . . . . . . . . . . . . . . . . 139
D.6 Especificações técnicas para a medida de campo magnético do Honeywell
HMR3300 Digital Compass (extraído de [12]). . . . . . . . . . . . . . . . 139
xv
Nomenclatura
A notação utilizado nesta tese é bastante comum. Uma lista de convenções, definições, símbolos, e grandezas frequentemente adoptadas são enumeradas em seguida.
Convenções de Notação
• Vectores coluna são representados por minúsculas a negrito, e.g. s.
• Matrizes são representadas por letras maiúsculas a negrito, e.g. S.
• A dimensão das matrizes é omitida sempre que seja óbvia no contexto em que se
insere.
Referenciais
{B}
{C}
{E}
{G}
{I}
{T }
Referencial
Referencial
Referencial
Referencial
Referencial
Referencial
do Corpo (Body).
Geocêntrico.
da Terra (Earth).
Geográfico.
Inercial.
do Plano Tangente.
Conjuntos
M(n, m)
M(n)
R
Rn
Z
conjunto
conjunto
conjunto
conjunto
conjunto
das
das
dos
dos
dos
matrizes reais n × m.
matrizes reais n × n, {M ∈ M(n, n)}.
números reais.
vectores reais de dimensão n.
números inteiros.
Símbolos
Alfabeto Latino
a
a
semi-eixo maior do elipsóide de referência.
aceleração expressa em {E}.
xvii
xviii
b
bs
D
e
f
f
F
g
G
I
G
G
h
H
In
k
K
L
E
m̄
B
mr
ns
N (µ, Ξ)
p
P
Q(λ)
A2
A1 R
R
ŝ
δs
s̃
t
T
T
v
x
z
NOMENCLATURA
semi-eixo menor do elipsóide de referência.
polarização da medida do sensor s, expressa em {B}.
matriz de inserção do ruído de processo na equação de saída.
excentricidade do elipsóide de referência.
achatamento do elipsóide de referência.
medida do acelerómetro (força específica), expressa em {B}.
matriz da dinâmica.
Campo Gravítico Terrestre expresso em {E}.
Constante de Gravitação Universal.
aceleração gravitacional.
matriz de inserção do ruído de processo.
altitude em relação ao elipsóide de referência.
matriz de saída do sistema.
n × n matriz identidade.
vector de norma unitária que define o eixo de rotação na
representação de atitude descrita pelo vector de rotação.
matriz dos ganhos de Kalman.
latitude geográfica.
campo magnético da Terra expresso em {E}.
medida do magnetómetro, expressa em {B}.
ruído de medida ou de processo associado a s.
distribuição Gaussiana com valor esperado µ e covariância Ξ.
posição.
matriz da covariância do erro de estimação do filtro de Kalman.
matriz que transforma o vector velocidade angular de {B} em relação
a {A} expresso em {B} nas derivadas dos ângulos de Euler.
matriz de rotação do referencial {A1 } para o referencial {A2 }.
notação abreviada para E
B R.
estimativa do vector s.
perturbação do vector s, definido como δs = ŝ − s salvo indicação em contrário.
erro de estimação do vector s.
tempo.
período de amostragem.
matriz de transformação de coordenadas.
velocidade.
vector de estado.
vector de observação.
Alfabeto Grego
γe
θ
Θs
λ
λ
gravidade efectiva equatorial.
ângulo de pitch.
matriz da covariância do ruído de observação do vector s.
longitude.
vector dos ângulos de Euler Z-Y-X, i.e. λ = [ψ θ φ].
xix
Ξs
Σ
φ
ϕ
ψ
I
I
ωE
I
ΩE I
ωB
ωr
B
matriz da covariância do ruído de processo do vector s.
matriz da covariância do erro de estimação.
ângulo de roll.
vector de rotação (parametrização de atitude).
ângulo de yaw.
velocidade angular de {E} em relação
a {I}, expressa
em {I}.
forma skew-symmetric de I I ω E , i.e. I ΩE = I I ω E × .
velocidade angular de {B} em relação a {I}, expressa
em {B}.
B I
medida de um giroscópio de velocidade.de
ω B ).
Índices e Expoentes
sij
sk
sr
sx , sy , sz
A
s
ŝk
elemento da matriz S na linha i e coluna j.
vector s no instante de tempo discreto tk , k ∈ Z.
medida do vector s.
componentes segundo os eixos do x, y e z do vector 3 × 1 s.
vector expresso no referencial {A}.
estimativa do vector s.
Funções
S−1
S′
[s×]
E(·)
inverso de S.
transposta de S.

0 −sz sy


matriz do produto externo do vector 3 × 1 s, definido como  sz
0 −sx .
−sy sx
0
valor esperado.
Acrónimos
ADC
ALU
AGV
ASC
ASCII
CAN
CEP
CMT
ESA
EUA
DOP
DMA
Analog-to-Digital Converter.
Arithmetic and Logic Unit.
Automated Guided Vehicle.
Autonomous Surface Craft.
American Standard Code for Information Interchange.
Controller Area Network.
Circular Error Probable.
Campo Magnético Terrestre.
Agência Espacial Europeia.
Estados Unidos da América.
Dilution of Precision.
Direct Memory Access.

xx
DP-SRAM
DSOR
ECEF
EGNOS
GPS
HITL
IMU
INS
ISA
ISR
IST
NASA
NMEA
MEMS
MPS
FLOPS
MSAS
PLD
RAM
RF
RISC
RMS
RS-232
RTCM
SBAS
SEM
SNR
SRAM
TRIAD
UAE
VA
VAA
VMA
VSA
VTA
VTOL
WGS-84
WAAS
NOMENCLATURA
Dual Port Static Random Access Memory.
Dynamical Systems and Ocean Robotics Lab.
Earth Centered, Earth Fixed.
European Geostationary Navigation Overlay System.
Global Positioning System.
Hardware In The Loop.
Inertial Measuring Unit.
Inertial Navigation System.
Inertial Sensor Assembly.
Instituto de Sistemas e Robótica.
Instituto Superior Técnico.
National Aeronautics and Space Administration.
National Marine Electronics Association.
Micro Electro Mechanical Systems.
Magneto-Pendular Sensor.
Floating point Operations Per Second.
Japanese Multi-function Transport System System.
Programmable Logic Device.
Random Access Memory.
Rádio Frequência.
Reduced Instruction Set Computer.
Root Mean Square.
Recommend Standard number 232.
Radio Technical Commission for Maritime Services.
Space Based Augmentation System.
Scanning Electron Microscope.
Signal to Noise Ratio.
Static Random Access Memory.
Tri-Axial Attitude Determination System.
Uniformemente Assimptoticamente Estável.
Veículos Autónomos.
Veículo Aéreo Autónomo.
Veículo Marinho Autónomo.
Veículo Submarino Autónomo.
Veículo Terrestre Autónomo.
Vertical Take-Off and Landing.
World Geodetic System 1984.
Wide Area Augmentation System.
Capítulo 1
Introdução
Os principais impulsionadores do desenvolvimento e estudo dos sistemas de coordenação, comando e controlo de Veículos Autónomos (VA), foram as aplicações civis e
militares. Com o enorme crescimento do número de aplicações, só num passado recente
é que se começou a generalizar um melhor entendimento sobre o impacto desta tecnologia na sociedade do século XXI. O propósito deste capítulo é fornecer uma visão geral
dos vários tipos de VA, as tecnologias envolvidas com o fim de atingir um vasto leque
de objectivos com que uma plataforma móvel deste género pode ser confrontada. São
apresentados também os objectivos e contributos da tese.
1.1
1.1.1
Veículos Autónomos
Características Gerais
Neste trabalho, definem-se Veículos Autónomos como plataformas não tripuladas,
que para além da operação com um determinado grau de autonomia, têm também, por
vezes, a capacidade de serem teleoperados, isto é, pilotados remotamente por um agente
humano ou computorizado. É possível conceber aplicações para VA tripulados onde a
tripulação humana pode ou não desempenhar um papel relevante no comando do veículo,
ou então resumir-se simplesmente a ser a "carga"a ser transportada. No presente, é
seguro afirmar, que o que se pretende com os VA é prescindir da presença e intervenção
directa no comando, evitando as suas limitações inerentes, e dotar os VA com as suas
capacidades cognitivas de percepção e decisão.
Os VA podem assumir uma enorme diversidade de configurações mecânicas que os
tornam potencialmente atractivos e aptos para desempenharem missões em diferentes
ambientes, tais como, em terra, no ar ou na água. Uma missão, pode ser definida como
um conjunto de acções que leva à possibilidade de concretização de um único ou múltiplos
objectivos. Assim, existem veículos terrestres (com locomoção por rodas, pernas, lagartas
ou qualquer combinação dos mesmos), aquáticos (podem ser submarinos, de superfície ou
arrastados), anfíbios (a locomoção pode ser conseguida com propulsores de asa rotativa e
a plataforma flutua numa almofada de ar), aéreos (asa fixa ou rotativa ou veículos menos
densos que o ar).
Por exemplo, os veículos aéreos, podem apresentar-se como um avião, um helicóptero, um dirigível, etc, visto que é essencial a adaptação das vantagens que cada tipo de
1
2
Capítulo 1. Introdução
plataforma apresenta às necessidades da missão. Para um melhor entendimento sobre a
adaptação dos veículos a uma determinada aplicação, numa missão em que se pretenda
vigiar ou monitorizar uma vasta área (vigilância de florestas, de fronteiras, etc), a escolha
mais acertada será optar por um sistema de asa fixa (tipo do avião) cuja velocidade e
alcance são mais apropriados. Para o caso da monitorização de zonas de catástrofe numa
área restrita, tome-se por exemplo a Central Eléctrica Nuclear de Chernobil, na Ucrânia,
aquando da explosão acidental do reactor 4 a 26 de Abril de 1986, onde decorreram missões que se revelaram fatais para as tripulações humanas que tripularam helicópteros de
monitorização de radiação, poderiam ser no presente cumpridas por helicópteros autónomos ou teleoperados. É comum na literatura especializada designar missões destinadas
aos VA como tendo, pelo menos, um de três atributos, conhecidos como os 3D’s -Dull,
Dirty, Dangerous- (Monótono, Sujo, Perigoso) [15]. De facto é possível encontrar mais
adjectivos que caracterizam o tipo de missões a que se destinam os VA, tais como, difícil,
longa duração, etc. Resumindo, a progressão da tecnologia dos VA deve-se ao seguinte
conjunto de factores [16]:
• Hostilidade do ambiente tornando impossível ou extremamente onerosa a presença
segura do operador.
• Competitividade económica relativamente aos sistemas que assentam na participação do operador.
• Requisitos não satisfeitos por sistemas em que determinadas actividades envolvam
o operador ou, ao incluí-lo, a intervenção deste requer o apoio disponibilizado por
funcionalidades de autonomia.
O estudo do grau e da natureza da autonomia (ou mesmo do "nível de inteligência")
destes sistemas sai fora do âmbito deste trabalho, mas é importante acrescentar que estes
veículos podem ter modos de operação bastante distintos, como sejam [15, 16, 17]:
• Pré-programados: A missão é composta por actividades estipuladas à priori ou
dinamicamente no decorrer da mesma, pelo agente humano.
• Supervisionados: Alguma parte da missão é planeada automaticamente, em geral
nas camadas hierárquicas de decisão mais baixas (activação de sensores, manobras
defensivas, etc), ficando o decisor humano responsável pelas decisões de mais alto
nível.
• "Inteligentes": Incorporam sistemas de Software de Autonomia Inteligente que possibilitam a tomada de decisões, escolhendo de entre um conjunto de opções geradas
automaticamente. Faz monitorização e diagnóstico em caso de falhas ao nível do
veículo e ao nível da missão tendo a capacidade de colaboração e negociação com
outros sistemas ou veículos.
1.1.2
Estrutura de um Veículo Autónomo
Os pontos seguintes descrevem, de forma sucinta, os principais subsistemas que
compõem um VA [18, 16].
1.1. Veículos Autónomos
3
Sistema de Suporte, Monitorização e Recuperação de Falhas: controla a
distribuição de energia para os sistemas eléctricos e mecânicos instalados a bordo do
veículo, e monitoriza o consumo energético. Para além da verificação do estado inicial
e a monitorização contínua do estado do veículo, este subsistema tem como objectivo
detectar falhas de hardware e erros de comportamento, e promover a recuperação das falhas correspondentes. Neste contexto, este subsistema determinará comportamentos que
degradem graciosamente a execução da missão ou activará acções reflexivas para evitar
a perda do veículo.
Sistema de Actuação: controla os actuadores para que a velocidade de rotação
destes ou a inclinação adequada das superfícies de deflexão corresponda à referência gerada pelo Sistema de Comando e Controlo.
Sistema de Navegação: é responsável pela determinação da posição e velocidade
lineares e angulares de um corpo relativamente a um referencial, recorrendo para tal a um
conjunto de sensores internos, tais como giroscópio, acelerómetros, profundidade, efeito
Doppler, magnetómetro, etc, ou a fontes de informação externa (posicionamento global
por satélite, sistema de posicionamento acústico do tipo Long Base Line, sonar, etc). As
saídas deste sistema, alimentam o Sistema de Comando e Controlo e são enviadas para o
Sistema de Controlo de Missão.
Sistema de Comando e Controlo: recebe as trajectórias de referência enviadas
pelo Sistema de Controlo de Missão e a informação necessária do Sistema de Navegação.
Produz os comandos que são enviados ao Sistema de Actuação e é responsável pelo seguimento preciso de trajectórias.
Sistema de Comunicações: faz a gestão das comunicações entre o operador e o
veículo ou entre este e outros sistemas ou veículos com os quais alguma forma de cooperação está prevista no decorrer da missão.
Sistema de Carga: efectua a gestão dos dispositivos específicos à classe de missões (sensores e actuadores) sendo os dados decorrentes da sua activação armazenados
para a análise pós-missão ou transmitidos no decorrer da missão. As gamas de sensores
e actuadores poderão ser extremamente variadas. Sonares, temperatura, humidade, oxigénio, pH, turbidez, fluorescência, hidrofones, vídeo-câmaras, câmaras acústicas, lasers,
etc. para os primeiros e iluminação, dispositivo de recolha de amostras, braços, manipuladores e outros dispositivos mecânicos, para os segundos.
Sistema de Interface Homem-Máquina: apoia o operador na sua interacção
com o veículo. Esta poderá consistir num simples acompanhamento da missão por parte
do operador, troca de dados entre este e o veículo, ou então permitir o envio de comandos
pelo operador tendo em vista a alteração da missão.
Sistema de Controlo de Missão: transforma o plano da missão (tipicamente
definido pelo operador numa linguagem de alto nível ou numa aplicação informática
dedicada) num conjunto de comandos para cada um dos subsistemas para que, tendo em
4
conta o estado do veículo e do seu ambiente, sejam executadas as diversas actividades
necessárias para a prossecução dos objectivos da missão de acordo com os requisitos prédefinidos. Em particular, poderá presidir às actividades em cooperação que, sendo viáveis
no decurso da execução da missão, sejam percebidas como vantajosas. Este subsistema
tem pois a seu cargo a interpretação, nos diversos níveis hierárquicos, da informação
recolhida durante a execução da missão e a produção de decisões respeitantes à gestão
da utilização dos recursos de bordo de forma a maximizar o valor das actividades para
cumprimento dos objectivos de acordo com os requisitos especificados.
Nas subsecções seguintes, vão ser apresentadas, com maior detalhe, as características
principais dos veículos autónomos mais comuns podendo os mesmos ser classificados com
base no ambiente onde têm capacidade de operar.
1.1.3
Veículos Marinhos Autónomos
Na classe de Veículos Marinhos Autónomos (VMA) podem ser identificadas duas
grandes sub-classes: Veículos Submarinos Autónomos (VSA) e os Veículos de Superfície
Autónomos que vão passar a ser designados no resto do documento por ASC (Autonomous
Surface Crafts).
O desenvolvimento de Veículos Submarinos teve o seu inicio há muitos anos. De
facto, o primeiro submarino, baptizado de Turtle, foi construído nos Estados Unidos da
América por David Bushnell no ano de 1775 em Saybrook no Connecticut. Era um submarino tripulado, com forma oval, feito em madeira, juntas com tiras de ferro com um
suprimento de ar de cerca de 30 minutos, sendo a emersão e a submersão controladas
com tanques com lastro, os quais podiam ser preenchidos com água ou esvaziados com
ar pressurizado [19]. Só em 1879 surgiu aquilo que muitos consideram ser o primeiro
submarino útil desenvolvido pelo Reverendo George W. Garrett com uma autonomia de
cerca de 10 horas, ao qual se deu o nome de Resurgam. Desde essa época, grandes saltos
tecnológicos foram dados, nomeadamente durante a Primeira e Segunda Grandes Guerras. Neste contexto bélico, surgem os torpedos, que são considerados como os primeiros
sistemas do tipo Veículos Submarinos Autónomos (VSA). O seu desenvolvimento, sem
ser como arma de ataque, teve início na década de sessenta do século XX, quando alguns
veículos foram construídos para aplicações muito específicas. Os sistemas originais eram
extremamente simples devido às limitações tecnológicas da altura, mas muito cedo foi
identificado o seu enorme potencial para servir propósitos militares, científicos e industriais. A Marinha de Guerra dos Estados Unidos da América, desde muito cedo, mostrou
interesse em sistemas para detecção de minas, estudo e exploração estratégica de ambientes submarinos. Durante a década de setenta do século XX, deu-se o inicio do esforço
da comunidade científica com o desenvolvimento de algumas plataformas de teste. Por
exemplo nas áreas da Biologia Marinha, Oceanografia, Geofísica, Geologia, etc, houve
também um enorme interesse em dispositivos que possibilitassem os estudos de ambientes submarinos de forma segura e sistemática. Outro forte impulsionador deste tipo
de tecnologias foi, e continua a ser, a indústria, especificamente a indústria petrolífera e
do gás natural onde desempenham um papel muito importante na prospecção de novos
depósitos, apoio a plataformas de extracção off-shore e inspecção de pipelines.
Como se pode observar na Figura 1.1, os VSA apresentam-se em vários formatos
e dimensões, sendo o mais comum, como já foi mencionado anteriormente, o formato
5
(a) VSA Infante do Instituto de (b) VSA planador Spray
Sistemas e Robótica (ISR) [20] do WHOI [22].
Instituto Superior Técnico (IST)
[21].
do (c) VSA Autosub do National
Oceanography
Centre,
Southampton [23].
(d) VSA tipo torpedo da BlueFin (e) VSA Odyssey IIx do Massa- (f) VSA solar de uma parceria
[24].
chusetts Institute of Technology entre o Autonomous Undersea
[25].
Systems Institute (AUSI) [26] e
a Falmouth Scientific, Inc. [27].
Figura 1.1: Exemplos de Veículos Submarinos Autónomos.
tipo torpedo propulsionado a baterias electroquímicas. Outro formato interessante que
permite missões de longa duração, devido ao tipo de propulsão, é o glider (planador).
A Figura 1.1(b) apresenta um exemplo de um veículo deste género. Este move-se para
cima e para baixo, no oceano, alterando a sua flutuabilidade, literalmente planando na
água, conseguindo propulsão e condução horizontal devido às asas que possuí. Descreve
uma trajectória em "dente de serra" ao longo da qual pode observar múltiplas variáveis
de interesse (temperatura, condutividade, salinidade, etc). Outra solução para missões
de longa duração é o recurso à energia solar, sendo o VSA equipado com painéis foto
voltaicos. O VSA fica obrigado a, no decurso da sua missão, emergir regularmente e
expor os referidos painéis à radiação solar durante um determinado período de tempo.
O esforço de desenvolvimento é repartido entre entidades militares e civis (empresas
privadas e grupos académicos). De entre os grupos académicos que investiram desde início
no desenvolvimento de VSA, destacam-se a University of Hawaii, Stanford University, a
University of California at Santa Barbara, o Massachusetts Institute of Technology (MIT),
o Woods Hole Oceanography Institution (WHOI), o Naval Postgraduate School (NPS), o
Instituto Superior Técnico (IST) entre outras.
Os VSA enfrentam dificuldades especificas ao nível de alguns sistemas que o compõem, nomeadamente no sistema de navegação e comunicações que surgem das restrições
impostas pelo meio onde operam. O meio aquático impossibilita, quase na totalidade, a
propagação de ondas electromagnéticas, o que inviabiliza a utilização dos actuais sistemas
de posicionamento global por satélite, bem como as comunicações por radiofrequência.
6
No campo da navegação, para além dos clássicos sistemas inerciais, recorre-se também
a sistemas de posicionamento baseados em faróis acústicos ou sensores de velocidade do
tipo Doppler. Para resolver os problemas de comunicação sobra somente o canal acústico
que só permite comunicações a curta distância com largura de banda bastante limitada.
Em relação aos veículos de superfície, as suas origens remontam aos anos da Segunda
Guerra Mundial [15] onde plataformas não tripuladas eram teleoperadas para detectar
ou mesmo fazer detonar minas. Apresentam-se em várias formas e dimensões como se
pode observar pela Figura 1.2.
(a) Catamaran DelfimX do Ins- (b) Catamaran Springer da Uni- (c) Embarcação autónoma da
tituto de Sistemas e Robótica versity of Plymouth [28].
Marine Robotic Vessels Interna(ISR) [20] do Instituto Superior
tional [29].
Técnico (IST) [21].
(d) ASC monocasco tipo kayak (e) Catamaran Delfim do Ins- (f) Catamaran Charlie do CNRda Robotic Marine Systems, LLC tituto de Sistemas e Robótica ISSIA em Itália [31].
[30].
(ISR) [20] do Instituto Superior
Técnico (IST) [21].
Figura 1.2: Exemplos de Autonomous Surface Crafts.
Existem configurações baseadas em monocasco, bicasco (tipo catamaran), lanchas,
etc, sendo os sistemas energéticos, para os sistemas a bordo e para a propulsão, baseados em baterias electroquímicas, motores de combustão interna, células de combustível,
células foto voltaicas, etc.
Visto operarem na fronteira entre dois meios, podem executar actividades submersas (por exemplo batimetria acústica do leito de rios) e ainda assim tirar partido das
funcionalidades de comunicações e navegação de que os veículos terrestres e aéreos dispõem. O recurso a um ASC pode também surgir no contexto do auxílio à operação de
um VSA [32], visto que, devido às dificuldades de comunicação referidas anteriormente,
estas plataformas, em certos cenários de operação, podem fornecer um canal acústico
vertical (configuração que favorece significativamente a qualidade do canal de comunicação), tornando-se assim num gateway de comunicação entre o VSA e todos os sistemas
de radiofrequência disponíveis à superfície. Para além dos cenários de cooperação com
7
veículos submersos, um ASC está apto para um vasto leque de aplicações militares e
civis, tais como: vigilância marítima e fluvial (zonas portuárias, rios, etc), plataforma
para sensores (para as ciências como a Oceanografia, Geofísica, Biologia, etc), recolha de
amostras em áreas de catástrofe ambiental (química/radiológica/biológica), entre muitas
outras.
1.1.4
Veículos Aéreos Autónomos
Os Veículos Aéreos Autónomos (VAA) são plataformas com propulsão própria que
se mantêm no ar devido a uma força de sustentação aerodinâmica, podendo apresentar-se
numa vasta variedade de dimensões, geometrias e custos, tendo a capacidade de desempenhar um enorme espectro de missões. Os VAA podem ser de asa fixa, asa rotativa, tal
como os helicópteros, tilt-rotor (consultar Figura 1.3(a)) ou veículos menos densos que
o ar com propulsão baseada em motores de explosão, turbinas a jacto ou eléctricos. A
Figura 1.3 ilustra alguns VAA em desenvolvimento e operação no presente.
(a) VAA tilt-rotor Bell Eagle Eye (b) VAA de asa fixa Predator B (c) VAA de asa fixa Aerosonde
da Bell Helicopter [33].
da General Atomics Aeronautical da Aerosonde Pty, Ltd. [35].
Systems [34].
(d) VAA de asa fixa Global Hawk (e) VAA de asa rotativa RQ-8A (f) VAA de asa rotativa A160
da Northrop Grumman [36].
Fire Scout Northrop Grumman Hummingbird da Boeing [37].
[36].
Figura 1.3: Exemplos de Veículos Aéreos Autónomos.
O interesse militar nestas plataformas conta já com várias décadas de história, tendo
êxitos reconhecidos desde a guerra do Vietname e, de forma mais visível, nas guerras do
Iraque (Operação Tempestade no Deserto), Afeganistão e, novamente, no Iraque, na
Operação Iraqui Freedom. No presente, esta classe de missões envolve um espectro de
sistemas bastante variado, onde se incluem sensores e sistemas de informação, tais como
radar de abertura sintética, sensores electro-ópticos, infra-vermelhos, etc. A maioria
das missões deste género é de longa duração, desempenhadas por veículos de grandes
dimensões com sensores de elevada precisão.
8
A investigação na área dos VAA apresenta um elevado interesse académico, económico e militar fruto do seu alargado espectro de aplicações que se estendem desde
operações em condições adversas (e.g. centrais nucleares) até à exploração aeroespacial.
A investigação, na área dos VAA, decorre em instituições académicas há mais de uma
década, onde se tem feito uso de muitos tipos de plataformas, como por exemplo helicópteros e aviões que são adquiridos a empresas de aeromodelismo ou são projectados e
fabricados pelas próprias instituições. Importantes contribuições foram dadas por, Carnegie Melon University [38, 39], Stanford University [40, 41], University of California at
Berkeley [42], University of Southern California, Massachusetts Institute of Technology
(MIT) ([43, 44] e Georgia Institute of Technology [45, 46]. Grande parte da investigação
foi feita em helicópteros e aviões de aeromodelismo de pequena e média dimensões visando
os campos de investigação de identificação de sistemas, sistemas de controlo, sistemas de
navegação, controlo e cooperação de múltiplos veículos. Algumas dessas plataformas são
apresentadas na Figura 1.4.
(a) VAA de asa fixa do Projecto (b) VAA de asa rotativa Yamaha (c) VAA de asa rotativa do MasDragonFly [47] da Stanford Uni- R-50 [49] da Carnegie Mellon sachusetts Institute of Technoversity [48].
University [50, 51].
logy [52].
(d) VAA de asa rotativa do Pro- (e) VAA de asa rotativa Yamaha (f) Frota de VAA de asa rotativa
jecto AVATAR da University of R-Max [49] do Georgia Institute do Projecto BEAR da University
Southern California [53, 54, 55]. of Technology [56, 57].
of California at Berkeley [58, 59].
Figura 1.4: Exemplos de plataformas aéreas de testes pertencentes a várias instituições
académicas.
Estas plataformas apresentam relevantes vantagens, devido aos seus baixos custos
de teste e operação. Estão também disponíveis no mercado com bastante facilidade e
são portáveis, isto é, são transportáveis por um ou dois indivíduos sem necessidade de
recurso a meios de transporte especiais. Fazem uso de sistemas de energia convencionais,
tais como, baterias electroquímicas, motores de combustão interna ou combinações dos
dois.
Embora neste documento só estejam a ser citadas universidades e instituições dos
Estados Unidos da América (EUA), é importante referir que instituições europeias, de
9
Israel, França, Inglaterra e da Rússia, têm também publicado resultados importantes.
1.1.5
Veículos Terrestres Autónomos
Os Veículos Terrestres Autónomos (VTA) caracterizam-se como sendo plataformas
que se locomovem no solo, em geral, recorrendo a rodas, lagartas, pernas ou combinações
das mesmas, consoante o tipo de geografia onde é suposto operarem. Apresentam-se
como veículos que vão desde grandes carros de combate pesando várias toneladas, como
é o caso do Abrams Panther (massa superior 40 toneladas, [15]), até pequenos veículos
que um ser humano pode transportar, tal como o Dragon Runner [15]. Na Figura 1.5
podem ser observados alguns exemplos deste tipo de sistemas.
(a) Abrams Panther [17, 15].
(b) U. S. Marine Corps Gladiator [17, 15].
(c) Mobile Detection Assessment
Response System - Expeditionary
(MDARS-E) [17].
(d) Dragon Runner [17].
Figura 1.5: Exemplos de Veículos Terrestres Autónomos.
Assim como os VSA e os VAA, surgem como sistemas de grande relevância para fins
militares e civis. Do ponto de vista militar, encontram-se aplicações tais como: detecção
e eliminação de minas, neutralização de munições explosivas, reconhecimento para apoio
de tropas, vigilância e aquisição de alvos, guerra urbana e em regiões litorais, etc. Como
exemplos de aplicações civis, estas plataformas são importantes em: vigilância de fronteiras, agricultura, combate a incêndios, operações em áreas contaminadas e operações de
busca e salvamento. A sua utilização em ambientes não estruturados, gera desafios mais
complexos do que aqueles que se podem encontrar para os veículos marinhos e aéreos,
sendo por isso comum, estes sistemas terem menos autonomia, no que se refere à sua
locomoção, dispondo de funcionalidades de teleoperação.
Uma classe de VTA que desempenha um papel relevante em aplicações civis, são os
veículos que operam em ambientes estruturados, como é o caso de fábricas e armazéns.
Um exemplo nacional de um sistema deste género foi o projecto entre o Instituto Superior
10
Técnico e a EFACEC1 para automatizar transporte de materiais e produtos em curso
de produção entre dois armazéns automáticos. Em 1990, da referida parceria, resultou
o desenvolvimento de veículos guiados automaticamente (Automated Guided Vehicles,
AGV) os quais permitiram, em conjunto com os armazéns automáticos, introduzir na nova
fábrica de Transformadores de Distribuição, um sistema de armazenagem e distribuição
automática de matérias primas e semifabricados. Estes veículos asseguram o transporte
entre os armazéns automáticos e os 120 postos de trabalho e entre eles, sem qualquer
intervenção humana. As estações de carga e descarga são passivas sendo o seguimento
e a comunicação entre os carros e o sistema de gestão feito por fio enterrado 15 mm no
chão da fábrica e a localização dos AGV indicada por etiquetas magnéticas. A Figura 1.6
ilustra dois desses veículos em operação. Outra solução comum neste tipo de sistemas,
Figura 1.6: Transporte automático de materiais entre armazéns da EFACEC e postos de
trabalho (extraído de [1]).
para a definição das trajectórias no ambiente de trabalho, é a utilização de faixas coloridas
pintadas no pavimento que servem de guias ópticas para os veículos. Alguns tipos de VTA
conseguem uma maior flexibilidade de locomoção, visto que dispõem de sensores, como
sonares ou lasers, que lhe fornece a capacidade de sair das trajectórias definidas.
1.1.6
Aplicações
Nesta secção são apresentadas algumas aplicações que se tornaram possíveis com o
aparecimento e avanço da tecnologia, nomeadamente ao nível de integração de sensores,
portabilidade de sistemas computacionais, sistemas de propulsão, algoritmos de navegação e controlo, novos materiais leves e robustos. Estes saltos tecnológicos tornaram
possível, e acessível, a aplicação da tecnologia dos VA em novas áreas onde se apresentam
como soluções de menor risco e custos, relativamente a soluções que fazem uso de veículos
tripulados.
Em tempo de paz, alguns projectos militares encontram aplicações civis bem menos
destrutivas tais como as que se apresentam em seguida.
1
Grupo EFACEC, http://www.efacec.pt/
11
Sistemas Avançados de Resposta a Incêndios
Desenvolvido pela National Aeronautics and Space Administration (NASA) em colaboração com o Departamento de Agricultura dos EUA, pretende aumentar a eficiência
táctica do combate a incêndios florestais de grandes dimensões. Plataformas aéreas com
sensores térmicos por infra-vermelhos vão diminuir significativamente o tempo necessário
a compilar o mapa do incêndio que é de importância primordial no seu combate. Esta
tecnologia permite reduzir os riscos para os seres humanos, para os bens materiais, além
de minimizar os danos aos recursos florestais. Os testes de campo do projecto Unmanned Aerial Vehicle First Response Experiment (UAV FiRE) tiveram lugar no centro de
operações de voo da General Atomics no sul do estado da California.
Um VAA General Atomics ALTUS II apresentado na Figura 1.7 (semelhante ao
apresentado na Figura 1.3(b)) executou várias passagens sobrevoando um incêndio controlado, enviando por telemetria imagens térmicas, via satélite, para um servidor de
comunicações localizado a cerca de 640 km de distância no centro NASA/Ames. As
Figura 1.7: Sistemas avançados de resposta a incêndio (extraído de [2]).
imagens são georreferenciadas e em cerca de 10 minutos estavam disponíveis em todo o
mundo através da World Wide Web [2].
Patrulhamento de Fronteiras
No contexto sócio-económico mundial em que se vive, onde o tráfico de bens materiais e seres humanos é uma realidade, surge a necessidade de um patrulhamento eficiente
de fronteiras. Uma aplicação bastante adequada para um VAA, será por exemplo, a vigilância de pontos vulneráveis na linha de fronteira entre dois países. Alguns projectos
revelaram sucesso em missões deste género. Em particular a empresa Austríaca Schiebel
reportou sucesso em testes de campo, feitos como demonstração para o Ministério do
Interior Austríaco, onde o seu VAA S-100 CAMCOPTER do tipo VTOL (Vertical TakeOff and Landing) completou nove percursos nocturnos de patrulhamento ao longo de um
troço da fronteira que separa a Austria e a Eslováquia, uma missão que habitualmente
é desempenhada por helicópteros tripulados. Na Figura 1.8 ilustra-se graficamente este
conceito.
A voar a cerca de 450 m acima do solo, o S-100 detectou regularmente pontos interessantes utilizando imagens térmicas com origem numa câmara montada numa plataforma
12
Figura 1.8: Patrulhamento de fronteiras (extraído de [3]).
estabilizada. Sendo controlado por operadores humanos, e a percorrer trajectórias préprogramadas, sempre que algum ponto de interesse era detectado, a trajectória podia ser
alterada para sobrevoar e analisar pontos específicos em maior detalhe.
As aplicações civis destes sistemas são virtualmente ilimitadas. A título de exemplo,
podem ser mencionadas aplicações como: monitorização de tráfego rodoviário, mapeamento digital, repetidor de telecomunicações, etc.
Diagnóstico e Inspecção Robotizada de Estruturas Semi-Submersas
O projecto de quebra-mar de taludes é, devido às características destas estruturas,
realizado no pressuposto de que obras de manutenção ou reparação serão necessárias durante a sua vida útil. O custo da estrutura, o seu comportamento esperado, bem como as
consequências da sua degradação na protecção da bacia portuária, justificam a existência
de um programa de acompanhamento da estrutura que permita decidir quando realizar
as obras necessárias de manutenção, ou mesmo de reparação. O processo de tomada de
decisão relativo a estas intervenções, deve apoiar-se no diagnóstico da estrutura, partindo de um conjunto de variáveis descritoras do seu estado. Contudo, ainda não é viável
caracterizar, de forma contínua, o estado de um trecho de um quebra-mar de taludes.
Assim, o procedimento mais usual de acompanhamento destas estruturas é a sua inspecção periódica que, na maioria dos casos, se tem limitado à parte emersa da estrutura,
uma vez que o custo associado à observação da parte submersa é muito elevado. Com
o objectivo de melhorar a caracterização do estado de um quebra-mar de talude, uma
equipa do LNEC (Laboratório Nacional de Engenharia Civil) e do IST cooperou num
projecto intitulado "MEDIRES - Metodologias de Diagnóstico e Inspecção Robotizada
de Estruturas Semi-Submersas"que pretende estabelecer uma metodologia para o diagnóstico de quebra-mares de talude a partir da inspecção periódica, quer da sua parte
emersa, quer da sua parte submersa. Na Figura 1.9 ilustra-se graficamente o conceito
deste projecto. A automatização do processo conseguiu-se fazendo uso de um ASC (do
tipo catamaran) equipado com um sonar (mapeamento da parte submersa) e um laser
(mapeamento da parte emersa) cujas medidas são posteriormente georreferenciadas com
a informação gerada pelo sistema de navegação também instalado a bordo. A geração e
1.2. Objectivos
13
Figura 1.9: Inspecção automática de estruturas semi-submersas.
seguimento de trajectórias é feita autonomamente.
1.2
Objectivos
Biólogos marinhos, oceanógrafos e outros investigadores dos oceanos, estão cada vez
mais dependentes de tecnologia capaz de levar a cabo estudos que sejam apropriados, quer
na escala temporal, quer na escala espacial, para captar os respectivos fenómenos de interesse. Um campo de interesse é a monitorização do estado de conservação de estruturas
semi-submersas, tais como, pontes, quebra-mares, que em geral requerem inspecções de
rotina regulares e que são simultaneamente dispendiosas e complexas. A maioria destas
estruturas estão expostas a condições meteorológicas adversas e a pesadas cargas mecânicas, sendo construídas com o pressuposto de que ao longo na sua vida útil irão ter que
ser sujeitos a obras de manutenção.
Os ASC conferem um elevado grau de fiabilidade operacional na presença de ambientes cuja dinâmica e incerteza representam um desafio em termos de soluções de engenharia. Na aplicação específica de monitorização de estruturas semi-submersas, permitem
o acesso a locais remotos e confinados de uma forma sistemática, tal como é requisito em
aplicações de aquisição de dados de sonar. Para executar a sua missão com sucesso, a
plataforma tem de ter disponível a bordo um sistema de navegação baseado, de preferência, em componentes de baixo custo e consumo energético, capaz de integrar de forma
eficiente a informação com origem nos sensores inerciais e nos sensores auxiliares.
O principal objectivo deste trabalho foi o desenvolvimento e teste de uma sistema
de navegação para obtenção de estimativas de posição e atitude, que recorre a técnicas de
filtragem complementar para fundir informação sensorial com origem em medidas inerciais, medidas do campo magnético terrestre e medidas do sistema de posicionamento
global (GPS). As estimativas vão desempenhar um papel determinante na estabilização
da plataforma e vão ser a base para a implementação de estratégias de controlo fiáveis
para seguimento de trajectórias (trajectory tracking) e seguimento de caminhos (path
14
following). A definição e implementação de uma arquitectura de hardware (sensores,
actuadores, sistemas de energia, comunicações) capaz de transformar a estrutura mecânica de um catamaran, desenvolvida e construída no Laboratório de Sistemas Dinâmicos
e Robótica Oceânica (Dynamical Systems and Ocean Robotics, DSOR) do Instituto de
Sistemas e Robótica (ISR) em Lisboa, num Veículo Marinho Autónomo de Superfície
operacional, foi também, um dos propósitos deste trabalho.
1.3
Contribuições
Contribuições Teóricas: Neste trabalho propõe-se um sistema de navegação baseado na teoria da filtragem complementar para estimação de posição e atitude, com
aplicação a veículos autónomos. Recorrendo a medidas inerciais strapdown, observações
vectoriais e medidas auxiliares de GPS, os filtros complementares propostos fornecem
estimativas de atitude com representação em ângulos de Euler e estimativas de posição
em coordenadas rectangulares definidas para o referencial da Terra enquanto compensam
dinamicamente as polarizações dos giroscópios de velocidade. São demonstradas as propriedades de estabilidade e desempenho dos filtros propostos nas condições de operação
normalmente encontradas nas aplicações de veículos autónomos oceânicos, terrestres e
aéreos de manobras não agressivas. É proposta e enfatizada uma metodologia de afinação dos parâmetros dos filtros baseada em considerações no domínio da frequência.
Contribuições Experimentais Os reduzidos meios computacionais exigidos pelo
sistema de navegação proposto tornam-no adequado para implementação em hardware
de baixo consumo energético recorrendo a sensores de baixo custo, afirmando-se como
uma arquitectura multi-ritmo simples mas eficaz com aplicações a veículos autónomos.
A plataforma onde foi instalada a arquitectura e com a qual foram feitos os testes experimentais dos algoritmos de navegação é um Veículo Marinho Autónomo de superfície
do tipo catamaran, o ASC DELFIMx desenvolvido no ISR-DSOR. São apresentados e
discutidos resultados experimentais obtidos em tempo real durante testes de mar com o
sistema de navegação proposto.
1.4
Organização da Tese
Para além deste primeiro capítulo introdutório, a tese encontra-se dividida da seguinte forma:
• Capítulo 1: Introdução.
• Capítulo 2: define-se a notação adoptada, analisam-se diferentes formas de representação de orientação, os referenciais considerados, juntamente com algumas propriedades importantes associadas. É apresentada uma breve descrição da geometria
e do campo gravítico terrestres.
• Capítulo 3: introduz-se a ciência da navegação terrestre recorrendo ao seu campo
magnético, a sensores inerciais e a sistemas de posicionamento global por satélite.
1.4. Organização da Tese
15
• Capítulo 4: descreve-se a arquitectura proposta pelo autor para desenvolvimento e
teste de um veículo marinho autónomo de superfície.
• Capítulo 5: descreve-se o algoritmo de navegação implementado, baseado em filtragem de Kalman complementar que recorre directamente às medidas dos sensores
disponíveis (acelerómetros, giroscópios, magnetómetro e GPS) combinando duas
medidas da mesma grandeza que apresentam informação em espectros complementares.
• Capítulo 6: apresentam-se e discutem-se, os resultados do sistema de navegação
proposto, obtidos em testes de mar efectuados com o catamaran DELFIMx.
• Capítulo 7: apresentam-se as principais conclusões a retirar do trabalho realizado
e sugerem-se possíveis desenvolvimentos futuros.
Adicionalmente chama-se a atenção do leitor para o Anexo B onde se descrevem as
principais fontes de erro nas leituras obtidas com um magnetómetro triaxial, e sugere-se
uma evolução de um modelo para o erro do magnetómetro, bem como um algoritmo de
calibração que permite aumentar o desempenho do mesmo.
Os Capítulos 2 e 3, servem o propósito de enquadrar a área de conhecimento mais
especifica dos filtros de navegação para fusão sensorial, no contexto dos sistemas de navegação terrestre mais comuns. Devido ao carácter mais descritivo dos referidos capítulos,
alerta-se o leitor mais conhecedor das referidas matérias, para a possibilidade de passar
para o Capítulo 4 e capítulos seguintes, onde é descrita a arquitectura do ASC DELFIMx,
e se apresentam os filtros de navegação, bem como os resultados experimentais.
Capítulo 2
Representação da Orientação e
Referenciais de Navegação
É necessário descrever de uma forma rigorosa a orientação do veículo e os referenciais utilizados . Neste Capítulo apresentam-se algumas alternativas para representar a
orientação dos referenciais, sendo posteriormente definidos os que foram adoptados neste
trabalho. É também apresentada uma breve descrição da geometria e do campo gravítico
terrestres.
2.1
Representação da Orientação
A abordagem que se segue tem em conta o facto desta representação ser necessária
para algoritmos de navegação, focando aspectos como a composição de transformações,
estudo da existência de singularidades e dinâmica de representação.
2.1.1
Matriz de Rotação
A matriz de rotação descreve rotações de vectores e efectua o mapeamento de coordenadas entre referenciais. De acordo com a notação seguida em [60], a transformação
de coordenadas de um vector representado no referencial {B} para o referencial {A} é
escrita como
B
A
p=A
(2.1)
B R p.
A matriz de rotação A
B R pode ser obtida pela projecção, disposta por colunas, dos
vectores ortonormados do referencial {B} segundo os vectores ortonormais do referencial
{A}


hXB , XA i hYB , XA i hZB , XA i


A
(2.2)
hYB , YA i hZB , YA i ,
B R =  hXB , YA i
hXB , ZA i hYB , ZA i hZB , ZA i
onde X, Y, Z são os vectores ortonormais de cada um dos referenciais e h, i representa
o operador produto interno. Dado que o produto interno de dois vectores de norma
unitária é igual ao co-seno do ângulo formado pelos dois vectores, torna-se clara a razão
dos componentes desta matriz serem designados por co-senos directores. Da equação
16
17
2.1. Representação da Orientação
B
(2.1), é directa a relação de A
B R com a transformação inversa A R. Sabe-se da Álgebra
Linear que a inversa de uma matriz com colunas ortonormadas é igual à sua transposta
B
AR
=
−1
A
BR
=
′
A
BR
.
(2.3)
A transformação entre referenciais pode ser obtida através das transformações intermédias simples
A B
A
(2.4)
C R = B RC R,
envolvendo o referencial {B} na rotação entre o referencial {A} e o referencial {C}.
A dinâmica da matriz de rotação pode ser obtida resolvendo o limite
A
dA
R(t + δt) − A
δA R
BR
B R(t)
= lim B = lim B
,
δt−→0 δt
δt−→0
dt
δt
(2.5)
A
onde A
B R(t + δt) e B R(t) são a matriz dos cossenos directores nos instantes de tempo t
e t + δt, respectivamente. A matriz A
B R(t + δt) pode ser escrita como o produto de duas
matrizes
A
A
(2.6)
B R(t + δt) = B R(t)A(t),
onde A(t) é a matriz de rotação que relaciona o referencial {B} no instante t com o
referencial {B} no instante t + δt que, para rotações de pequenos ângulos, pode ser
escrita da forma
A(t) = [I + δΨ],
(2.7)
onde I é uma matriz identidade 3 × 3 e


0
−δψ
0


δΨ =  −δψ
0
−δφ ,
0
−δφ
0
(2.8)
onde δψ, δθ e δφ representam os ângulos infinitesimais segundo os quais, o referencial
{B} rodou durante o intervalo de tempo δt em torno dos seus eixos de yaw, pitch e roll,
respectivamente. No limite, à medida que δt se aproxima de zero, a aproximação da
matriz de rotação para pequenos ângulos, torna-se válida e a ordem das rotações deixa
de ser importante.
Substituindo A
B R(t + δt) na equação (2.5), obtém-se
dA
δΨ
BR
=A
.
B R lim
δt−→0 δt
dt
(2.9)
é a matriz skew-symmetric do vector velocidade angular
No limite, quando δt −→ 0, δΨ
δt
do referencial {B} em relação ao referencial {A} (B A ω B = [p, q, r]′ ), representada no
referencial {B}. Logo
δΨ B A ωB × .
=
(2.10)
lim
δt−→0 δt
Substituindo em (2.9) resulta em
B
dA
BR
=A
BR
dt
A
ωB × ,
(2.11)
18
Capítulo 2. Representação da Orientação e Referenciais de Navegação
onde
B
2.1.2


0 −r q


A
ωB × =  r
0 −p .
−q p
0
(2.12)
Ângulos de Euler
Nesta representação, cada rotação é realizada sequencialmente em torno de um eixo
do referencial {B}, em que a orientação dos eixos é alterada após cada rotação. A este
conjunto de três rotações, é usual atribuir-se a designação de ângulos de Euler. Este tipo
de representação é bastante popular devido ao seu significado físico, visto que, os ângulos
de Euler têm correspondência directa com os ângulos medidos pelos sensores de posição
dos três eixos de uma plataforma de navegação inercial estabilizada (gimballed systems)
sobre a qual vai ser apresentada uma breve descrição no capítulo seguinte.
A transformação de coordenadas de um vector do referencial {A} para o referencial {B} pode ser conseguida através três rotações elementares, podendo as mesmas ser
expressas matematicamente como três matrizes de rotação






1 0
0
cθ 0 −sθ
cψ sψ 0




 A2

A1
cφ sφ , (2.13)
1 0 ; B
A2 R =  0
A R =  −sψ cψ 0 ; A1 R =  0
0 −sφ cφ
sθ 0 cθ
0
0 1
onde s ≡ sin, c ≡ cos. Define-se λ = [ψ, θ, φ]′ para representar a atitude ou orientação
em ângulos de rotação Yaw, Pitch e Roll, os quais correspondem a rotações em torno dos
eixos Z, Y e X, do referencial móvel {B}, respectivamente. Na Figura 2.1 são ilustradas
as três rotações. Uma vez que as três rotações ocorrem segundo os eixos Z-Y-X, esta
Z A1
ZA
Z A1
YA1
Z A2
Z A2
ZB
YA 2
!
YA
YB
YA1
YA 2
"
XA
! Yaw
X A2
X A1
X A1
! Pitch
XB
X A2
! Roll
Figura 2.1: Ângulos de Euler Z-Y-X.
representação denomina-se por Ângulos de Euler Z-Y-X (ou 321). Assim, a transformação
do referencial {A} para {B} pode ser expressa como o produto destas três transformações
B
AR
A2 A1
=B
A2 RA1 RA R.
(2.14)
A transformação de coordenadas de {B} para {A} é dada por
A
BR
A2 A1
A1 A2
′
B
′
A
=B
A R = (A2 RA1 RA R) = A1 RA2 RB R
(2.15)
19


cψ −sψ 0
cθ 0


A
cψ 0  0 1
B R =  sψ
0
0
1
−sθ 0

cψcθ cψsθsφ − sψcφ

A
B R =  sψcθ sψsθsφ + cψcφ
−sψ
cθsφ


sθ
1 0
0


1  0 cφ −sφ 
cθ
0 sφ cφ

cψsθcφ + sψsφ

sψsθcφ − cψsφ .
cθcφ
(2.16)
(2.17)
É possível, através dos valores numéricos de uma matriz de rotação, a extracção do valor
dos ângulos de Euler Z-Y-X. Para tal, define-se uma matriz de rotação genérica


r11 r12 r13


A
(2.18)
B R =  r21 r22 r23 .
r31 r32 r33
Comparando os elementos das matrizes nas equações (2.18) e (2.17), é possível descrever
os ângulos de Euler em função dos elementos da matriz de rotação [61, 10]
p
2
2
θ = arctan2 −r31 , r11 + r21
r11 (2.19)
cθ cθ
r r 32
33
,
φ = arctan2
.
cθ cθ
Dada a existência de uma raiz quadrada para
ocálculo de θ, assumem-se apenas como
π
soluções que respeitam a condição θ ∈ −π
,
. Esta representação apresenta ainda
2 2
π
problemas com singularidades para θ = ± 2 , para as quais se podem escolher as soluções
conforme convenção em [61], i.e.
ψ = arctan2
r
21
,


π
π


θ
=

 θ = −2
2
, ψ=0
ψ=0




φ = arctan2 (r21 , r22 )
φ = − arctan2 (r21 , r22 )
(2.20)
Dada a variação temporal de ângulos de Euler que descrevem a evolução da orientação de um referencial, é possível determinar as componentes do vector de velocidade
angular. Por exemplo, seja a orientação do referencial {B} em relação ao referencial {A}
definida pelos ângulos de Euler e λ̇ = [ψ̇, θ̇, φ̇]′ as suas derivadas temporais. Iniciando no
referencial {A}, fazendo uso de dois referencias intermédios, cujas velocidades angulares
são dadas pelas derivadas dos ângulos de Euler e recorrendo à propriedade aditiva da
velocidade angular, obtém-se [62]
B

  
 


p
φ̇
0
0
   
  B A2 

A
ωB =  q  =  0  + B
A2 R θ̇  + A2 RA1 R 0 .
r
0
0
ψ̇
(2.21)
20
Substituindo as matrizes apresentadas anteriormente
  



  

φ̇
1 0
0
0
1 0
0
cθ 0 sθ
0
p
  


 
  

 q  =  0  +  0 cφ −sφ  θ̇  +  0 cφ −sφ  0 1 0  0 
0
0 sφ cφ
0
0 sφ cφ
−sθ 0 cθ
r
ψ̇




 

ψ̇
p
φ̇ − sθφ̇
−sθ
0 1

 

 

 q  =  cφθ̇ + sφcθψ̇  =  sφcθ cφ 0   θ̇ 
˙ − sφθ̇
φ̇
r
cφcθpsi
cφcθ −sφ 0
{z
}
|

(2.22)




ψ̇
p
 


−1
(2.23)
 q  = Q (λ) θ̇ ,
r
φ̇
onde Q(λ) é a matriz de transformação de B A ω B para λ̇. Resolvendo para λ̇ fica
λ̇ = Q(λ) B A ω B ,
(2.24)
onde
 
 
0 sin φ sec θ cos φ sec θ
p
ψ̇
 

 
cos φ
− sin φ  q .
 θ̇  =  0
φ̇
1 sin φ tan θ cos φ tan θ
r

(2.25)
De notar que as derivadas dos ângulos de Euler estão definidas em referenciais
diferentes. Assim, as componentes de λ̇ não representam as componentes de um vector.
Então, as equações (2.24) e (2.25) não representam transformações de coordenadas e
a matriz Q(λ) não é uma matriz ortogonal. As equações (2.24) e (2.25) apresentam
também singularidades para θ = ±π/2; logo, pode-se afirmar que esta representação não
é adequada para plataformas como, por exemplo, aviões de combate de alto desempenho,
onde é mais comum, para ultrapassar esta dificuldade, fazer-se uso de representações
de atitude, tais como a matriz de rotação ou quaterniões (uma breve descrição sobre
quaterniões vai ser apresentada na Secção 2.1.4). Uma alternativa sugerida em [63] para
contornar a dificuldade causada pela singularidade na dinâmica dos ângulos de Euler
apresenta-se em seguida
ψ̇ = (φ̇ − p) sin θ + (q sin φ + r cos φ) cos θ
θ̇ = q cos φ − r sin φ
φ̇ = p + ψ̇ sin θ
(2.26)
Outro método, para se obter a dinâmica dos ângulos de Euler, consiste em escrever
explicitamente os elementos da matriz de rotação como função dos ângulos de Euler e
desenvolver a dinâmica da matriz de rotação em função da velocidade angular.
Embora não se tenha feito uso das mesmas, em seguida apresentam-se mais algumas
formas de representação de orientação, com o objectivo de evidenciar as suas vantagens
e desvantagens.
21
2.1.3
Vector de Rotação
Como alternativa ao uso de rotações sequenciais, o referencial {B} pode ser obtido
directamente rodando o referencial {A} de um ângulo Λ em torno do eixo k. O vector
de rotação é definido como


kx


A
(2.27)
ϕB = Λ ky ,
kz
onde Λ ∈ [0, π] é o ângulo de rotação e k = [kx , ky , kz ]′ é o vector de norma unitária que
define o eixo de rotação. De [62] tem-se que a matriz de rotação pode ser obtida a partir
do vector de rotação pela expressão
1 − cos Λ A
sin Λ A
ϕB × +
ϕB × A ϕB × ,
(2.28)
2
Λ
Λ
onde [ϕ×] é o operador produto externo definido de forma análoga a (2.12). A expressão,
que define o vector de rotação em função dos elementos da matriz de rotação, pode ser
obtida desenvolvendo a equação (2.28)
r11 + r22 + r33 − 1
Λ = arccos
2
A
A
ϕB
BR
= I3 +
(2.29)

r32 − r23
1


K=
 r13 − r31 .
2 sin(Λ)
r21 − r12

A dinâmica do vector de rotação é apresentada em [64]
A
ϕ̇B =
B
A
1
ω B + A ϕB × B
2
A
ωB
1
+ 2
Λ
Λ sin Λ
1−
2 (1 − cos Λ)
A
ϕB × A ϕB × B
A
ωB
(2.30)
sendo normalmente designada na literatura por Equação de Bortz [65].
O vector de rotação constitui uma notação compacta, com três elementos, mas
que apresenta problemas de representação para rotações muito pequenas devido ao seu
módulo ser directamente proporcional Λ e está também sujeito a singularidades para
Λ = 0 e Λ = π. Para uma descrição mais detalhada recorrer a [62].
2.1.4
Quaterniões
Os habituais números complexos são convenientes como meio para expressar rotações de vectores num espaço bi-dimensional, sendo definidos por dois parâmetros (a1 , a2 ) ∈
R2 e expressos por
z = a1 + ia2 ,
(2.31)
onde i satisfaz i2 = −1. O número complexo z é a combinação linear da base 1 e i.
,
22
Em 1843, Sir William Rowan Hamilton (1805−1865), introduz um novo formalismo
recorrendo a quatro parâmetros, designado por quaterniões que são uma generalização de
um número complexo (q = (q1 , q2 , q3 , q4 ) ∈ R4 ). São constituídos por uma componente
escalar qs , e outra vectorial qv , dada por
q = (qs , qv ) = (q1 , q2 , q3 , q4 ) = q1 + iq2 + jq3 + kq4 ,
(2.32)
onde i, j e k são as componentes da parte vectorial qv = (q2 , q3 , q4 ) e q1 é a parte escalar
qs = q1 . O símbolo ◦ vai ser utilizado para representar o produto de quaterniões. O
produto de dois quaterniões origina um terceiro quaternião, caracterizado pelas seguintes
propriedades
i ◦ i = −1, i ◦ j = k, i ◦ k = −j,
j ◦ j = −1, j ◦ k = i, j ◦ i = −k,
k ◦ k = −1, k ◦ i = j, k ◦ j = −i,
(2.33)
q1 = 0 ⇒ q = 0 − qv = 0 + iq2 + jq3 + kq4 .
(2.34)
q∗ = qs − qv = q1 − iq2 − jq3 − kq4 .
(2.35)
sendo designados por quaterniões puros os que têm parte escalar nula, isto é
O conjugado do quaternião é obtido pelo simétrico da parte vectorial e é dado por
A soma e subtracção de quaterniões é definida como a soma ou subtracção das
componentes correspondentes dos quaterniões, embora o resultado não seja um quaternião
de rotação.
Pelas propriedades apresentadas anteriormente e, pela propriedade distributiva da
multiplicação, defina-se um novo quaternião c = c1 + ic2 + jc3 + kc4 , o produto dos
quaterniões q e c é dado por
q ◦ c = (q1 c1 − q2 c2 − q3 c3 − q4 c4 ) + (q1 c2 + q2 c1 + q3 c4 − q4 c3 )i +
(q1 c3 − q2 c4 + q4 c2 + q3 c1 )j + (q1 c4 + q2 c3 − q3 c2 + q4 c1 )k



c1
q1 −q2 −q3 q4


 q
 2 q1 −q4 q3  c2 
= 


 q3 q4
q1 −q2  c3 



= 

q4 −q3
q2
(2.36)
c4
q1

c1 −c2 −c3 −c4

c2 c1
c4 −c3 


c3 −c4 c1
c2 
c4 c3 −c2 c1
q1
q2
q3
q4



.

(2.37)
De notar que a multiplicação de quaterniões, tal como as outras representações de atitude,
não é comutativa , isto é, q ◦ c 6= c ◦ q, embora seja associativa: d ◦ (q ◦ c) = (d ◦ q) ◦ c.
A norma de um quaternião é dada por
kqk = q ◦ q∗ = q12 + q22 + q32 + q42 .
(2.38)
23
O inverso do quaternião q, designado por q−1 é obtido por
q−1 =
q∗
qv
q∗
qs
− 2
,
=
= 2
2
2
2
2
∗
kqk
q◦q
q1 + q2 + q3 + q4 q1 + q2 + q32 + q42
(2.39)
visto que os quaterniões unitários (que surgem, neste trabalho, como uma alternativa
para representação de rotações) satisfazem a condição kqk = q12 + q22 + q32 + q42 = 1, então
q−1 = q∗ .
(2.40)
De facto, a construção do quaternião unitário surge do Teorema de Euler que afirma
que o movimento genérico de um corpo rígido com um ponto fixo, é equivalente a uma
única rotação em torno de um qualquer eixo que atravesse esse ponto.
O quaternião q pode ser expresso na forma vectorial, tal como
(2.41)
q = q1 + qv ,
sendo esta forma muito útil para se conseguir uma representação compacta das operações
de quaterniões. O produto pode ser reescrito da forma
q ◦ c = q1 c1 − hqv , cv i + q1 cv + c1 qv + qv × cv ,
(2.42)
onde h, i representa a operação produto interno e (×) representa a operação produto
externo.
Tendo como base o quaternião q, podem-se construir as seguintes matrizes
"
#
"
#
′
q1
−q′v
q
−q
1
v
Υq =
e Υ∗q =
,
(2.43)
qv (q1 I3 + [qv ×])
qv (q1 I3 − [qv ×])
que facilita a conclusão de que Υq∗ = Υ′q e Υ∗q∗ = Υ∗q . Recorrendo às matrizes Υq e Υ∗q ,
o produto dos quaterniões pode ser expresso como
′
q ◦ c = Υq c = Υ∗c q,
(2.44)
que são as matrizes escritas nas equações (2.36) e (2.37). Por multiplicação directa, pode
também ser mostrado que Υq e Υ∗c são comutativas, Υq Υ∗c = Υ∗c Υq .
Rotações
Recorrendo à estrutura do quaternião, a transformação de um vector visto no referencial {B} para coordenadas do referencial {A}, é dada por
A
B
A −1
pq = A
B q ◦ pq ◦ B q ,
(2.45)
onde pq = (0, p) representa o quaternião auxiliar com parte vectorial correspondente às
coordenadas do ponto e parte escalar nula, A
B q é o quaternião que descreve a orientação
−1
do referencial {B} em relação ao referencial {A} e A
é o recíproco do quaternião A
Bq
B q.
A composição e a inversa das transformações é dada por
A
Cq =
−1
A
B
=
Bq ◦ C q
A
B
Bq ◦ C q
B −1 A −1
◦ Bq .
Cq
(2.46)
24
A equação (2.45) pode ser escrita recorrendo à equação (2.44)
A
onde
pq = Υq Υ∗q∗ B pq

q1 −q2 −q3 q4
 q
 2 q1 −q4 q3
= 
 q3 q4
q1 −q2
q4 −q3 q2
q1



Υq Υ∗q∗ = 






q1
q2
q3
q4
−q2 q1 −q4 q3
−q3 q4
q1 −q2
−q4 −q3 q2
q1

" #
 0

,

 p
1
0
0
0
2
2
2
2
0 q1 + q2 − q3 − q4
2(q2 q3 − q1 q4 )
2(q1 q3 + q2 q4 )
2
2
2
2
0
2(q2 q3 + q1 q4 )
q1 − q2 + q3 − q4
2(q3 q4 − q1 q2 )
0 2(q2 q4 − q1 q3 )
2(q1 q2 + q3 q4 )
q12 − q22 − q32 + q42
(2.47)



,

(2.48)
ficando a matriz de rotação desejada na matriz 3 × 3 inferior direita. Da análise anterior,
a matriz de rotação que transforma vectores expressos no referencial {B} em vectores
expressos no referencial {A}, pode ser obtida a partir do quaternião A
B q recorrendo à
expressão, definida em [66]


q12 + q22 − q32 − q42
2(q2 q3 − q1 q4 )
2(q1 q3 + q2 q4 )


A
2(q2 q3 + q1 q4 )
q12 − q22 + q32 − q42
2(q3 q4 − q1 q2 ) 
B R(q) = 
2(q2 q4 − q1 q3 )
2(q1 q2 + q3 q4 )
q12 − q22 − q32 + q42
(2.49)
ou de forma mais compacta
A
B R(q)
= q12 − kqv k2 I3 + 2qv qv′ + 2q1 [qv ×] .
(2.50)
Da equação (2.49),obtém-se a expressão do quaternião a partir dos elementos da
matriz de rotação


r23 − r32
1 

qv =
 r31 − r13 
4qs
(2.51)
r12 − r21
√
qs = 12 1 + r11 + r22 + r33 .
De uma rotação em torno de um eixo, obtêm-se as componentes do quaternião
através da expressão definida em [67]


kx


qv = sin Λ2  ky 
(2.52)
kz
qs = cos Λ2 .
onde Λ ∈ [0, π] é o ângulo de rotação e k = [kx , ky , kz ]′ é o vector de norma unitária que
define o eixo de rotação.
25
2.2. Definição dos Referenciais
Dinâmica
De referir a linearidade da equação da dinâmica do quaternião dada por
1
dA
Bq
=
M
dt
2
B
A
ωB
A
(2.53)
B q,
onde A
B q é o quaternião que representa a orientação do referencial {B} em relação ao
referencial {A}, B A ω B = [p, q, r]′ é a velocidade angular do
referencial {B} em relação
B A
ω B é dada por
ao referencial {A}, expressa do referencial {B} e M
M
2.2
B
A
ωB
=
"
B
′
0
−B A ω B
B A A
ωB ×
ωB
#



=

0 −p −q −r
p 0 −r q
q r
0 −p
r −q p
0



.

(2.54)
Definição dos Referenciais
Os sistemas de navegação necessitam de transformações de grandezas medidas e
calculadas entre vários referenciais. O objectivo desta secção prende-se com a definição
desses mesmos referenciais.
2.2.1
Referencial Inercial
Um referencial inercial é um referencial onde são válidas as leis de Newton. É um
referencial não acelerado, mas que pode possuir movimento linear uniforme. A sua origem
é arbitrária e os seus eixos coordenados podem estar direccionados para quaisquer três
direcções mutuamente perpendiculares. Todos os sensores inerciais produzem medidas
relativas a um qualquer referencial inercial, mas descritas ao longo dos eixos sensíveis do
sensor.
É em geral conveniente definir-se um referencial inercial com origem no centro da
Terra (Earth Centered Inertial, ECI) e com o eixo do x a apontar para a vernal equinox,
o eixo do z alinhado com o eixo de rotação da Terra e o eixo do y definido de forma
a completar um sistema de coordenadas segundo a regra da mão direita. No contexto
deste trabalho, o referencial ECI vai ser considerado como um referencial inercial genuíno
representado por {I}.
2.2.2
Referencial da Terra
Este referencial é fixo em relação à Terra e acompanha a sua rotação. No contexto
deste trabalho, vai ser descrito por {E} (Earth). Os seus eixos descrevem um movimento
de rotação em relação ao referencial inercial com frequência
I
ωE ≈
1 + 365.25 ciclo
(365.25)(24) hora
2π rad/ciclo
3600 s/hora
= 7.292115 × 10−5 rad/s,
(2.55)
26
devido aos 365.25 dias de rotação da Terra por ano mais uma revolução completa em torno
do Sol. Em relação ao referencial inercial, a velocidade
angular da Terra (referencial {E})
E I
descrita no referencial {E} é dada por
ω E = [0, 0, 1]′ I ωE . Devido ao seu movimento
de rotação, que é ilustrado na Figura 2.2(a), o referencial {E} não pode ser considerado
como um referencial inercial.
Dois sistemas de coordenadas são comuns no referencial {E}, coordenadas rectangulares (ou cartesianas) e as geodésicas elipsoidais. As coordenadas rectangulares, ilustradas
na Figura 2.2(b), são descritas pelos três parâmetros habituais E [x, y, z], com origem no
centro de massa da Terra e com o eixo do x a estender-se através da intersecção entre o
Meridiano Principal (0 graus de longitude) e o Equador (0 graus de latitude). O eixo do
z estende-se através do Pólo Norte (i.e., é coincidente com o eixo de rotação da Terra).
O eixo do y define-se de forma a completar um sistema de coordenadas segundo a regra
da mão direita, passando através do Equador num ponto com 90 graus de longitude.
(a) Rotação do referencial {E} em rela- (b) Sistema de coordenadas rectangulares do referenção ao {I}.
cial {E}.
Figura 2.2: Relação entre os referenciais {I} e {E}.
As coordenadas geodésicas elipsoidais são expressas nas coordenadas (L, λ, h) tal
como apresentadas nas Figuras 2.3(b) e 2.3(a), onde L representa latitude, λ representa
longitude e h representa a altitude acima do elipsóide de referência. Define-se latitude
como o ângulo entre a normal ao elipsóide no ponto de interesse e o plano do Equador.
A longitude é o ângulo rectilíneo entre o plano do meridiano internacional de referência
e o plano do meridiano do ponto de interesse. A altitude é a distância entre a superfície
do elipsóide e o ponto de interesse, ao longo da normal à superfície do elipsóide.
A necessidade da definição de coordenadas geodésicas prende-se com o facto de o
geóide terrestre ser habitualmente aproximado por um elipsóide de revolução em torno
do seu eixo menor, visto que o elipsóide de revolução é a forma geométrica simples que
melhor se aproxima e ajusta à forma irregular e achatada da terra. Para cada aplicação, é
necessário recorrer a um conjunto consistente de parâmetros que modelem a gravitação e a
forma da Terra (elipsóide). O valor apresentado em (2.55) para I ωE deve ser considerado
apenas como uma aproximação, sendo possível considerar outros modelos mais precisos.
No caso particular do sistema de navegação proposto neste trabalho, o recurso a modelos
27
2.2. Definição dos Referenciais
(a) Secção do elipsóide de revolução.
(b) Coordenadas geodésicas elipsoidais e rectangulares.
Figura 2.3: Elipsóide e sistemas de coordenadas habituais.
mais precisos e complexos não acrescenta nenhum aumento de desempenho, visto que as
perturbações e não idealidades do sistema mascaram as diferenças introduzidas.
2.2.3
Referencial Geográfico
O referencial geográfico é definido localmente, em relação ao geóide da Terra. A
origem do referencial geográfico move-se com o veículo e define-se como a projecção da
origem do veículo no elipsóide de referência. O eixo do z geográfico aponta para o interior
do elipsóide ao longo da sua normal. O eixo do x aponta para o Norte
verdadeiro (i.e., ao
I
longo da projecção do vector de velocidade angular da Terra ω E no plano ortogonal
ao eixo do z). O eixo do y aponta para Este e completa um referencial ortogonal segundo
a regra da mão direita.
Visto que a origem do referencial geográfico viaja com a plataforma, os eixos deste
referencial rodam quando a mesma viaja segundo as direcções Norte ou Este; logo, o
referencial geográfico também não é um referencial inercial.
O referencial geográfico é muito relevante para aplicações relacionadas com navegação, visto que é usual um utilizador necessitar de ter uma solução para a atitude em
relação às direcções Norte, Este e vertical local. Para a posição e velocidade, fornece um
conjunto conveniente de eixos de medida, mas não é utilizado como um referencial. Este
referencial tem uma grande desvantagem para aplicações de navegação perto dos pólos,
visto que, apresenta uma singularidade em cada pólo pois, os eixos Norte e Este não estão
definidos nestes dois locais [68].
2.2.4
Referencial Geocêntrico
O referencial geocêntrico é semelhante ao referencial geográfico. A principal diferença reside no facto de o eixo do z do referencial geocêntrico apontar para o centro da
Terra. O eixo do x aponta para o Norte verdadeiro no plano ortogonal ao eixo do z. O
eixo do y aponta para Este e completa um sistema de coordenadas ortogonal rectangular
segundo a regra da mão direita. Tal como no referencial geográfico, os eixos do referencial
geocêntrico também rodam quando a plataforma se move segundo as direcções Norte e
28
Este, portanto, também não pode ser considerado um referencial inercial.
2.2.5
Referencial do Plano Tangente
É determinado ajustando um plano tangente ao elipsóide de referência num qualquer
ponto de interesse, para medidas locais, da superfície do mesmo. Este ponto torna-se a
origem do referencial local. O eixo do x aponta para o Norte verdadeiro. O eixo do z
aponta para o interior da Terra, perpendicularmente à superfície do elipsóide de referência.
O eixo do y é definido de modo a completar um sistema de coordenadas segundo a regra
da mão direita; logo, aponta para Este, tal como se ilustra na Figura 2.4.
Para um sistema estacionário, localizado na origem do referencial do plano tangente,
os referenciais geográfico e do plano tangente são coincidentes. Quando um sistema
se encontra em movimento, a origem do referencial do plano tangente mantém-se fixa,
enquanto a origem do referencial geográfico é a projecção da origem da plataforma no
elipsóide de referencia da Terra. O referencial do plano tangente é normalmente utilizado
para navegação local (e.g., navegação em relação a uma estrada, aterragem de aviões,
etc).
Figura 2.4: Referencial do plano tangente e sua relação com o referencial {E}.
2.2.6
Referencial do Corpo
O referencial do corpo encontra-se solidário com o veículo e é composto pelos habituais eixos em torno dos quais são medidos os ângulos de yaw, pitch e roll. É usual a
origem deste referencial coincidir com o centro de massa do veículo visto que simplifica a
dedução da cinemática do mesmo, e é também conveniente para a síntese de sistemas de
controlo. De notar que a origem nem sempre coincide com a localização do sistema de
navegação. Como se ilustra na Figura 2.5, o eixo do x (roll ) aponta para a frente, o eixo
do z aponta para baixo (yaw ) e finalmente o eixo do y aponta para o lado direito, tudo
em relação ao veículo.
29
2.3. A Forma da Terra e Modelo da Gravidade
Figura 2.5: Eixos do referencial do corpo.
Tal como indicado na Figura 2.5, o vector de velocidade angular do referencial do
corpo em
referencial inercial expressa no referencial do corpo é designado por
relação ao
B I
′
ω B = [p, q, r] onde p é a velocidade angular em torno do eixo do x, q é a velocidade
angular em torno do eixo do y, e r é a velocidade angular em torno do z. O sentido positivo
de cada velocidade angular é definido segundo a regra da mão direita. O referencial do
corpo também não é um referencial inercial, já que o veículo pode sofrer acelerações ou
velocidade angular não nula.
2.3
2.3.1
A Forma da Terra e Modelo da Gravidade
Campo Gravitacional
Foi Sir Isaac Newton (1642 − 1727) quem primeiro explicou, nos seus Princípios
Matemáticos da Filosofia Natural publicados em 1687, recorrendo à Lei da Gravitação
Universal, que uma massa atrai qualquer outra massa com uma força cuja magnitude é
proporcional ao produto das duas massas e é inversamente proporcional ao quadrado das
distância entre elas. Esta lei explica tanto a queda dos corpos atraídos pela Terra, como
o movimento dos planetas atraídos pelo Sol e vem representada pela fórmula
F12 = −
Gm1 m2
r12 ,
kr12 k3
(2.56)
GMe m
re2
kre2 k3
(2.57)
onde F12 representa a força gravitacional que m1 exerce em m2 . Esta força é também
designada por atracção gravitacional ou de Newton, onde G é a Constante de Gravitação
Universal, m1 e m2 as massas dos dois corpos cuja interacção estamos a analisar e r12 =
r2 − r1 é a posição do centro de massa r2 em relação ao centro de massa de r1 . No
contexto deste trabalho, consideram-se idênticas as massas inerciais e gravitacionais. O
sinal de menos no lado direito de (2.56) indica que direcção da força é simétrica da de
r12 (i.e., m2 é atraído para m1 ).
Em particular, se m1 = Me representar a massa da Terra e fazendo m2 = m, então
a atracção gravitacional da Terra sobre m vem
Fe2 = −
e a atracção gravitacional de m sobre a Terra é
30
F2e = −
GMe m
r2e .
kr2e k3
(2.58)
GMe I
re2 ,
kre2 k3
(2.60)
Recorrendo à Segunda Lei de Newton, as equações (2.57) e (2.57) originam as seguintes equações diferenciais
Gm I
I
r̈e = −
r2e ,
(2.59)
kr2e k3
I
r̈2 = −
então, porque, re2 = r2 − re = −r2e , fica
I
r̈e2 = −
≈
G(Me + m) I
re2
kre2 k3
G(Me ) I
re2
=
−
kre2 k3
(2.61)
I
G,
onde I G é a aceleração gravitacional definida como
I
G=−
G(Me ) I
re2 .
kre2 k3
(2.62)
Este modelo relativamente simples da gravitação é derivado para um campo de força
central. Seria aproximadamente válido para veículos no espaço, mas, para veículos perto
da superfície terrestre são necessários modelos gravitacionais mais detalhados, como o
que é apresentado na Secção 2.3.5.
2.3.2
Campo Gravítico
O vector de gravidade é a soma vectorial da força gravitacional da massa da Terra
e da força centrífuga originada pelo seu movimento de rotação. As dimensões relativas
e a orientação destas duas forças é dependente da localização. Por exemplo, a força
centrifuga é máxima no Equador e nula ao longo do eixo de rotação da Terra. Na
Figura 2.6 apresenta-se a relação entre estas três acelerações, embora a magnitude não
esteja à escala.
Figura 2.6: Vector de gravidade real.
Analiticamente, este somatório de vectores pode ser representado da seguinte forma
31
I
I
g = I G(r) − I ΩE I ΩE r,
I
ω E × é a forma skew-symmetric de
(2.63)
I I
ω E e r é o vector de posição
onde I ΩE =
geocêntrico.
A superfície geodésica da Terra é definida como sendo sempre normal ao vector
da gravidade (i.e., uma superfície equipotencial em relação à força da gravidade). Esta
superfície é diferente da superfície topográfica real terrestre e pode ser imaginada como
a forma média que a Terra teria se a sua superfície fosse totalmente coberta pelas águas
dos oceanos. Na secção seguinte é apresentada, como mais detalhe, a referida superfície,
designada por Geóide terrestre.
2.3.3
O Geóide
Para descrever a forma da Terra pode-se recorrer a dois conceitos distintos: o primeiro está relacionado com a descrição geométrica da superfície física (montanhas, vales,
etc), o segundo prende-se com o estudo das superfícies equipotenciais do campo gravítico
real. Numa primeira aproximação, poder-se-ia afirmar que a Terra é esférica (tal como
vista do espaço). Em segunda aproximação, a Terra é um elipsóide de revolução (achatada nos pólos). O facto de a Terra ter um movimento de rotação, causa um empolamento
equatorial, o que coloca de lado a hipótese da Terra possuir uma superfície esférica. Se
a Terra estivesse completamente coberta pelos oceanos, então, ignorando os ventos e as
correntes internas, a superfície deveria reflectir as forças devidas à rotação e à atracção
gravitacional de corpos externos, como o Sol, a Lua e efeitos surgidos do interior. Quando
os efeitos de maré são removidos, a forma da superfície é devida a variações na densidade
do interior.
Rigorosamente, a superfície física da Terra é definida pelo Geóide, superfície que
coincide, em média, com a superfície livre dos oceanos, descontados os efeitos meteorológicos. Uma ilustração do Geóide terrestre é apresentada na Figura 2.7(a). Referimo-nos
a ela quando falamos de alturas acima do nível do mar. O nível médio do mar é uma
superfície equipotencial. Sendo o Geóide uma superfície equipotencial do Campo Gravítico Real da Terra, a gravidade é-lhe perpendicular em todos os pontos. Estruturas da
crusta, continentes, regiões montanhosas e cristas médias oceânicas, heterogeneidades do
manto influenciam a forma do Geóide.
Designa-se por ondulação do Geóide ao afastamento do Geóide em relação ao elipsóide de referência, segundo a sua normal. A forma do Geóide é, no presente, bastante
conhecida, podendo variar entre os 70 m acima do elipsóide, no Atlântico, e os 100 m
abaixo do Elipsóide, no oceano Índico. As ondulações do Geóide reflectem as irregularidades da crusta, mas principalmente, a variação das densidades das massas da crusta e
do manto (baseado em [69, 70]).
2.3.4
Elipsóide WGS84
O WGS84 (World Geodetic System, estabelecido em 1984) é um referencial global
associado ao sistema de posicionamento GPS. Foi definido pela U.S. Defense Mapping
Agency (actual National Imagery and Mapping Agency, NIMA), este sistema é utilizado
pelo próprio sistema GPS na determinação de efemérides radiodifundidas, nas operações
32
(a) O Geóide terrestre.
(b) Superfícies terrestres de interesse.
Figura 2.7: O Geóide terrestre e outras superfícies de interesse.
dos satélites e no cálculo convencional de coordenadas. O sistema teve como base um
modelo gravitacional da Terra. Assim sendo, o elipsóide associado é um elipsóide geocêntrico equipotencial de revolução, ou seja, está-lhe associado um campo gravítico normal
com uma rotação definida. Os parâmetros do modelo geodésico são determinados recorrendo ao método dos mínimos quadrados baseado em dados experimentais recolhidos
nas observações existentes até 1984 de vários sistemas, nomeadamente, de um sistema
anterior, o sistema TRANSIT1 [71]. Ao longo dos últimos anos, sofreu algumas revisões
do seu elipsóide ao nível do semi-eixo maior, da excentricidade e do seu centro (extraído
de [70]).
O modelo WGS84 é definido especificando quatro constantes, apresentadas na Tabela 2.1 [72]. A excentricidade do elipsóide que aproxima o Geóide é determinada pela
atracção gravitacional e pela velocidade angular da Terra. Assim, como já tinha sido
dado a entender anteriormente, os parâmetros que definem o modelo geodésico necessitam de uma definição consistente para possibilitarem a definição do elipsóide e do modelo
de gravidade.
Parâmetro
Tabela 2.1: Parâmetros do WGS84.
Símbolo Valor
Raio Equatorial
Inverso do achatamento
Velocidade Angular
Constante Gravitacional
a
1/f
I
ωE
GM
6378137.0
298.257223563
7.292115 × 10−5
3.986004418 × 1014
Unidades
[m]
[rad/s]
[m3 /s2 ]
Uma elipse de referência pode ser definida recorrendo a dois parâmetros, sendo
1
TRANSIT, também designado por Navy Navigation Satellite System, foi desenvolvido no inicio da
década de 1960 pelo The Johns Hopkins Applied Research Lab.
33
tipicamente o semi-eixo maior a e qualquer um dos que se apresentam em seguida
semi-eixo menor = b,
excentricidade = e =
achatamento = f =
q
a2 −b2
a2
a−b
,
a
=
p
f (2 − f ),
(2.64)
Baseado nas constantes definidas na Tabela 2.1, os seguintes parâmetros da elipse
podem ser calculados
f = 0.00335281,
b = a(1 − f )
= 6356752.314m,
p
f (2 − f ) = 0.08181919.
e =
(2.65)
Para cada localização especifica, podem ser definidas várias altitudes tal como se
ilustra nas Figuras 2.7(b) e 2.3(a). A altitude do Geóide (ondulação do Geóide) N é
a distância do elipsóide até ao Geóide, ao longo da normal ao elipsóide. A altitude
ortométrica H representa a altitude do veículo acima do Geóide. É, por vezes, designada
por elevação. A altitude elipsoidal pode ser expressa por h = H + N .
2.3.5
Modelo Gravítico da Terra
O vector da gravidade é função da posição visto que, a atracção gravitacional é
função do raio geocêntrico, da dependência da aceleração centrípeta da latitude e do
raio, e porque a distribuição da massa terrestre é não uniforme.
Os parâmetros geodésicos e do modelo gravítico do WGS84 já foram definidos na
Tabela 2.1. No referencial geográfico, o modelo para o vector gravítico local desenvolvido
pela Defense Mapping Agency que é preciso na superfície do elipsóide WGS84 é dado por


 
0
ζg


 
(2.66)
g =  0  +  −ηg  ,
δg
γ(L)
onde L representa a latitude geodésica, γe = 9.7803267715[m/s2 ] é a gravidade efectiva
equatorial e
1 + 0.001931851353 sin2 (L)
γ(L) = γe p
,
1 − 0.0066943800229 sin2 (L)
(2.67)
sendo a forma em γ(L) é apresentada conhecida por Fórmula Gravítica Elipsoidal WGS84.
Na equação (2.66), o vector [ζg , −ηg , δg ] representa perturbações locais no vector de gravidade em relação à normal do elipsóide. Quer g, quer [ζg , −ηg , δg ] são funções da posição,
mas são omitidos com o objectivo de simplificar a notação. Para uma definição detalhada
deste modelo gravítico remete-se o leitor para [72].
Capítulo 3
Fundamentos de Navegação Terrestre
O presente Capítulo apresenta uma descrição de alguns dos métodos e instrumentos
de navegação terrestre mais comuns, entre os quais se destacam, a navegação inercial,
por satélite e a navegação com recurso ao Campo Magnético Terrestre. A primeira
Subsecção pretende fazer uma descrição histórica, apresentando os avanços científicos
mais relevantes, que permitiram ao Homem navegar no planeta Terra.
3.1
Introdução
Os primeiros exploradores ao regressarem das suas viagens, forneciam a quem desejasse percorrer o mesmo percurso, instruções detalhadas sob a forma de mapas onde
desenhavam a sua rota, com realce para marcos ou pontos de referência, que ilustravam
rios, montanhas, zonas perigosas, etc. Para o caso das cartas marítimas, estas deveriam
evidenciar zonas de baixios, zonas de condições meteorológicas habitualmente severas,
ilhas, etc. Estes documentos tornaram-se mais detalhados e passaram a permitir identificar um local no globo terrestre, visto que, foi desenvolvido um sistema de coordenadas
global que se apresenta num mapa como uma grelha de círculos de latitude e longitude.
A navegação em mar aberto, em oposição à navegação junto à costa, onde os marcos geográficos, os faróis luminosos podem existir, cria um conjunto de novos desafios bastante
complexos.
Desde cerca do século XI, que se faz uso do campo magnético terrestre (CMT)
(recorrendo a uma bússola magnética) para obter um rumo, ainda que de forma pouco
precisa. No século XIV, era possível obter o valor da latitude, recorrendo à posição de
estrelas. Durante o século XVIII surgiram instrumentos como o sextante, que permitiram
a localização com bastante precisão de corpos celestes. Para obter a longitude, o processo
não é tão "simples"como o da latitude, já que a posição dos corpos celestes, depende da
posição angular da Terra em relação aos mesmos, isto é, da hora do dia. A longitude é
medida em relação a uma referencia arbitrária, tendo sido escolhida para tal, o meridiano
que passa em Greenwich na Inglaterra. Para o cálculo da longitude, é necessário que os
navegadores tenham conhecimento sobre a hora local e a hora em Greenwich (Greenwich
Mean Time, GMT). A hora local, pode ser obtida por observação do sol, mas a hora
GMT requer a observação da posição lunar relativamente a estrelas [73] o que envolve
cálculos bastante complexos. A solução que se apresentava como a mais razoável era a de
manter um relógio a bordo com a hora GMT, solução essa que originou uma autêntica
34
3.1. Introdução
35
corrida tecnológica para a obtenção de um relógio fiável nos séculos XVI e XVII, para
determinação da longitude com uma precisão de 30 milhas náuticas. Foi Salomon Coster,
um relojoeiro holandês, que em 1675, construiu o primeiro relógio adequado à navegação
maritima desenvolvido pelo cientista Christiaan Huygens, também de origem holandesa.
A barreira das 30 milhas náuticas de erro no cálculo da longitude, ao fim de dois meses
no mar, só foi quebrada na década de 1760, por John Harrison.
Na década de 1900, assistiu-se à substituição da bússola magnética por outro dispositivo denominado por girobússola. Na realidade, a ideia deste dispositivo surgiu cerca
de duas décadas antes, mas os dispositivos construídos não provaram ser viáveis. É um
instrumento que apresenta grandes benefícios para a navegação marítima e é semelhante
a um giroscópio. Pode-se afirmar que é uma bússola que encontra o Norte verdadeiro
recorrendo a um disco alimentado electricamente, que roda a alta velocidade e a forças
de atrito para tirar partido da rotação da Terra. Os direitos à patente foram alvo de uma
acesa disputa entre o alemão Hermann Anschütz-Kämpfe e o norte americano Elmer Ambrose Sperry sendo que, o primeiro saiu vitorioso em 1915. Na Figura 3.1 apresenta-se
um exemplar do referido instrumento. A girobússola apresenta pelo menos duas grandes
vantagens operacionais em relação à bússola convencional: encontra o Norte verdadeiro
(i.e., a direcção do eixo de rotação Terrestre em oposição ao Norte magnético); é muito
menos vulnerável a campos magnéticos externos (e.g. tais como os campos criados pelos
materiais ferromagnéticos, que se podem encontrar nos cascos dos navios).
Figura 3.1: Corte de uma girobússola desenvolvida pelo alemão Hermann AnschützKämpfe.
Nas primeiras décadas do século XX, quando as aeronaves começaram a voar através dos oceanos, começaram por navegar recorrendo à bússola magnética e a indicadores
de velocidade em relação ao ar. Com o aparecimento de sistemas de radar que permitiam
leituras de velocidade em relação ao solo de melhor qualidade (recorrendo ao efeito de
Doppler ), era comum fazer navegação do tipo deduced reckoning (normalmente denominado por "dead"reckoning 1 ). Devido à elevada velocidade a que viaja uma aeronave, não
era prático para um navegador humano estar constantemente a fazer medições de posição,
1
Técnica comum na navegação maritima onde um navio inicia o seu percurso de uma latitude e
longitude conhecidas e viaja numa direcção e velocidade também conhecidas durante um determinado
período de tempo.
36
Capítulo 3. Fundamentos de Navegação Terrestre
então surgiram sistemas de navegação terrestres baseados em faróis de ondas de rádio,
como é o caso dos sistemas LORAN-C (Long Range Navigation) [74] e OMEGA [68].
Para as aeronaves com fins militares ou mísseis intercontinentais, é preferível que não
dependam de faróis de rádio, visto que em tempos de guerra, estes podem ser destruídos
ou corrompidos pelo inimigo. É ainda importante também que sejam "silenciosos"do
ponto de vista electromagnético (não recorrerem a radares para obtenção de medidas de
velocidade por efeito de Doppler ) para que a sua detecção seja mais difícil.
Em suma, pretende-se um sistema de navegação que forneça posição, velocidade
e orientação, que não tenha qualquer dependência de tecnologia externa e que funcione
em todas as condições meteorológicas, no ar, no espaço ou submerso. Os sistemas de
navegação inerciais descritos na secção seguinte, servem este propósito.
3.2
3.2.1
Navegação Inercial
Introdução
O nome Navegação Inercial, tem origem na utilização de princípios inerciais por
determinados tipos de sistemas de navegação. A sua história começa com o inglês Sir
Isaac Newton no século XVII, que introduziu os conceitos de inércia, aceleração e todos
os outros que no presente são denominados por Mecânica Clássica. A história continua
com o físico francês Foucault ao criar um dispositivo por designado como giroscópio
em 1851. O capítulo seguinte foi escrito pelo professor alemão de Mecânica Clássica,
Maximilian Schuler, ao provar matematicamente a possibilidade de eliminar os erros nas
girobússolas, causados pela aceleração lateral. Visto que um sistema de navegação inercial
é um mecanismo bastante complexo, a sua criação foi morosa e faseada, logo, o último
capítulo da sua história não pode ser atribuído a um único individuo ou grupo. Foi na
realidade o resultado do esforço de vários indivíduos e grupos, que trabalhando de forma
mais ou menos independente, e na mesma época (a partir da década de 1940). Embora a
escrita da história possa sempre ter espaço para controvérsia, é geralmente aceite como um
dos nomes mais relevantes, quer por contributos teóricos quer por experimentais, o nome
do norte-americano Dr. Charles S. Draper. Entre a lista de indivíduos com contributos
relevantes, encontram-se os seguintes: Lord Kelvin (inglês), Dr. H. Anschütz-Kämpfe
(alemão), Dr. E. A. Sperry (norte-americano), Capitão J. M. Boykow (austríaco a que é
atribuída a ideia de que um sistema de navegação inercial podia ser construído recorrendo
à dupla integração da aceleração em relação ao tempo) e Dr. S. Reisch (alemão).
Primeiras Aplicações de Sistemas de Navegação Inercial
Os primeiros sistemas de navegação inercial, foram utilizados nos mísseis alemães
V1 e V2 durante a Segunda Guerra Mundial. Depois da guerra, um grupo de cientistas alemães supervisionados por Werner Von Braun, desenvolveram esta tecnologia para
equipar misseis balísticos intercontinentais e naves espaciais. Tal como mencionado anteriormente, outro grupo de cientistas liderados por Charles Draper no Massachusetts
Institute of Technology, conseguiu importantes avanços no desenvolvimento de sistemas
de navegação inerciais, tendo testado com sucesso o seu primeiro sistema num voo em
37
3.2. Navegação Inercial
1949, seguido em 1954 por um sistema de navegação para aplicações no mar, o Navy
Ship’s Inertial Navigation System.
Em 1958 o submarino nuclear Nautilus, conseguiu atravessar com sucesso a calota
de gelo do Pólo Norte, recorrendo ao navegador Autonetics XN6. Na década de 1960, o
programa Apollo da NASA levou os sistemas de navegação inerciais para aplicações no
espaço e no presente estes sistemas encontram-se em aplicações que vão desde munições
"inteligentes" a sistemas de navegação inerciais pessoais, que cabem na palma da mão
[75, 76, 77].
Física da Navegação Inercial
Para um melhor entendimento dos fenómenos físicos por detrás dos sistemas de
navegação, é útil ter presente as Leis de Newton. A 1a Lei de Newton, também conhecida
por Lei da Inercia, afirma que um objecto em repouso, tende a ficar em repouso e que
um objecto em movimento uniforme tende a permanecer em movimento uniforme se a
resultante das forças externas aplicadas for nula. Já a 2a Lei de Newton afirma que num
referencial inercial a aceleração r̈ de uma massa m é proporcional à resultante das forças
aplicadas FI
FI = mr̈.
(3.1)
Dispondo de um sensor que tenha a capacidade de medir a aceleração, seria possível
calcular a variação de velocidade e posição através de sucessivas integrações matemáticas
em relação ao tempo. A aceleração pode ser medida com um dispositivo denominado por
acelerómetro (que, como se vai apresentar mais à frente, mede uma grandeza denominada
por força específica), que em geral, são instalados nos sistemas de navegação inercial em
conjunto de três tendo cada um deles a capacidade de medir acelerações segundo um eixo.
Mecanicamente, são instalados de forma a que os seus eixos sensíveis sejam mutuamente
ortogonais.
Para se conseguir navegar em relação a um referencial inercial, é fundamental conhecer as direcções segundo as quais, os eixos dos acelerómetros estão a fazer medidas de
aceleração. Os sensores que permitem medir os movimentos de rotação de um corpo, são
designados por giroscópios, e permitem obter a orientação dos acelerómetros em todos os
instantes. Assim é possível transformar as medidas de aceleração para o referencial em relação ao qual se está a navegar e posteriormente integrar em relação ao tempo uma e duas
vezes para se obter a velocidade e posição, respectivamente (consultar Figura 3.2(b)). Os
princípios básicos de funcionamento das duas classes habituais de sistemas de navegação
inercial, descritas em maior detalhe na Secção 3.2.3, são ilustrados na Figura 3.2. Estes dois tipos de sensores, os acelerómetros e os giroscópios, devido a fazerem medidas
em relação a referenciais inerciais, são vulgarmente designados por sensores inerciais e
constituem a base de uma Inertial Measuring Unit (IMU).
É comum designar-se por Inertial Sensor Assembly (ISA) a uma montagem rígida
de sensores inerciais para que os mesmos mantenham uma orientação relativa constante.
As configurações habituais contêm três acelerómetros e três giroscópios com montagens
ortogonais. Em suma, uma IMU, é constituída por uma ISA, por toda a electrónica de
suporte, controlo e calibração da mesma, que pode incluir controlo térmico, condicionamento de sinal e interface entrada/saída. Uma IMU pode também incluir um processador.
38
(a) Algoritmo simplificado para sistema de navega- (b) Algoritmo simplificado para sistema de naveção inercial com plataforma estabilizada.
gação inercial com plataforma analítica.
Figura 3.2: Algoritmos de navegação para plataformas inerciais.
Já um Inertial Navigation System (INS) consiste de pelo menos mais um componente, que é normalmente designado por Computador de Navegação onde é calculada a
aceleração da gravidade (não medida pelos acelerómetros) e é feita a dupla integração
numérica em relação ao tempo para se obter a velocidade e posição do veículo onde está
instalado. É normal incluir os sistemas de interface com o utilizador sob a forma de
consolas gráficas para interface com humanos ou interface digital/analógico para ligação
a outros sistemas de comando e controlo do veículo.
Vantagens e Desvantagens dos Sistemas de Navegação Inercial
Quando comparados com outros métodos de navegação, os sistemas inerciais apresentam as seguintes vantagens [78]:
• as indicações de posição e velocidade são instantâneas e contínuas, permitindo a sua
utilização em sistemas caracterizados por dinâmicas com grande largura de banda.
• é completamente autónoma uma vez que se baseia em medidas de aceleração linear
e angular, que são obtidas no interior do próprio veículo. É um sistema que não
radia ondas electromagnéticas e não está sujeito a sabotagem exterior.
• a informação de navegação pode ser obtida para todas as latitudes, incluindo as
regiões polares, independentemente das condições meteorológicas e sem necessidade
de estações terrestres.
• um sistema inercial disponibiliza informação de velocidade e posição em relação a
um referencial terrestre assim como a atitude do veículo em relação ao referencial
terrestre local.
As desvantagens principais associadas a um navegador inercial são [78]:
• a posição e velocidade degradam-se com o tempo, quer o veículo esteja em movimento ou estacionário.
• o equipamento de alto e de muito alto desempenho é extremamente dispendioso
(as classes de alta performance que equipam sistemas como navios e submarinos
militares e algumas naves espaciais podem atingir custos próximos de um milhão
de euros [68])
39
• é necessário alinhar o equipamento antes de cada missão; este processo torna-se
mais difícil para latitudes superiores a 75o e para veículos em movimento.
• a precisão da navegação pode depender das manobras do veículo.
3.2.2
Sensores Inerciais
Esta secção introduz de uma forma mais detalhada, a origem e o funcionamento
dos sensores inerciais, o giroscópio e o acelerómetro.
Giroscópio
Ao trabalhar numa experiência simples para provar o movimento de rotação da
Terra, o físico francês Léon Foucault introduziu em 1852 o termo Giroscópio para designar o instrumento capaz de observar esses movimentos. Para além do seu muito conhecido
pêndulo, as suas pesquisas incidiam sobre giroscópios com suspensão à cardan (designadas na literatura anglo-saxónica por gimbals [79]) apercebendo-se que ao restringir, por
exemplo, o movimento de um dos gimbals leva a indicadores específicos de diferentes componentes de rotação. Contudo, não foi Foucault que deu origem a este principio mecânico,
sendo este tipo de dispositivos, bastante comuns nas escolas da França no século XIX.
De facto, a criação deste instrumento é atribuída ao alemão J.G. Friedrich Bohnenberger
em 1817, sendo o mesmo professor de matemática, astronomia e física na Universidade
de Tübingen na Alemanha. O instrumento, designado por Máquina de Bohnenberger é
apresentado na Figura 3.3(a).
Um giroscópio mecânico convencional de três eixos, cujos componentes principais
se apresentam na Figura 3.3(b), consiste de um rotor (volante ou toro) perfeitamente
balanceado, livre para girar em torno de três eixos perpendiculares entre si, que se interceptam no seu centro de gravidade. Pode-se então dizer, que o giroscópio tem três graus
de liberdade.
Um efeito da Lei da Conservação do Momento Angular é a resistência à alteração
da orientação do seu eixo de rotação do rotor. Assim, quando o giroscópio mecânico é
sujeito a rotações, o rotor vai manter uma orientação constante em relação a um espaço
inercial e os ângulos entre gimbals adjacentes vão alterar-se. Para medir a orientação
da plataforma em movimento, podem ser colocados sensores de posição angular entre os
gimbals adjacentes. De notar que o dispositivo descrito só determina a posição angular
relativa, necessitando de ser inicialmente alinhada com um referencial conhecido
Contrastando com os giroscópios mecânicos clássicos, a quase totalidade do giroscópios actuais (MEMS, ópticos), são na realidade giroscópios de velocidade (rate-gyros).
Uma das grandes desvantagens dos giroscópios mecânicos clássicos reside no facto dos
mesmos terem muitas partes móveis de maquinação precisa, que não só aumentam a
complexidade do sistema, mas também evidenciam uma degradação no desempenho devido ao desgaste causado pela fricção.
A capacidade de manufacturar instrumentos giroscópios de precisão, que estão suficientemente livres de fenómenos de deriva imprevisíveis, constitui o factor limitante do
desempenho da tecnologia dos sistemas de navegação inerciais. De facto, a deriva de um
giroscópio é a principal preocupação aquando do seu desenvolvimento, e esta é causada
40
(a) Máquina de Bohnenberger.
(b) Giroscópio mecânico de três eixos (extraído de
[80]).
Figura 3.3: Máquina de Bohnenberger e giroscópio mecânico (extraído de [4]).
por binários de precessão, que não pertencem aos sistemas de realimentação que mecanizam o seu funcionamento. De entre os motivos que provocam perda de desempenho
num giroscópio, podem enumerar-se os seguintes: desequilíbrio de massas no rotor; gradientes termodinâmicos; desequilíbrio na flutuabilidade. A tecnologia actual recorre às
seguintes técnicas para melhorar o desempenho de um giroscópio mecânico: componentes
a flutuar num fluido que diminui a fricção e amortece vibrações; tolerâncias muito reduzidas na manufactura de peças; coeficientes de expansão térmica adequados; controlo de
temperatura.
Em seguida, apresenta-se um outro sensor essencial aos sistemas de navegação inercial, o acelerómetro.
Acelerómetro
Um acelerómetro fornece uma medida da diferença entre a aceleração em relação a
um referencial inercial e a atracção gravitacional que actua no local onde se encontra o
sistema de navegação. Um acelerómetro ideal é geralmente constituído por uma massa
de prova confinada num espaço fechado que é livre de se mover em relação à estrutura do
acelerómetro ao longo do seu eixo sensível, somente restrita por uma mola e por atrito.
Para uma descrição mais detalhada sobre a tecnologia envolvida no desenvolvimento de
acelerómetros reais, remete-se o leitor para bibliografia especializada, tal como [81, 77, 10].
Considere-se um acelerómetro construído através de um sistema clássico massamola-atrito, tal como o que é ilustrado na Figura 3.4. O vector de posição da massa m
é p. A posição da caixa do acelerómetro é pc . A posição relativa da caixa em relação
à massa é dada por δpc = p − pc . Para a seguinte análise, assume-se que δpc pode ser
medido de forma rigorosa, sendo a posição de equilíbrio da massa m dada por δpc = 0.
Na discussão que se segue, faz-se a distinção entre forças inerciais (i.e., aplicadas
41
!
"
Figura 3.4: Modelo simplificado de um acelerómetro.
fisicamente) e forças cinemáticas (e.g., gravidade). Na Figura 3.4, FI representa a força
fisicamente aplicada à caixa do acelerómetro.
Pelas leis de Newton, num referencial inercial (i.e., o referencial não é acelerado, não
roda e não tem campo gravitacional), a equação da dinâmica para a aceleração inercial
da massa m é dada por
k
b
p̈ = − δpc − δ ṗc ,
(3.2)
m
m
onde k é a constante de elasticidade da mola e b é a constante de amortecimento viscoso.
k
δpc , então, a equação (3.2) pode ser
Definindo a leitura do acelerómetro como f = − m
reescrita como
αḟ = −f + p̈,
(3.3)
f (t) = p̈(t).
(3.4)
onde o parâmetro α = kb é a constante de tempo do sensor que determina a largura de
banda do mesmo. Quando a largura de banda do sinal de aceleração p̈(t) é inferior à
largura de banda do sensor, então αḟ (t) é muito pequeno e o sensor mantém a condição
De notar que f é uma força específica com unidades de aceleração.
Na presença de um campo gravitacional, a dinâmica do acelerómetro é dada por
k
b
δpc − δ ṗc + G,
(3.5)
m
m
onde G representa a aceleração gravitacional dependente da posição. Pode ser mostrado
por manipulações semelhantes às apresentadas anteriormente que
p̈ = −
αḟ = −f + p̈ − G(p).
(3.6)
f = p̈ − G(p).
(3.7)
Quando o sinal de aceleração p̈(t) apresenta variações que se encontram dentro da largura
de banda do sensor, a leitura designada por força específica f é
A equação (3.7) representa a equação de saída do acelerómetro (desprezando os
efeitos de largura de banda). A equação não assume nada em relação às trajectórias
42
descritas pelo acelerómetro, mas evidencia que a aceleração gravitacional depende da
localização.
A discussão anterior afirma que um acelerómetro mede a força específica ou a aceleração relativa entre a caixa e a massa m. Este dispositivo não detecta acelerações que afectam a caixa e a massa m de igual forma. Para uma melhor compreensão, considerem-se
os seguintes casos:
• Um acelerómetro sem rotação e sem forças aplicadas fisicamente encontra-se em
queda livre com p̈ = G; então, a leitura do acelerómetro será f = 0.
• Um acelerómetro, numa órbita estável em torno da Terra, está também em queda
livre. Está em aceleração constante em direcção à Terra com valor p̈ = G, então, a
leitura do acelerómetro será f = 0.
• Considere-se um acelerómetro em repouso na superfície da Terra. Neste caso, o
acelerómetro está sujeito ao campo gravitacional da Terra e é forçado a rodar em
torno da Terra a uma velocidade angular I ωE . Definindo a origem do referencial
inercial como sendo coincidente
com
o centro de massa da Terra, vem que p̈ =
I
ΩE I ΩE p onde I ΩE = I I ω E × ; então, a leitura do acelerómetro será
f = I ΩE I ΩE p − G(p)
(3.8)
que é a força inercial aplicada pela estrutura de suporte à caixa do acelerómetro
para a manter estacionária em relação à Terra.
3.2.3
Tipos de Plataformas
Existem muitos tipos de sistemas de navegação inercial com diferentes graus de
desempenho mas em geral podem ser classificados como pertencendo a duas classes,
diferenciadas pela forma como os sensores são instalados no veículo.
Sistemas com Plataformas Estabilizadas -Gimballed Systems
Um gimbal é uma estrutura rígida com rolamentos que permitem o isolamento da
referida estrutura interior de rotações externas em torno do eixo dos rolamentos. Se a
estrutura interna fosse perfeitamente equilibrada e os rolamentos ideais (sem qualquer
força de atrito), a sua própria inércia de rotação seria suficiente para a isolar de rotações
da estrutura externa. Como é habitual, este não é o caso que se verifica na prática.
A solução passa por instalar um giroscópio na estrutura central para assim, ser
possível detectar binários com origem no atrito dos rolamentos ou no desequilíbrio da
estrutura interna. Estas perturbações são utilizadas para alimentar uma malha de retroacção que anula as rotações da estrutura em torno de cada eixo com rolamentos.
Veículos marinhos de superfície, veículos terrestres, aeronaves de baixo desempenho
e outros cuja gama de operação não implique manobras com ângulos de pitch e roll de
valores elevados, são adequados para um sistema de navegação inercial de plataforma
estabilizada com três gimbals (número mínimo para isolar de um sistema com rotações
segundo três eixos — yaw, pitch e roll ). Para o caso de uma aeronave de alto desempenho,
43
com liberdade total de manobra, são necessários quatro gimbals para evitar uma situação não desejada designada por gimbal lock que, em termos simples, tira à plataforma
estabilizada, a capacidade de isolamento de rotações externas [77, 74].
Em seguida, sumarizam-se as principais vantagens e desvantagens dos sistemas de
navegação baseados em plataformas estabilizadas [77]:
Vantagens
• Giroscópios mais simples. Devido aos pequenos ângulos de rotação que a plataforma
estabilizada de sensores tem de efectuar para se manter nivelada, os giroscópios
necessitam de um pequeno intervalo de medida dinâmico, visto que, para se ter
um giroscópio de 0.01 deg/h só é necessário uma velocidade angular máxima de 3
deg/s.
• Elevada precisão. O facto de os eixos de medida dos acelerómetros estarem sempre
bem definidos, torna possível que os sistema gimballed sejam muito precisos. Os
eixos sensíveis segundo Norte e Este medem somente a aceleração do veículo, ao
contrário do acelerómetro vertical que mede a aceleração do veículo na presença da
gravidade (1 g). É comum compensarem-se alguns erros que possam surgir, com
um altímetro barométrico.
• Alinhamento automático com auxílio de girobússola.
• Calibração de sensores através de rotações da plataforma.
Desvantagens
• Complexidade e Custo. A estrutura da plataforma estabilizada é constituída por
inúmeras partes móveis que têm de apresentar rigidez estrutural para que os eixos
sensíveis dos acelerómetros estejam sempre bem definidos. Os rolamentos que permitem movimentos entre as várias peças, têm de ter o mínimo de atrito possível.
Em suma, trata-se de uma estrutura bastante complexa que requer fabricação de
alta precisão, o que leva a custos elevados.
• Incompatibilidade magnética. Os accionadores e sensores necessários à estabilização
da plataforma, podem ser fontes de ruído electromagnético que pode corromper
outros sensores.
• Fiabilidade. As interfaces mecânicas entre as várias partes móveis como os rolamentos e os slip-rings sofrem bastante desgaste o que provoca uma diminuição no
desempenho.
Sistemas Analíticos -Strapdown Systems
Um sistema de navegação do tipo strapdown, faz uso de uma IMU que não está isolada das rotações do veículo onde foi instalada. Os gimbals são substituídos por software
que faz uso das medidas dos giroscópios para calcular a orientação dos acelerómetros
em relação ao referencial ao qual estes fazem as suas medidas executando em seguida
integrações numéricas em relação ao tempo para obter a velocidade e a posição. Devido
44
aos ambientes com altas vibrações e choques mecânicos onde é comum serem instalados,
necessitam que a sua instalação seja feita sobre amortecedores. O mesmo pode acontecer
aos sistemas gimballed.
Mais uma vez, sumarizam-se as principais vantagens e desvantagens dos sistemas
de navegação do tipo strapdown [77]:
Vantagens
• Estrutura Simples, baixo custo. Os sistemas strapdown são mais leves, mais simples, mais baratos e mais fáceis de integrar em sistemas compactos. Só necessitam
que os sensores sejam montados numa direcção conhecida (normalmente de forma
ortogonal entre si).
• Robustez Mecânica. A estrutura mais simples, torna estes sistemas mais robustos
aos choques e vibrações mecânicas.
• Fiabilidade. Não necessita de partes mecânicas (não tem rolamentos nem slip-rings)
e a electrónica que substitui estes dispositivos mecânicos é bastante mais fiável.
Desvantagens
• Alinhamento. Os sistemas strapdown são de alinhamento difícil já que não tem
partes móveis.
• Calibração de Sensores. A imobilidade dos sensores significa que não podem ser
calibrados dentro do sistema. Então, têm que ser estáveis, o que representa um
fardo para a fase de desenvolvimento. A compensação tem de ser feita em temporeal com base em modelos para eliminar erros inerciais e térmicos.
• Erros dos Acelerómetros. Os erros de polarização acumulam-se rapidamente e os
eixos sensíveis são expostos a componentes do vector gravítico, o que origina uma
redução na precisão das medidas e aumenta os erros entre eixos.
• Capacidade Computacional. Todos os cálculos que, nos sistemas com plataforma estabilizada, são resolvidos mecanicamente, nos sistemas strapdown têm de ser efectuados por computadores em tempo-real em períodos relativamente curtos (é comum
ser inferior a 0.01 s). Esta limitação era significativamente mais forte no passado,
quando os computadores eram volumosos, pesados e consumiam muita energia. No
presente, os sistemas computacionais disponíveis para a resolução de um algoritmo
de navegação strapdown consomem pouca energia e são incomparavelmente mais
compactos que os que existiam há duas ou três décadas.
3.3
3.3.1
Navegação por Satélite
Introdução
Navegação por satélite é o método que tira partido de uma constelação de satélites
de navegação posicionados na órbita terrestre para determinar com precisão a posição e
a hora em qualquer local na Terra.
3.3. Navegação por Satélite
45
Até à data da escrita deste trabalho, existem três sistemas de navegação por satélite globais em operação ou em desenvolvimento. Uma breve descrição dos mesmos é
apresentada nas secções seguintes.
3.3.2
Global Positioning System
O sistema GPS foi inicialmente concebido pelo Departamento de Defesa (Department of Defense, DoD) dos EUA para o apoio à navegação. É extensamente utilizado quer
para fins militares, quer para fins civis, onde nos últimos anos tem encontrado inúmeras
aplicações que abrangem o cidadão comum, não estando só ao serviço da comunidade
científica. O sistema de GPS operacional pressupõe uma rede de 24 ou mais satélites (28
em Março de 2000 [82]) activos que se encontram de forma aproximadamente uniforme
em seis órbitas circulares cada uma com cerca de quatro ou mais satélites. As órbitas não
geoestacionárias com um raio de aproximadamente 26560 km estão inclinadas de cerca de
55o em relação ao Equador encontram-se separadas umas das outras de múltiplos de 60o
com um período orbital de cerca de 11, 967 horas. Em teoria, três ou mais satélites estão
24 horas por dia disponíveis para determinar a posição de um receptor. A Figura 3.5
contém uma ilustração deste sistema.
Figura 3.5: Constelação de satélites do GPS.
Cada satélite emite um sinal, em duas frequências, contendo informação sobre a
sua posição e instante temporal do envio do sinal. O receptor captura o sinal de cada
satélite que permite determinar a distância ao satélite. As coordenadas de um receptor
de GPS são determinadas por trilateracção, no plano ou no espaço, em função do número
de satélites a que se tem acesso, dependendo da localização espaço-temporal do receptor.
Se quatro destas distâncias podem ser medidas, então é possível calcular a localização
tridimensional do receptor em relação aos satélites e, sendo a posição dos satélites conhecida, então pode-se determinar a posição absoluta. A disponibilidade do sistema significa
que, actualmente, qualquer pessoa pode determinar a sua localização na superfície da
terra, ou mesmo, navegar.
46
3.3.3
GLONASS
Uma segunda configuração para um sistema de posicionamento global por satélite
é o Global Orbiting Navigation Satellite System (GLONASS), colocado em órbita pela
antiga União Soviética e actualmente mantido pela República Russa [74]. O sistema
GLONASS também recorre a uma rede de 24 satélites mas, neste caso, estão distribuídos
de forma uniforme em três planos orbitais (ao contrário dos seis planos do sistema GPS)
cada um com oito satélites (quatro no GPS). Cada plano orbital tem uma inclinação
nominal de 64.8o em relação ao Equador encontrando-se os três planos orbitais separados
por múltiplos de 120o . Os satélites descrevem órbitas com raio inferior às dos satélites
de GPS, sendo neste caso de 25510 km com um período de rotação de 8/17 de um dia
sideral. Cada satélite dos sistemas GLONASS e GPS descrevem respectivamente 17 e 16
rotações completas em torno da Terra a cada oito dias.
No que diz respeito aos sinais que são enviados para os satélites , este sistema recorre
a um método de multiplexagem por divisão na frequência para transmissão de informação
de cada satélite. As duas portadoras L1 e L2, têm frequências f1 = (1.602 + 9k/16) GHz
e f2 = (1.246 + 7k/16) GHz, onde k = 0, 1, 2, . . . , 23 representa o número do satélite.
3.3.4
Galileo
O sistema Galileo é o terceiro sistema de navegação global baseado numa constelação de satélites que está no presente (2008) a ser desenvolvido. As suas especificações,
tais como a alocação de frequências e definição de sinais a transmitir, estão a ser projectadas pela entidade European Commission’s Galileo Signal Task Force (STF), que foi
constituída pela Comissão Europeia em Março de 2001. Esta entidade é composta por especialistas nomeados pela União Europeia, investigadores da Agência Espacial Europeia
(ESA) e representantes das autoridades de alocação de frequências de cada país.
O segmento do espaço do sistema Galileo será constituído por uma constelação
de 30 satélites de Medium Earth Orbit, 3 dos quais são de reserva. Cada satélite irá
transmitir sinais de tempo precisos, efemérides e outros dados. Os satélites vão descrever
órbitas com uma altitude de 23222 km, com uma inclinação orbital de 56o em três planos
orbitais. Cada plano orbital contém 9 satélites igualmente espaçados, mais um de reserva
que também se encontra a transmitir informação [83].
Quando estiver operacional, é suposto fornecer um conjunto de funcionalidades e
serviços que vão para além do posicionamento global como é caso do Search and Rescue (SAR) que representa uma contribuição da Europa para o esforço international de
sistemas de Procura e Salvamento de alcance global. Vai tornar possível a recepção de
mensagens de socorro quase em tempo-real (o tempo médio de recepção actual é de cerca
de uma hora) com origem em qualquer ponto do globo terrestre, com localização precisa
dos alertas (erro máximo de poucos metros).
A determinação da posição dos beacons em apuros é conseguido pelo COSPASSARSAT [84] através dos sinais e dados fornecidos pelo SAR/Galileo. A precisão na
determinação da posição será de cerca de 5 km para os actuais beacons e menos de 10
metros para os beacons avançados equipados com receptores Galileo. As comunicações,
desde os beacons até às estações terrestres de salvamento e procura, devem permitir
detecções e localizações de emissões em apuros em menos de 10 minutos.
3.4. Campo Magnético Terrestre
3.4
3.4.1
47
Campo Magnético Terrestre
Magnetómetro
Recorre-se a um magnetómetro para determinação da direcção do campo magnético
terrestre. Os compassos magnéticos ou bússolas são facilmente afectados por perturbações
do meio envolvente que surgem com campos magnéticos de outros dispositivos e com a
proximidade de materiais de permeabilidade diversa.
Características do Campo Magnético Terrestre
O planeta Terra pode ser considerado como um íman gigante que se encontra envolvido por linhas de fluxo magnético que ligam dois pólos magnéticos. Estes pólos
magnéticos estão perto, embora não coincidentes, com os pólos geográficos da Terra.
Como se ilustra na Figura 3.6, as linhas de força do campo magnético da Terra,
penetram a superfície terrestre com diferentes ângulos com a horizontal local. Este ângulo
com a horizontal, é designado por ângulo de inclinação (dip angle). Este ângulo aumenta
em valor absoluto de 0o , desde o equador magnético, até 90o nos pólos magnéticos.
Figura 3.6: Ilustração da não sobreposição entre os pólos magnéticos e os pólos geográficos
terrestres (extraído de [5]).
Devido à não correspondência entre os pólos magnéticos2 e os pólos geográficos,
qualquer dispositivo magnético (bússola, magnetómetro ou outro) não calibrado, não
vai indicar o Norte geográfico, mas sim o Norte magnético. A diferença angular entre
o meridiano verdadeiro (círculo que une os pólos geográficos) e o meridiano magnético
(tem a direcção das linhas de fluxo do campo magnético) é designada por declinação.
Esta declinação, ilustrada na Figura 3.7, tem valores diferentes, em locais diferentes na
superfície da Terra.
2
O pólo Norte geomagnético está localizado no antárctico Canadiano com coordenadas 82o N de
latitude e 248o E de longitude. O pólo Sul geomagnético está aproximadamente localizado na coordenadas
65o Sul de Latitude e 138o E de Longitude. De notar que os pólos geomagnéticos não são anti-odais,
sendo uma assimetria que também mede a complexidade do campo magnético terrestre.
48
Figura 3.7: Mapa mundial da declinação magnética (extraído de [6]).
É usual definir o campo magnético terrestre num determinado ponto da superfície
terrestre em relação ao referencial geográfico recorrendo a dois ângulos: declinação, o ângulo entre a componente horizontal do campo magnético em relação ao Norte verdadeiro,
e inclinação, o ângulo entre o vector campo magnético terrestre e o plano horizontal (ilustrado na Figura 3.8). A intensidade, que é independente da orientação do referencial, é
Figura 3.8: Descrição do campo magnético terrestre num ponto da sua superfície.
representada como a intensidade do vector campo magnético terrestre.
49
Utilização de um Magnetómetro para Navegação
A utilização do campo magnético terrestre, para obter informação sobre o seu rumo
(yaw ou heading), constitui uma prática secular. É legitimo afirmar que a maioria, senão
totalidade dos veículos navais, aeronáuticos e alguns terrestres, utiliza de alguma forma
o campo magnético terrestre para o cálculo do rumo da plataforma.
Os dispositivos de medição de campos magnéticos utilizados na actualidade (como
por exemplo um magnetómetro) surgem em geral sob a forma de sensores de 2 ou 3
eixos ortogonais entre si, possibilitando medir componentes do vector campo magnético
terrestre. São necessárias as componentes horizontais do referido campo para se conseguir
obter uma medida de heading em relação ao Norte magnético.
Se o veículo, ao qual o magnetómetro está solidário, tiver ângulos de roll ou de pitch
diferentes de zero, os eixos horizontais vão sentir as componentes verticais do campo. Por
este motivo, um magnetómetro de somente dois eixos, nas referidas condições, não tem
a capacidade de determinar o ângulo de yaw. Um sensor com três eixos pode determinar
a orientação dos seus eixos somente se a magnitude do campo magnético for conhecida
ou se assumir um valor para a mesma. Somente quando se dispõe de um inclinómetro, é
que se torna possível a determinação da atitude triaxial.
Um magnetómetro biaxial, em que os seus dois eixos ortogonais se encontram no
plano horizontal (designados de forma simplificada por Xh e Yh ), sob o efeito do campo
magnético terrestre sem perturbações, origina as leituras apresentadas na Figura 3.9,
quando rodado de 360o , no plano horizontal.
Leitura do eixo do x e do y do magnetómetro sem perturbaçoes em função de ψ
Leitura do eixo do x do magnetometro em funçao do eixo do y sem perturbaçoes
real
100
Leitura do eixo x do mag.
Leitura do eixo y do mag.
100
Xh [% do valor absoluto da componente horizontal do CMT]
[% do valor absoluto da componente horizontal do CMT]
80
60
40
20
0
−20
−40
−60
−80
80
60
40
20
0
−20
−40
−60
−80
−100
−100
−pi
−3pi/4
−pi/2
−pi/4
ψ
0
[rad]
pi/4
pi/2
real
(a) Em relação ao heading.
3pi/4
pi
−100
−50
0
50
Yh [% do valor absoluto da componente horizontal do CMT]
100
(b) Um eixo em relação ao outro.
Figura 3.9: Leitura de dois sensores magnéticos ortogonais (inseridos no plano horizontal)
quando rodados de 360o no plano horizontal.
3.4.2
Estimador de Atitude Magneto-Pendular
O estimador de atitude magneto-pendular (Magneto Pendular Sensor, MPS) baseiase no princípio do inclinómetro, segundo o qual se pode determinar a inclinação de um
corpo através do ângulo formado entre um pêndulo e a vertical (consultar Figura 3.10).
50
Para o trabalho presente, em lugar do pêndulo utiliza-se uma tríade de acelerómetros,
em que a aceleração gravítica corresponde à vertical.
Figura 3.10: Inclinómetro e acelerómetro.
Utilizando este principio apenas é possível determinar, em ângulos de Euler, os ângulos de pitch e roll, o ângulo de yaw não é mensurável porque a informação fornecida por
este é independente da rotação segundo o eixo normal à superfície terrestre. Para determinar o ângulo yaw recorreu-se à componente horizontal do campo magnético, fornecida
pelo magnetómetro.
Leitura da Componente Gravítica dos Acelerómetros e Determinação da Inclinação
A escolha natural como substituto de um inclinómetro, é um acelerómetro. No
entanto, a leitura do acelerómetro não poderá ser utilizada directamente. De facto, tal
como foi apresentado na Secção 3.2.2, só quando um acelerómetro se encontra imobilizado
na superfície terrestre é que se tem
B
(3.9)
f = −B g,
E
E
′
onde B g = E
B R g e g = [0, 0, g] .
Um modelo possível para as medidas de um acelerómetro em movimento é dado por
d Bv
+ ω × B v − B g,
(3.10)
dt
B
onde ddtv é a aceleração linear, ω × B v é a aceleração centrípeta, e B g é o vector de
gravidade no referencial {B}. Este modelo evidencia portanto, a necessidade de remover
a aceleração centrípeta para que os resultados do estimador sejam válidos para qualquer
movimento, rectilíneo ou de rotação. Definindo a grandeza
f=
assumindo que
d Bv
dt
f̂ = f − ω × B v,
(3.11)
≈ 0, é possível através de


g sin θ


f̂ ≈ −B g = −R′X (φ)R′Y (θ)E g =  −g cos θ sin φ  ,
−g cos θ cos φ
(3.12)
51
depois de algumas manipulações algébricas, com f̂ = [fˆx , fˆy , fˆz ]′ , vem
φ = arctan2 −fˆy , −fˆz ,

!
ˆ

fx sin φ


, sin φ 6= 0

arctan − fˆ
y
!
θ=
.
ˆx cos φ

f


, cos φ 6= 0

arctan − fˆ
z
(3.13)
que são ângulos de roll e pitch respectivamente.
A remoção da aceleração centrípeta não está livre de erros, no entanto, analisando
as condições de operação do veículo, observa-se que as acelerações tangenciais são de curta
duração devido à compensação dos atritos e que a aceleração gravítica é muito superior
às acelerações de funcionamento do veículo, tornando viáveis as leituras do sensor para
baixas frequências.
Determinação do Ângulo de Yaw
O campo magnético terrestre é medido no referencial {B} pelo magnetómetro
B
mr = R′X (φ)R′Y (θ)R′Z (ψ)E m̄,
(3.14)
onde E m̄ é conhecido e representa o campo magnético Terrestre expresso no referencial
{E} e RX (φ), RY (θ), e RZ (ψ) representam as matrizes de rotação elementares de roll,
pitch, e yaw respectivamente.
A estimação do ângulo de yaw é obtida através da projecção da leitura do magnetómetro num referencial auxiliar {Ea }. Os referenciais {Ea } e {E} apenas diferem numa
rotação em torno do eixo do z.
A componente horizontal da leitura do magnetómetro é obtida projectando o campo
magnético segundo os ângulos pitch e roll determinados anteriormente
Ea
m = RY (θ)RX (φ)B mr ,
(3.15)
onde B mr = [mx , my , mz ]′ é a leitura do magnetómetro e Ea mr é a leitura do magnetómetro expressa em {Ea }. Em geral é necessário ter em conta a declinação magnética
local (αdec ), sendo a sua compensação possível através de
ψ = arctan2 −Ea my , Ea mx − αdec , ou, caso seja conhecido E m̄,
(3.16)
Ea
Ea
Ea
E
Ea
E
E
E
ψ = arctan2 my mx − mx my , mx mx + my my
O presente Capítulo começou por caracterizar de forma breve, os primeiros avanços
do conhecimento e tecnologia conseguidos pelo Homem na ciência da navegação terrestre.
Introduziu alguns dos métodos e instrumentos de navegação mais populares na actualidade que assumem especial importância no contexto do presente trabalho. Nos Capítulo 4
e seguintes, é descrita a plataforma, a arquitectura e o sistema de navegação propostos,
sendo feita a análise e discussão dos resultados experimentais obtidos em testes de mar
com o ASC DELFIMx.
Capítulo 4
Arquitectura Proposta para um
Catamaran
O programa de desenvolvimento de veículos marinhos autónomos (submarinos e de
superfície) levado a cabo no DSOR, foi iniciado com a ambiciosa premissa de começar do
zero o projecto, concepção e implementação das arquitecturas de software e de hardware
dos veículos. O presente Capítulo apresenta, para além de uma visão geral do conceito de
operação do sistema DELFIMx, uma descrição com maior detalhe dos vários subsistemas
que o constituem. Apresenta também uma breve descrição da tecnologia dos sensores de
navegação, em particular dos sensores inerciais e do magnetómetro.
4.1
Descrição Geral do Veículo e da Arquitectura
A Figura 4.1 ilustra o veículo autónomo de superfície de DELFIMx, um pequeno
catamaran com cerca de 4.5 m de comprimento, 2.45 m de largura, carga nominal de
cerca de 300 kg, o que corresponde a um calado1 de 0.18 m.
Figura 4.1: Diagrama de blocos do conceito operacional do sistema DELFIMx.
Os dois cascos do catamaran estão ligados por duas traves, tendo cada casco montado na
1
Calado é a distância da superfície da água ao fundo da embarcação.
52
53
4.1. Descrição Geral do Veículo e da Arquitectura
zona posterior um motor eléctrico com um hélice acoplado. Os motores podem operar em
modo comum ou diferencial, o que permite controlar a velocidade e a orientação (rumo)
do veículo, podendo atingir velocidades de cerca de 6 nós em relação à água. Dispõe de
uma estrutura central em forma de asa, que pode ser instalada de forma a ficar semisubmersa. Na extremidade submersa desta estrutura, está instalado um corpo de baixo
atrito hidrodinâmico que permite transportar transdutores acústicos. Para operações
de batimetria e caracterização do fundo do mar, a asa é equipada com um sonar de
varrimento mecânico. As baterias de alimentação dos motores e da electrónica a bordo,
bem como a arquitectura de comando e controlo do catamaran, encontram-se no interior
dos cascos.
A arquitectura distribuída para navegação de veículos autónomos, que é proposta
neste trabalho, surge de forma natural no enquadramento proporcionado pelo trabalho
desenvolvido no DSOR. As áreas de interesse do referido grupo vão desde a navegação,
controlo, passando pelo controlo de missão e integração de sistemas nesses veículos. Foi
desenvolvida neste laboratório, uma arquitectura digital distribuída de tempo real, que
vem a ser utilizada e testada no âmbito de projectos com veículos autónomos. O presente
trabalho enquadra-se na área de investigação deste laboratório relacionada com a integração de sistemas de hardware analógico e digital, calibração de sensores, implementação
eficiente de algoritmos de navegação e validação por Hardware-In-The-Loop (HITL) de
todo o sistema de navegação. Enquadradas com os objectivos do DSOR, existiram, no
passado, contribuições valiosas no âmbito da implementação de algoritmos de navegação
[85, 86], tendo sido documentados bons resultados, quer ao nível da simulação, quer ao
nível da implementação real de uma plataforma inercial.
A opção por uma plataforma descentralizada, cujas vantagens são descritas com
mais detalhe em [7], foi desenvolvida de forma a acomodar uma larga variedade de ambientes operacionais. A sua natureza modular confere a este conjunto de sub-sistemas
grandes benefícios no que diz respeito à sua integração numa multiplicidade de plataformas diferentes. A Figura 4.2 apresenta uma visão de alto nível da arquitectura total
proposta.
!"#
Figura 4.2: Diagrama geral da arquitectura proposta para operação do sistema DELFIMx.
O tipo de implementação ao qual se dedicou esta tese, está vocacionado para a
utilização no contexto dos Veículos Marinhos Autónomos de Superfície (habitualmente
54
Capítulo 4. Arquitectura Proposta para um Catamaran
designados por Autonomous Surface Craft, ASC), em particular, a embarcação que serviu
de plataforma para os testes de campo é uma embarcação do tipo catamaran.
A arquitectura, instalada no ASC, caracteriza-se por ser um sistema autónomo
montado em várias caixas que apresentam a possibilidade de serem facilmente instaladas
ou removidas do veículo. Devido à sensibilidade de alguns dos seus componentes, nomeadamente o sistema de navegação, as referidas caixas, são fixas ao casco do veículo por
meio de isoladores de vibração, obtendo-se assim um melhor isolamento das abundantes
oscilações e choques mecânicos presentes na embarcação, que têm como principal origem
a ondulação. Desta maneira, obtém-se o efeito de um filtro passa-baixo mecânico, conseguindo assim uma atenuação efectiva das vibrações transmitidas a todos os dispositivos
electrónicos.
A capacidade computacional a bordo do veículo, para além de estar descentralizada, está projectada conforme as necessidades das tarefas que deve desempenhar. O
processamento mais exigente em termos computacionais que os algoritmos de navegação
e controlo (a parte algorítmica relacionada com o controlo não faz parte dos objectivos
desta tese) requerem, ficam a cargo de um Digital Signal Processor (DSP), conectado à
arquitectura de aquisição de sinal por via de uma Dual Port RAM (DP-RAM) implementada numa placa também desenvolvida no IST-ISR. A escolha do DSP recaiu sobre
o Texas Instruments TMS320VC33 devido à sua muito favorável relação entre consumo
energético e desempenho (trata-se de um DSP de 32 bit de vírgula flutuante - consultar
C.5.2). De seguida, surgem mais duas camadas de processamento que foram desenvolvidas em torno dos microcontroladores Phillips XAS3 (16 bit) e o Atmel AT90CAN128
(8 bit) AVR Flash. Não sendo apropriados para cálculo intensivo, estes dispositivos
apresentam-se como óptimas soluções para a interface a sensores e actuadores, visto que
têm a capacidade para a troca de mensagens através do barramento (Controller Area
Network (CAN bus). Para as tarefas de alto nível, foi escolhida uma placa PC/1042
conectada ao CAN bus que, durante a realização deste trabalho, desempenhou a função
de Data Logger, armazenando num disco de estado sólido, todos os dados gerados pelo
ASC que posteriormente são processados. Futuramente, esta máquina vai ser responsável
pelo Controlo de Missão.
4.2
Computador de Bordo Distribuído
Nas secções seguintes são descritos com maior detalhe os subsistemas que constituem
a arquitectura computacional que se propõe neste trabalho. Na Figura 4.3 apresenta-se
uma ilustração dos sistemas a bordo do veículo.
4.2.1
Arquitectura de Comunicações Distribuída - CAN Bus
O CAN bus é um barramento série desenvolvido com o intuito de oferecer uma
forma fiável e económica de ligar sensores e actuadores em aplicações com requisitos de
tempo-real. O CAN bus opera a taxas de transmissão de dados que podem ir até ao 1
Mbit por segundo, apresentando também, uma enorme variedade de sistemas robustos
de detecção de erros. Foi desenvolvido por uma empresa de origem alemã designada por
2
PC/104 Embedded Consortium, http://www.pc104.org.
55
4.2. Computador de Bordo Distribuído
"#
#
$
%
Figura 4.3: Diagrama de blocos da arquitectura distribuída.
Robert Bosch com vista a ser utilizado na indústria automóvel, possibilitando uma forma
eficiente e pouco dispendiosa para interligar um crescente número de dispositivos electrónicos presentes num automóvel. O CAN bus é, no presente, um standard internacional
documentado no ISO 11898 [87]. Na Figura 4.4 ilustra-se a arquitectura dos nós CAN e
a sua ligação ao meio de transmissão.
Figura 4.4: Arquitectura dos nós CAN e ligação ao meio de transmissão (extraído de [7]).
O meio de transmissão pode consistir somente de dois condutores eléctricos (CAN_H
and CAN_L) terminados electricamente nas duas extremidades com cargas resistivas de
cerca de 120 Ohm que suprimem as reflexões na linha de transmissão. A generalidade
dos circuitos integrados de acesso ao meio de transmissão disponíveis no mercado pode
suportar redes com várias dezenas de nós.
As suas primitivas para broadcast fiável tornam possível construir um conjunto de
serviços de comunicações sobre o protocolo nativo, o que, naturalmente, contribui para
56
a enorme aceitação comercial que o CAN bus apresenta, sendo neste momento, e muito
claramente, o fieldbus mais usado em aplicações e sistemas de controlo distribuído. Com
a sua aceitação comercial e consequente implantação massiva na indústria, têm aparecido
inúmeras soluções de hardware dos mais diferentes fabricantes (Intel, Philips, Motorola,
Siemens entre outros), o que tem tornado o desenho de sistemas baseados em CAN cada
vez mais simples e tem garantido que o suporte se manterá durante bastante tempo.
A cada mensagem faz-se corresponder um único identificador que permite, de forma
unívoca, a sua identificação na rede. Este identificador define, não só os dados, mas
também a prioridade da mensagem no barramento (consultar [88]). Por se tratar de
uma rede de comunicação em que é possível garantir não só a entrega, mas também uma
duração máxima até uma determinada mensagem chegar ao seu destino ou destinos, o
CAN bus apresenta-se como uma solução adequada para um canal de comunicação entre
os vários dispositivos deste sistema.
4.2.2
Nós da Rede CAN Bus
Na Figura 4.3 foi apresentado o diagrama de blocos que descreve os principais
sistemas a bordo do ASC. Cada bloco pode conter mais que uma funcionalidade, podendo
portanto englobar mais que um nó da rede CAN. Esta secção pretende descrever de forma
sucinta os nós constituintes de cada bloco.
Comunicações, Comando e Armazenamento de Dados
O armazenamento de dados de uma missão para posterior processamento e validação, é uma funcionalidade fundamental de um sistema deste género. O facto de ainda se
tratar de um protótipo, é uma plataforma que ainda está sujeita a alterações que podem
ter origem no diagnóstico atento e pormenorizado dos dados dos sensores, filtros de navegação e controlo. No caso particular dos dados de GPS, é armazenada informação que
não é utilizada em tempo real, mas que depois de pós-processada em laboratório pode
ser essencial para testar a qualidade de diversas opções no que diz respeito aos filtros de
navegação, isto é, consegue-se em laboratório simular uma missão na sua totalidade.
O hardware, que implementa esta funcionalidade, é um módulo PC/104 com interface CAN bus e capacidade de escrita num disco não volátil de estado sólido. O software
foi desenvolvido para uma implementação própria (desenvolvida no DSOR) do sistema
operativo Linux que está a ser executado nesta máquina. No futuro, este nó vai também
conter algoritmos de alto nível para a implementação de controlo de missão.
Navegação, Controlo e Sensores
Este nó é constituído por vários componentes, sendo aqui que se pode encontrar a
maior capacidade computacional dedicada a operações de vírgula flutuante, a bordo do
veículo. Está dividido em três subsistemas: a arquitectura de processamento e aquisição
de sinal analógico, a interface ao GPS e a interface ao magnetómetro. A primeira é um
conjunto de placas (MCXA-S3,DSPIf, D.Module.VC33 e AD24B3C) para processamento
digital, placas de interface e placas com conversores analógico-digital (Analog to Digital
Converter, ADC). As três primeiras, são conectadas através de um barramento digital
paralelo sendo mecanicamente unidas "empilhando"as mesmas (barramento eléctrico e
4.2. Computador de Bordo Distribuído
57
mecânico, semelhante ao barramento PC/104, habitualmente designado por barramento
em stack ). Uma pequena descrição de cada placa é apresentada de seguida:
Placa MC-XAS3. A placa MC-XAS3, é uma placa microcontroladora genérica de 16
bit equipada com dois interfaces CAN bus 2.0 desenvolvida para utilização em ambientes
de controlo distribuído de tempo real onde o reduzido consumo energético e a dimensão
compacta são critérios muito fortes. Uma descrição mais pormenorizada sobre esta placa
pode ser encontrada no Anexo C.1.
Placa DSPIf - Interface entre MC-XAS3 e D.Module.VC33 . Esta placa serve o
propósito de fazer a interface entre as placas MC-XAS3 e D.Module.VC33 fazendo uso de
uma memória de acesso aleatório (Random Access Memory, RAM) estática de dois portos
(Dual-Port RAM, DP-SRAM) e alguma lógica digital implementada num dispositivo de
lógica programável (Programmable Logic Device, PLD) de descodificação de endereços.
O conceito de memória partilhada que foi desenvolvido, está ilustrado na Figura 4.5, e
caracteriza-se por ser um sistema de sinalização e transferência de dados do tipo mailbox,
onde, quando um dispositivo pretende comunicar com o outro, escreve na mailbox correspondente o comando desejado e seguidamente provoca-lhe uma interrupção. O primeiro
procedimento do sistema interrompido, é ler o comando que o outro dispositivo escreveu
e proceder conforme esse comando.
Figura 4.5: Diagrama funcional do protocolo do tipo mailbox implementado com a DPRAM.
Esta metodologia de interface permite que, na placa MC-XAS3, sejam "empilhadas"várias placas DSPIf (cada uma com uma placa D.Module.VC33 ) caso as necessidades computacionais assim o exijam. Um descrição com maior detalhe é apresentada no
Anexo C.4.
Placa D.Module.VC33 . A D.Module.VC33 é uma placa de processamento digital de
sinal de vírgula flutuante de desempenho médio que pertence à família D.Module da
D.SignT 3 . O seu objectivo passa pela execução de aplicações embebidas do tipo standalone que requerem funcionalidade e flexibilidade máximas e baixo consumo de energia.
Os requisitos de baixo consumo tornam possível a sua utilização em aplicações móveis
alimentadas a baterias. A este dispositivo foram atribuídas as tarefas de maior carga
computacional numérica devido às suas características específicas, designadamente, os
3
D.SignT Digital Signalprocessing Technology, http://www.dsignt.de.
58
filtros de navegação e de futuro, os filtros que implementam as leis de controlo - consultar
o Anexo C.5 para obter mais detalhes sobre esta placa.
A arquitectura de aquisição é constituída por uma a quatro placas que se ligam em
barramento do tipo stack, tendo cada uma a capacidade de amostrar três sinais analógicos
em simultâneo. Visto só terem o circuito simples de lógica programável e os conversores
ADC, estas placas necessitam de se ligar a um microcontrolador ou processador digital de
sinal. Na arquitectura do ASC DELFIMx, a arquitectura de aquisição está ligada através
de um barramento dedicado à placa MCXA-S3 que faz parte do stack onde se encontra
o DSP. Em termos da rede CAN, as arquitecturas de processamento e de aquisição de
sinal pertencem ao mesmo nó.
Interface ao GPS. Para além de fornecer dados do posicionamento da plataforma recorrendo a interface com o GPS, este nó serve também como disseminador de tempo para
a rede CAN para que todos os nós estejam sincronizados. É composto por uma placa
MCXA-S3 (consultar o Anexo C.1), uma placa ASHDG14If (consultar o Anexo C.3) e
um GPS Thales DG14 (consultar o Anexo D.4). Este sistema independente constitui um
nó de CAN e está instalado, por conveniência, na caixa da Navegação, Controlo e Sensores.
Interface ao Magnetómetro. Para se conseguir a integração do magnetómetro Honeywell HMR3300 OEM na arquitectura distribuída, desenvolveu-se uma placa do tipo
placa-mãe. Esta placa, a HMR_MB (consultar Anexo C.7), foi desenvolvida em torno
do microcontrolador de 8 bit Atmel AVR AT90CAN128 e disponibiliza conectores específicos de modo a que seja possível empilhar a placa do magnetómetro. Desta forma, é
possível fazer uma interface local ao magnetómetro via um porto série, e enviar os dados
através do CAN bus para os outros nós da arquitectura. Esta característica traduz-se na
elevada capacidade de o colocar num qualquer local do veículo de acordo com critérios
que minimizem a incompatibilidade entre este sensor e outros agressores, na medida em
que este é um sensor muito vulnerável à interferência electromagnética.
Propulsão
Os sistemas da Propulsão (um por cada casco) são constituídos por uma placa
MC_AVRCAN128 baseada no microcontrolador Atmel AVR AT90CAN128 que, para
além da interface aos sensores de velocidade angular dos motores e aos detectores de
entrada de água nos cascos (leak detectors), é responsável também pela geração de um
sinal de Pulse Width Modulation (PWM) que serve de comando para o controlador do
motor eléctrico. Os comandos de velocidade codificados em pulsos do tipo PWM podem
ter origem na consola de comando ou nos sistemas de controlo e comando automático que
se encontram a bordo do ASC. Uma descrição mais completa da placa MC_AVRCAN128
é apresentada no Anexo C.6.
Baterias da Propulsão
Este sistema, também replicado para cada casco, contém um único nó da rede CAN
constituído pela placa BatMonit (consultar Anexo C.8). Tem como principal objectivo,
o controlo de um interruptor de estado sólido que permite ligar e desligar as baterias de
propulsão dos motores eléctricos ou do carregador de baterias (caso o sistema esteja em
4.3. Monitorização, Transformação e Distribuição de Energia
59
modo de carga). Para além disso, tem a capacidade de monitorizar a corrente e tensão
eléctricas de carga e descarga das baterias de propulsão.
Baterias dos Computadores
O sistema Baterias dos Computadores, tal como o sistema Baterias da Propulsão,
é baseado na placa BatMonit (consultar Anexo C.8) e tem também funcionalidade semelhante, isto é, para além de monitorizar a corrente e a tensão das baterias, controla o
estado de um interruptor de estado sólido. Este interruptor encontra-se entre o pack de
baterias (de 26 V) e o barramento "CAN bus + 26 V"permitindo assim desligar todos os
sistemas que estão ligados e dependentes da parte energética do referido barramento.
4.3
Monitorização, Transformação e Distribuição de Energia
Para um eficaz planeamento de uma missão, é de extrema importância ter conhecimento, a todo o momento, dos recursos energéticos a bordo da plataforma. No caso dos
recursos eléctricos armazenados numa bateria de Lítio Polímero (Baterias dos Computadores), foi desenvolvido um sistema de monitorização de carga e descarga eléctrica que
dispõe da capacidade de medição da energia que entra e saí das mesmas, sendo assim
possível conhecer o estado de carga em que se encontram. Evita-se por completo situações de falha de energia devido à descarga excessiva das baterias que se podem revelar
muito perigosas aquando da operação de um veículo deste género. Uma descrição com
maior detalhe é feita no Anexo C.8. O sistema Bateria dos Computadores é constituído
por uma série de sete células (7S) de 40 Ah, o que perfaz uma tensão nominal contínua
de aproximadamente 26 V e uma energia total disponível de cerca de 1 kWh. Os 26 V
são colocados no barramento ("CAN bus + 26 V") para alimentar todos os outros sistemas. Conforme as suas necessidades, cada sistema transforma este nível de tensão nos
níveis adequados. A título de exemplo, o sistema de navegação, para além de conversores
DC-DC isolados, recorre também à placa SWLNPWR (consultar o Anexo C.9 para mais
detalhes) para gerar as tensões adequadas para os sensores inerciais.
No caso das Baterias da Propulsão, faz também a monitorização de corrente e de
tensão de carga e de descarga. O primeiro protótipo foi equipado com baterias com
tecnologia de chumbo. Esta tecnologia permite, através das curvas de carga e descarga
de tensão, obter uma estimativa relativamente fiável do seu estado. Quando no futuro
forem instaladas baterias de Lítio Polímero, um sistema mais preciso de contagem de
carga e descarga vai ser instalado (tal como o que foi instalado no sistema Bateria dos
Computadores).
4.4
Actuadores
Os actuadores constituem a camada inferior na cadeia de comando e controlo. No
caso do catamaran DELFIMx, e para que este possa efectuar a sua missão, foram instalados dois propulsores, cada um na zona posterior de cada casco. Por motivos ambientais
e de índole prática, optou-se por um sistema de propulsão eléctrico. O sistema total é
60
constituído por partes mecânicas (coluna do motor, veio de transmissão, o hélice), por
partes electro-mecânicas (motor eléctrico -AXI 53604 ) e por partes eléctricas (placa microcontroladora, controlador de velocidade do motor Schulze 5 ). Algumas vistas dos vários
componentes do sistema de actuação, são apresentadas na Figura 4.6.
(a) Hélice em rotação.
(b) Montagem do motor,
coluna do motor, transmissão e hélice fora do
ASC.
Figura 4.6: Partes mecânicas, electro-mecânicas e eléctricas dos actuadores.
Tal como foi referido anteriormente, a placa MC_AVRCAN128, é responsável pela
geração do sinal PWM (que recebe pela rede CAN), onde se codifica a velocidade de
rotação que vai ser interpretado pelo controlador de velocidade.
4.5
4.5.1
Sensores
Unidade de Medição Inercial
De modo a controlar ou georeferenciar um veículo móvel, é necessário medir e estimar as suas variáveis de estado. Tal como apresentado no Capítulo 3, uma solução
possível para atingir estas estimativas é recorrer a um sistema de navegação inercial.
A solução que se propõe para um sistema inercial analítico, isto é, um sistema que é
estabilizado computacionalmente, contém um acelerómetro triaxial (trata-se de um dispositivo que contém três acelerómetros montados com os eixos sensíveis de forma ortogonal
entre si) e três giroscópios de velocidade montados também de forma a conseguirem medir
velocidades angulares segundo três eixos ortogonais entre si. O acelerómetro triaxial é
um Crossbow Technology, Inc. CXL02TG3 (consultar o Anexo D.1) e o giroscópio de velocidade uniaxial é Silicon Sensing CRS03 (consultar o Anexo D.2). Estes sensores estão
fisicamente fixos a um suporte desenvolvido propositadamente para o efeito. O suporte
com os referidos sensores é apresentado na Figura 4.7.
Sendo estes dispositivos de baixo custo, o seu desempenho apresenta também algumas limitações. Para ultrapassar essas limitações, faz-se uso de filtros e algoritmos de
4
5
AXI Model Motors, http://www.modelmotors.cz.
Schulze Elektronik GmbH, http://www.schulze-elektronik-gmbh.com.
61
4.5. Sensores
Figura 4.7: Unidade de medição inercial.
navegação que tornam um Sistema de Medição Inercial (Inertial Measuring Unit, IMU)
num INS. A solução adoptada neste trabalho é descrita com mais detalhe no Capítulo 5.
Devido à sua relevância no desenvolvimento tecnológico actual (em particular em
sistemas de navegação), e por ser a tecnologia que é empregue nos sensores inerciais
utilizados neste trabalho, apresenta-se em seguida uma pequena descrição da tecnologia
do tipo Micro Electro Mechanical System (MEMS).
4.5.2
Tecnologia MEMS
O desenvolvimento de sensores do tipo Micro Electro Mechanical System (MEMS)
foi incentivado pelo aparecimento de novas aplicações que exigiram sensores de baixo
custo que pudessem fornecer medidas de aceleração e movimento angular. Uma aplicação
moderna típica é, para estes sensores inerciais, a área dos transportes, nomeadamente a
indústria automóvel.
Os sensores MEMS são definitivamente um dos avanços mais importantes no que
diz respeito a sensores inerciais nos últimos 25 anos. Conseguiram quebrar as barreiras
que inviabilizavam o recurso a sistemas inerciais de inúmeras aplicações, onde o custo,
dimensão e consumo energético são os critérios de desenvolvimento mais fortes. O desenvolvimento de sistemas inerciais convencionais sofreu também inúmeros e valiosos avanços,
mas os seus custos permaneceram extremamente elevados para poderem ser adoptados
em aplicações de grande consumo. As razões que justificavam os elevados custos são:
elevado número de peças muitas das quais com tolerâncias de manufactura muito elevadas; técnicas de montagem complexas e com requisitos de alta precisão; teste e calibração
complexas.
A tecnologia MEMS recorre a processos de decapagem química (chemical etching),
fotolitografia e processamento em lotes tais como os que são utilizados pela indústria de
circuitos integrados. As técnicas de precisão para "maquinar" silício, foram adoptadas
para produzir estruturas mecânicas muito pequenas em silício ou quartzo. Este passo
possibilitou a concepção e produção de sensores inerciais de estado sólido com as seguintes
características: dimensão reduzida, baixo peso, baixo consumo energético, construção
robusta, tempo de arranque reduzido, baixo custo de produção e em grande quantidade,
62
elevada fiabilidade, pouca necessidade de manutenção, compatibilidade com operação em
ambientes hostis [10].
Giroscópios de Velocidade
O funcionamento de giroscópios vibratórios foi demonstrado no inicio da década de
1980. Um exemplo deste tipo de dispositivos é o Quartz Rate Sensor, desenvolvido pela
Systron Donner 6 . Embora giroscópios fabricados em quartzo possam apresentar elevados
factores de qualidade e desempenho, o material básico que os constitui, o quartzo, impossibilita o seu processamento em lotes recorrendo à tecnologia da indústria de circuitos
integrados. No fim da década de 1980, depois de demonstrado com sucesso o fabrico
em lotes de acelerómetros utilizando como matéria prima o silício, foram iniciados esforços para substituir o quartzo pelo silício na produção de giroscópios vibratórios do tipo
MEMS.
Os giroscópios do tipo MEMS são dispositivos não rotativos e recorrem ao efeito
da aceleração de Coriolis em massas de prova a vibrar para detectar velocidade angular
inercial. Assim, estes sensores dependem da detecção da força que actua numa massa que
está sujeita a um movimento linear vibratório no referencial que se encontra em rotação
em relação ao eixo perpendicular ao eixo de movimento linear. A força resultante é
designada por força de Coriolis, que actua perpendicularmente ao eixo de vibração linear
e ao eixo de rotação aplicada. Analiticamente pode ser descrito como
Aceleração de Coriolis : ac = 2v × Ω,
Força de Coriolis : Fc = 2mv × Ω,
(4.1)
onde Ω é a velocidade angular de rotação do referencial em relação ao qual a massa m
se encontra a mover com velocidade v e Fc é a força experimentada pela massa m.
Muitos tipos de giroscópios de velocidade de tecnologia MEMS apareceram, até à
data, na literatura especializada, sendo a maior parte pertencente a um dos três subconjuntos: i) Osciladores Simples: que estruturalmente se assemelham a barras ou vigas com
a capacidade de vibrar (designadas na literatura anglo-saxónica por vibrating beams); ii)
Osciladores Balanceados: com estrutura tipo diapasão (ou como é conhecido na literatura
anglo-saxónica, tuning forks); iii) Shell Resonators: que pode ser do tipo wine glass, em
cilindro, ou em anel. As Figuras 4.8(a), 4.8(b) e 4.8(c) ilustram os três tipos básicos de
giroscópios MEMS, respectivamente.
Giroscópios tipo Diapasão. Contêm um par de massas que são sujeitas a oscilar com
a mesma amplitude mas com direcções opostas. Quando em rotação, a força de Coriolis
cria uma vibração ortogonal que pode ser medida de diversas formas. Em 1991, o Draper
Laboratory [89] demonstrou um dos primeiros giroscópios de velocidade recorrendo à tecnologia MEMS, utilizando o silício como matéria prima [90]. Este dispositivo ilustrado
na Figura 4.9 (imagem scanning-electron-microscope, SEM) utiliza estruturas que se assemelham a pentes para forçar o diapasão a entrar em ressonância.
6
http://www.systron.com/
63
4.5. Sensores
(a) Barra ou viga vibratória.
(b) Diapasão ou tuning fork.
(c) Shell Resonators em anel.
Figura 4.8: Classes de giroscópios de velocidade do tipo Coriolis Vibrating Gyroscopes
(extraído de [8]).
Figura 4.9: Primeiro protótipo funcional de um giroscópio MEMS do tipo diapasão,
desenvolvido no Draper Laboratory.
Giroscópios tipo Shell Resonators em anel. Uma forma possível, deste tipo de
sensor, possui um íman permanente instalado por cima da estrutura MEMS. A corrente
eléctrica que passa nas hastes condutoras, criam uma força que faz o anel entrar em
ressonância. O movimento do anel induzido pela força de Coriolis, causado pela rotação
do sensor, é detectado pela tensão induzida nas hastes que são atravessadas pelo campo
magnético.
Um exemplo de um giroscópio de velocidade que emprega esta tecnologia, é o sensor
Silicon Sensing Systems CRS03 (consultar Anexo D.2) que é utilizado neste trabalho. É
fabricado com um único cristal de silício com metal adicionado para obter maior conductividade. Este dispositivo é utilizado para estabilizar o Segway Human Transporter 7 . A
Silicon Sensing Systems Ltd [9] é o resultado de uma parceria entre a Sumitomo Precision
Products [91] e a Atlantic Inertial Systems [92] (descendente da British Aerospace [93]).
Na Figura 4.10 apresentam-se várias ilustrações que revelam a dimensão e a estrutura
mecânica deste dispositivo.
7
Segway, http://www.segway.com
64
(a) Ilustração da escala.
(b) Vista alargada da ar- (c) Vista ampliada das hastes que
quitectura.
suportam o anel.
Figura 4.10: Giroscópio de velocidade Silicon Sensing Systems CRS03 (extraído de [9]).
Acelerómetros
Os acelerómetros MEMS detectam a aceleração de uma das seguintes formas: medindo a posição (por leituras capacitivas ou piezoelétricas) de uma massa de prova manufacturada com tecnologia MEMS; medindo a mudança de frequência de um elemento
vibrante, causada pela alteração da tensão mecânica induzida pela mudança na carga
mecânica exercida pela massa de prova quando é sujeita à aceleração. A primeira classe é
conhecida como acelerómetros pendulares e são análogos aos acelerómetros convencionais
do tipo pêndulo em malha aberta e em malha fechada. Já a segunda é habitualmente
designada por acelerómetros ressonantes ou VBA (Vibrating Beam Accelerometers).
Acelerómetros de massa pendular. Já foram desenvolvidos acelerómetros capazes
de medir a força específica com eixos sensíveis contidos no plano da estrutura MEMS
(in-plane) e com eixos sensíveis que são perpendiculares ao plano da referida estrutura
(out-of-plane). Na Figura 4.11 apresenta-se uma ilustração de um acelerómetro do tipo
in-plane. Faz uso de uma estrutura em pente para o seu elemento sensível, medindo a
(a) Vista ampliada.
(b) Vista alargada.
Figura 4.11: Imagem SEM de um acelerómetro de massa pendular no plano (extraído de
[10]).
força específica através da detecção da alteração da capacidade ao longo dos dentes da
estrutura em pente. Este tipo de sensores "mecânicos" é significativamente mais sensível
a acelerações aplicadas no plano horizontal (tal como ilustrado, isto é da esquerda para
a direita) do que na direcção ortogonal (ou de cima para baixo)
65
4.5. Sensores
O recurso à realimentação de força é mais uma propriedade destes sensores que
possui uma elevada influência no seu desempenho. Em sensores sem esta característica
(Figura 4.12(a)), a leitura é obtida através de um transdutor de posição (capacitivo,
piezoeléctrico, piezoresistivo, etc) que mede a posição da massa de prova em relação à
posição de equilíbrio (a posição de equilíbrio é forçada por molas que conectam a massa
de prova à caixa do acelerómetro). O valor medido é proporcional à força específica.
Os sensores com realimentação de força (consultar a Figura 4.12(b))) funcionam de
forma diferente. O sistema de realimentação é constituído por circuitos que recorrem às
medidas do transdutor de posição e a actuadores electroestáticos para criar uma força
de restituição que mantém a massa de prova na posição de equilíbrio. A vantagem desta
característica revela-se como uma menor sensibilidade às não linearidades nas molas e às
perturbações externas. Podem ser mais sensíveis visto que as molas não têm que suportar
a carga mecânica total e o amortecimento pode ser controlado por circuitos electrónicos.
Assim, estes sensores são habitualmente a opção a tomar quando os requisitos de sensibilidade são elevados.
Na Figura 4.12 são representados acelerómetros MEMS com eixo sensível fora de
plano nos quais uma massa de prova está suspensa numa mola torsional, sobre um substrato de vidro, que roda quando sujeito a acelerações perpendiculares ao plano do sensor.
A versatilidade do empacotamento destes sensores, podendo ser montados de forma planar, constitui a sua grande atractividade.
Quando existe a necessidade de integrar um sensor com mais de um eixo sensível
em volumes muito pequenos, a utilização destes dois tipos de acelerómetros (in-plane
e out-of-plane) possibilita um empacotamento muito reduzido e planar. Por exemplo,
a utilização de um elemento sensível fora do plano e de dois laterais no plano, com os
eixos de entrada ortogonais entre si, origina um acelerómetro triaxial da dimensão de um
pequeno circuito integrado.
(a) Malha aberta.
(b) Malha fechada.
Figura 4.12: Imagem SEM de um acelerómetro de massa pendular fora do plano (extraído
de [10]).
Acelerómetros ressonantes. Esta classe de sensores engloba a categoria de VBA que
podem ser configurados para serem sensíveis a acelerações que actuam segundo direcções
que podem estar no plano da estrutura do sensor, ou perpendiculares ao mesmo. A
aceleração é medida como o resultado da mudança da frequência de ressonância das
oscilações da barra, que se encontra sujeita à carga inercial da massa de prova, ao contrário
66
do que se verifica nos acelerómetros de massa pendular onde, é medido o deslocamento
da massa de prova.
A fabricação deste tipo de acelerómetros já foi conseguida com sucesso recorrendo,
quer ao silício, quer ao quartzo, como matéria prima. Na Figura 4.13(a) ilustra-se um
VBA no plano produzido em silício (silicon oscillating accelerometer, SOA) que foi desenvolvido no Draper Laboratory. Neste caso, a configuração básica é uma estrutura
monolítica (i.e., formado por um cristal único) em diapasão com uma grande massa de
prova em silício, cuja oscilação é forçada de forma electrostática. A barra é carregada
axialmente e quando uma aceleração é aplicada no plano do movimento oscilatório (no
plano da bolacha de silício), a frequência de ressonância altera-se. A oscilação ressonante
e a captura da frequência da barra em vibração é conseguida com uma estrutura em pente
de silício, tal como se ilustra na Figura 4.13(b).
(a) Vista alargada.
(b) Sensor e actuador em forma de pente.
Figura 4.13: Imagem SEM de um VBA no plano (extraído de [10]).
O processo de fabricação do acelerómetro SOA é silício sobre vidro; sendo perfeitamente elástico, o silício permite elevada estabilidade e precisão no controlo de frequência
de oscilação. O sensor é empacotado em vácuo num invólucro cerâmico que providencia
um elevado factor de qualidade do oscilador (tipicamente > 100000) o que possibilita
sensores com cerca de 1µg de estabilidade das polarizações.
Por todo o mundo, inúmeras arquitecturas de acelerómetros MEMS estão a ser
desenvolvidas por universidades, organizações governamentais e pela indústria.
4.5.3
Magnetómetro
A presente subsecção pretende somente descrever, de forma sucinta, os princípios
físicos que possibilitam a medição de campos magnéticos, em particular, o Campo Magnético Terrestre (CMT) (a sua utilização na navegação, foi abordada na Secção 3.4.1).
Existem vários tipos de sensores que recorrem a diferentes efeitos para a medição
de um campo magnético (e.g. efeito de Hall, efeito magnetoresistivo; por indução magnética, fluxgate; ou mesmo baseado na tecnologia SUperconducting Quantum Interference
Device, SQUID). Como consequência da referida variedade, surgem sensores com valores
diferentes de resolução, precisão, intervalo de medida, etc. Os sensores de efeito de Hall
são incapazes de detectar o CMT visto tratar-se de um campo de baixa intensidade. Os
4.5. Sensores
67
sensores SQUID são possivelmente os que apresentam maior sensibilidade, mas necessitam de ser arrefecidos a temperaturas muito baixas, o que os torna inadequados para
muitas aplicações.
Para a medição do CMT (com intensidade de aproximadamente 0.5 a 0.6 Gauss)
os sensores mais comuns, devido ao seu desempenho e condições de operação, são os
magnetómetros magnetoresistivos e os fluxgate. Os primeiros têm vindo a conhecer um
elevado crescimento nas aplicações relacionadas com navegação muito por causa da união
de um desempenho acima das especificações e uma capacidade de integração que permite
a sua implementação como um circuito integrado de pequeno volume. O magnetómetro
Honeywell HMR3300, utilizado neste trabalho, é um exemplo de um sensor que faz uso
da tecnologia magnetoresistiva para medição de um campo magnético
Designados na literatura anglo-saxónica por sensores Anisotropic Magnetoresistive
(AMR), têm a capacidade de medir campos magnéticos estáticos bem como a sua magnitude e direcção. Estes sensores são constituídos por uma película fina thin film de
uma liga metálica de níquel-ferro (liga permalloy) depositado numa bolacha de silício e é
moldado como um tira resistiva. As propriedades da película fina de níquel-ferro fazem
com que sofra uma alteração de cerca de 2 a 3 % na sua resistividade na presença de um
campo magnético. Tipicamente, quatro resistências deste tipo são ligadas numa configuração conhecida com ponte Wheatstone para que seja possível medir simultaneamente
magnitude e direcção de um campo magnético ao longo de um eixo. Podem ter uma
largura de banda de medida de cerca de 1 MHz e são também capazes de ser manufacturadas em grandes lotes em bolachas de silício e encapsulados em packages de circuitos
integrados já existentes na indústria.
Outra solução bastante popular e de bom desempenho, são os magnetómetros fluxgate que se encontram em utilização desde a década de 1920. Conseguem detectar campos
magnéticos da ordem dos poucos mG bem como a magnitude e direcção de campos estáticos. Podem ter uma largura de banda que pode atingir 1 kHz. As desvantagens
prendem-se com questões de falta de robustez, dimensão, e capacidade de integração
muito inferior aos sensores que empregam tecnologia magnetoresistiva (baseado em [5]).
Capítulo 5
Filtro de Navegação
O presente Capítulo dedica-se à apresentação detalhada do filtro complementar de
navegação proposto. Introduz-se o conceito da filtragem complementar aplicada à navegação, bem como a sua origem histórica. São também enunciadas algumas alternativas de
algoritmos de navegação com utilização comum em aplicações da industria aeroespacial
e em aplicações académicas.
5.1
Introdução e Motivação
É razoável afirmar-se que os sistemas de navegação encontram aplicações num
grande número de áreas, que vão desde os transportes, aplicações militares, aplicações
aeroespaciais, etc. Assim, ao longo de muitos anos de investigação, surgem naturalmente
muitas metodologias algorítmicas, que de alguma forma, tentam produzir, recorrendo
ao conjunto de sensores disponíveis, a melhor estimativa do estado de um veículo. Em
seguida, apresentam-se algumas dessas alternativas.
Soluções de Filtros de Navegação
Passaram já algumas décadas desde que foi apresentado na literatura uma análise
unificada do erro dos sistemas de navegação inerciais [94], contudo, no que diz respeito
às arquitecturas de filtragem para sistemas de navegação (que permita fusão sensorial),
é impossível afirmar que exista uma única solução, muito menos que exista uma solução
com desempenho sempre superior às outras. Um dos algoritmos mais popular, é o Filtro
de Kalman Estendido (EKF) [95], que continua a encontrar muitas aplicações (consultar
[96, 97, 98, 99, 100] e as referências aí incluídas). Contudo o EKF, devido à linearização e
à incerteza na condição inicial, é frequente ter problemas de divergência, o que constitui
uma dificuldade comum na sua implementação. Embora existam alternativas robustas
descritas na literatura [101], é vulnerável a problemas numéricos quando implementado
de forma não cuidada [102]. O Unscented Kalman Filter (UKF) foi proposto como uma
alternativa ao EKF [97, 103, 104], que aproxima numericamente o valor médio e a covariância da estimação do estado parametrizado em espaços Euclidianos. Tem também sido
crescente o interesse no desenvolvimento de observadores não lineares cuja estabilidade
teórica pode ser provada e que originam regiões explícitas de atracção [105, 106, 107].
68
69
5.1. Introdução e Motivação
Uma metodologia que se tem revelado bastante eficaz, designa-se por filtragem
complementar. Segundo [108], o princípio da filtragem complementar surgiu em 1953 no
artigo [109], embora o termo "filtro complementar" tenha sido introduzido pela primeira
vez em [110], no âmbito de uma aplicação relacionada com a aterragem por instrumentos
de aeronaves (Instrumented Landing System, ILS). A teoria da filtragem complementar
encontra suporte no trabalho do matemático Norbert Wiener (1894-1964) [111]: um sinal
desconhecido pode ser estimado recorrendo a medidas corrompidas por ruído de um ou
mais sensores cuja informação esteja naturalmente presente em bandas independentes
e complementares do espectro de frequência [112, 108, 113]. A estrutura de um filtro
complementar, enquadra-se adequadamente com o desenvolvimento de sistemas de navegação baseados em medidas auxiliares (como é o caso de sistemas de navegação inercial
auxiliado por medidas de GPS e magnetómetro). Nesta estrutura estão enraizadas ideias
chave tais como, a natureza complementar em frequência dos sensores, observabilidade e
modelos linearizados para variáveis de erro estocásticas. Em seguida é apresentada uma
descrição mais detalhada do conceito da filtragem complementar.
Conceito da Filtragem Complementar
Tal como foi referido anteriormente, foi Wiener [111] que primeiro resolveu o problema de estimação minimizando o erro quadrático médio (critério minimum mean-square
estimation, MMSE). A filtragem complementar consiste em explorar as características da
resposta em frequência de dois tipos de sensores segundo o critério MMSE, ou seja, um
filtro complementar é um meio de combinar leituras de sensores redundantes em que a
informação se encontra em frequências distintas e complementares sem distorcer o sinal
[108]. Com este método consegue-se, de forma eficaz, rejeitar as bandas do espectro de
frequência mais ruidosas (rejeição de perturbações), ao mesmo tempo que se tira partido
das bandas onde se encontra a informação. Tal como é discutido, de forma convincente
em [112], a perda de optimalidade dos filtros complementares, devido a ignorar-se a descrição estocástica do ruído, é ligeira, podendo até ser benéfica para os casos especiais
onde é melhor considerar medidas irregulares que ocorrem fora da variância esperada.
Analiticamente, o conceito de filtragem complementar, pode ser descrito como o
problema de combinar duas medidas ruidosas, y1 (t) e y2 (t), do mesmo sinal s(t) com
ruídos aditivos n1 (t) e n2 (t)
y1 (t) = s(t) + n1 (t),
y2 (t) = s(t) + n2 (t),
(5.1)
que são filtradas de forma independente através de funções de transferência H1 (s) e H2 (s).
A porção de sinal s(t) pode ser determinística ou não-estacionária, contudo, não se dispõe
de um modelo para s(t). Este tipo de abordagem é apresentado, de forma genérica, na
Figura 5.1(a). A saída do filtro no domínio do tempo é descrita por
ŝ(t) = H1 (s)[y1 (t)] + H2 (s)[y2 (t)],
(5.2)
onde H1 (s)[y1 (t)] e H2 (s)[y2 (t)] devem ser lidos como os sinais z1 (t) e z2 (t) que representam as saídas dos filtros com função de transferência H1 (s) e H2 (s) respectivamente,
quando têm à entrada os sinais y1 (t) e y2 (t) respectivamente.
70
Capítulo 5. Filtro de Navegação
O objectivo é sintetizar os filtros H1 (s) e H2 (s) para estimar de forma óptima o
sinal s(t), a partir das medidas ruidosas y1 (t) e y2 (t). No domínio da frequência, se as
características espectrais de s(t) fossem conhecidas e estacionárias, fica-se na presença do
chamado problema de filtragem de Wiener.
No domínio da frequência, a equação (5.2) pode ser reescrita na forma
Ŝ(s) = H1 (s) (S(s) + N1 (s)) + H2 (s) (S(s) + N2 (s))
= (H1 (s) + H2 (s)) S(s) + H1 (s)N1 (s) + H2 (s)N2 (s),
(5.3)
onde S(s) e Ŝ(s) são, respectivamente, a transformada de Laplace do sinal a estimar e
da sua estimativa e, N1 (s) e N2 (s) são as transformadas de Laplace do ruído aditivo às
medidas s1 (t) e s2 (t).
Para não introduzir distorção no sinal s(t), reparando na segunda linha de (5.3)
faz-se a função de transferência H2 (s), complementar de H1 (s)
H1 (s) + H2 (s) = 1 ⇐⇒ H2 (s) = 1 − H1 (s), para todo o s,
(5.4)
e reescreve-se a equação (5.3) da seguinte forma
(5.5)
Ŝ(s) = S(s) + (H1 (s)N1 (s) + (1 − H1 (s))N2 (s))
Na Figura 5.1(b) ilustra-se a aplicação de filtragem com a restrição complementar.
(a) Aplicação com dois graus de liberdade.
(b) Aplicação com um grau de liberdade, restrição
complementar.
Figura 5.1: Aplicações de filtragem.
Este resultado afirma que os filtros são complementares, que ŝ(t) vai ser constituído
por uma cópia do sinal s(t) e que os ruídos n1 (t) e n2 (t) vão ser filtrados pelas função de
transferência H1 (s) e pela sua complementar (1 − H1 (s)), respectivamente.
Visto que se assumiu que as medidas dos sensores são corrompidas por ruídos com
largura de banda complementares, se N1 é ruído na banda alta, N2 tem de ser ruído
de banda baixa. Então, se H1 (s) é um filtro passa-baixo, vai rejeitar o ruído n1 (t) e,
de forma análoga, H2 (s) = (1 − H1 (s)) vai ser um filtro passa-alto, rejeitando portanto
n2 (t). Analiticamente, fica
Ŝ(s) = S(s) + (H1 (s)N1 (s) + (1 − H1 (s))N2 (s)) ≃ S(s)
(5.6)
porque H1 (s)N1 (s) ≃ 0 e (1 − H1 (s))N2 (s) ≃ 0. Portanto, enquanto que o filtro complementar não introduz distorção ao sinal, tem a capacidade de remover as componentes
71
5.1. Introdução e Motivação
de ruído. Esta abordagem apresenta-se como uma solução invariante no tempo muito
eficiente, sendo os seus parâmetros definidos tendo em conta as características de largura
de banda complementares dos sensores cuja informação se pretende fundir.
Para uma melhor compreensão, considere-se que H1 (s) é um filtro passa-baixo de
primeira ordem
k
,
(5.7)
H1 (s) =
s+k
então (5.5) é reescrita como
Ŝ = S +
k
s
N1 +
N2 .
s+k
s+k
(5.8)
Da equação (5.8), torna-se trivial perceber que o parâmetro k vai determinar a
frequência de corte que molda o filtro, e que necessita de ser ajustado tendo em conta a
largura de banda do ruído. As alterações em k vão somente afectar a filtragem do ruído,
no entanto, o sinal s(t) não vai sofrer qualquer alteração. Ficando assim ao cargo de
quem determina o valor de k, tendo em conta as características dos sensores disponíveis,
o efeito que os termos de ruído têm na estimativa ŝ(t).
Pode-se afirmar que a determinação do parâmetro k é independente dos parâmetros
que modelam o método de síntese. Os referidos parâmetros podem ser vistos como botões de afinação, relacionados com um determinado critério que moldam a resposta em
frequência. A análise das funções de transferência pode ser feita recorrendo aos clássicos
diagramas de Bode.
O exemplo apresentado nos parágrafos anteriores é demasiado simples (i.e., tem
poucos graus de liberdade), assim, para cumprir com restrições adicionais de algumas
aplicações (como a aplicação em sistemas de navegação), a ordem do filtro pode ser
estendida. A extensão da ordem do filtro vai possibilitar novos graus de liberdade para
moldar a resposta em frequência, podendo melhorar a filtragem do ruído, sem nunca
introduzir distorção no sinal.
Aplicação da Filtragem Complementar em Sistemas de Navegação
Os filtros complementares têm sido bastante utilizados na resolução de problemas
de fusão sensorial em sistemas de navegação. A sua formulação no domínio da frequência
e estrutura simples, permite uma implementação e teste pouco complexa em hardware
digital ou até mesmo analógico, como é o caso das primeiras aplicações na década de
1950 [110, 81, 78]. São algoritmos muito apelativos, visto que, não têm requisitos de
hardware computacional muito dispendiosos, são simples, fiáveis e robustos. Portanto,
a sua implementação em veículos autónomos representa uma escolha lógica. Alguns
exemplos de trabalhos publicados com plataformas autónomas, que recorrem a filtros
complementares, são: veículos oceânicos [114, 115, 116], helicópteros de aeromodelismo
[117], aeronaves de asa fixa [44, 118].
A característica da largura de banda complementar está presente nos sensores utilizados. Para a posição, o sinal do GPS e a dupla integração da força específica são
complementares. Para a atitude sucede o mesmo entre as medidas obtidas a partir do
sensor magneto-pendular e as medidas da integração das leituras dos giroscópios.
72
O filtro determina um sinal de erro entre a estimativa e uma referência calculada
directamente a partir de um dos sensores. Um valor escalado deste erro é de seguida
realimentado.
Sendo sensores inerciais, quer os giroscópios, quer os acelerómetros fornecem medidas relativas ao referencial inercial expressas no referencial do corpo. Deste modo, o
filtro complementar apresenta a estimação da posição e da orientação em relação a um
referencial inercial.
A medida dos giroscópios e dos acelerómetros é afectada por polarizações que têm
de ser compensadas introduzindo a dinâmica baseada nas relações cinemáticas de um
corpo rígido no modelo do filtro.
Nas Secções 5.2 e 5.3 vão ser apresentados em detalhe os filtros complementares
de atitude e posição respectivamente. Os filtros de navegação propostos estão também
descritos em duas publicações [119, 120], em que o autor do presente trabalho é co-autor.
É dada especial ênfase às características de estabilidade (a região de atracção é caracterizada explicitamente), desempenho e implementação prática do algoritmo do filtro. A
estrutura do sistema de navegação baseado em filtros complementares, apresentada na
Figura 5.2, consiste num filtro de atitude e num filtro de posição. Formulado em tempo
discreto, as entradas do filtro de atitude são as leituras dos giroscópios de velocidade,
corrompidas por polarizações e uma medida instantânea de atitude baseada em observações vectoriais (campo magnético terrestre e medidas pendulares). O filtro de posição
recorre às medidas dos acelerómetros e a medidas de GPS, para estimar a velocidade no
referencial do Corpo e a posição no referencial da Terra.
"$
"
#
"
Figura 5.2: Arquitectura global do sistema de navegação.
A representação da orientação através de ângulos de Euler é escolhida como variáveis
de estado para o filtro de atitude, devido à sua simplicidade, e são adoptados ganhos de
realimentação estacionários na síntese de filtro. As características intrínsecas multi-ritmo
do conjunto de sensores utilizados são tratadas analiticamente e uma metodologia de
síntese baseada em resultados de optimalidade para sistemas periódicos é apresentada.
O algoritmo que produz as medidas instantâneas de atitude, designado por Estimador
73
5.2. Filtro Complementar de Atitude
de Atitude Magneto-Pendular (denominado na literatura anglo-saxónica por MagnetoPendular Sensor, MPS) [121], foi descrito na Secção 3.4.2.
5.2
Filtro Complementar de Atitude
Na presente secção, propõe-se um filtro complementar com o propósito de estimar a
atitude da plataforma. As suas características de estabilidade e desempenho são também
deduzidas, sendo também justificada a utilização de ferramentas de análise no domínio
da resposta em frequência, atendendo às características espectrais dos sensores inerciais
e dos sensores auxiliares.
Com o objectivo de facilitar a leitura
texto, definem-se novamente
i
h do presente
′
algumas grandezas importantes. Seja λ̄ = ψ̄ θ̄ φ̄ o vector que contém os ângulos de
Euler designados por ângulos de yaw, pitch e roll, respectivamente [60]. A cinemática
dos ângulos de Euler é descrita por


0 sin φ sec θ cos φ sec θ

˙ = Q(λ̄)ω̄, Q(λ) = 
λ̄
cos φ
− sin φ  .
0
1 sin φ tan θ cos φ tan θ
(5.9)
onde ω̄ é a velocidade angular do corpo expressa nas coordenadas do referencial do corpo.
O equivalente em tempo discreto do sistema (5.9) aqui considerado, é obtido com recurso
ao método de Euler [122] com a parcela do lado direito sujeita a um retentor de amostras
(sample-and-hold ), resulta em
λ̄k+1 = λ̄k + T Q(λ̄k )ω̄ k ,
(5.10)
onde T é o período de amostragem e o índice k é a abreviação a constante de tempo
t = kT . Neste trabalho, a estimação da atitude é conseguida explorando a velocidade
angular e as medidas de atitude fornecidas pelos sensores inerciais. A velocidade angular
é obtida através das medidas fornecidas pelos giroscópios de velocidade que são afectadas
por ruído e por polarizações do tipo random-walk [108],
ω r k = ω̄ k + b̄ω k + wωr k ,
b̄ω k+1 = b̄ω k + wb k ,
(5.11)
onde wωr ∼ N (0, Ξω ) é ruído branco Gaussiano com valor esperado igual a zero e b̄ω é a
polarização do sensor excitado por ruído branco Gaussiano wb ∼ N (0, Ξb ). Reescrevendo
a cinemática dos ângulos de Euler (5.10-5.11) no formato de variáveis de estado, fica
"
#
# "
#" # "
#
"
#"
I −T Q(λ̄k ) λ̄k
λ̄k+1
T Q(λ̄k )
−T Q(λ̄k ) 0 wωr k
. (5.12)
=
+
ωr k +
0
I
wb k
b̄k+1
0
0
I
b̄k
74
Considere-se o seguinte sistema realimentado não linear como o filtro de atitude
proposto
"
# "
#" # "
#
λ̂k+1
I −T Q(λ̄k ) λ̂k
T Q(λ̄k )
=
+
ωr k
b̂k+1
0
I
b̂k
0
"
#
Q(λ̄k )(K1λ − I) + Q(λ̄k−1 )
+
(yλ k − ŷλ k ),
K2λ
ŷλ k = Q−1 (λ̄k−1 )λ̂k ,
(5.13a)
yλ k = Q−1 (λ̄k−1 )λ̄k + vλ k ,
(5.13b)
onde yλ k é o vector dos ângulos de Euler observados e transformados para o espaço das
velocidades angulares e corrompidas por ruído branco Gaussiano de observação vλ ∼
N (0, Θλ ), e K1λ , K2λ ∈ M(3, 3) representam as matrizes dos ganhos de realimentação. O
diagrama de blocos do filtro de atitude proposto é apresentado na Figura. 5.3.
Figura 5.3: Filtro complementar de atitude.
A observação de atitude yλ pode ser determinada a partir de dois vectores medidos
no referencial do corpo, tais como o Campo Gravítico e Magnético terrestres ou também
por observações fornecidas por outros dispositivos como por exemplo sensores de visão
ou star trackers.
O problema de determinar a atitude com o auxílio de medidas vectoriais é conhecido,
na literatura, como o Problema Procrustes Ortogonal [123] ou como o Problema de Wahba
[124] tendo sido objecto de intensivo estudo, o que originou várias soluções propostas ao
do longo tempo (consultar [97, 123] e referências inclusas). A solução proposta neste
trabalho calcula as observações dos ângulos de Euler fazendo uso de uma abordagem do
tipo TRIAD [125] determinística. Considere-se o seguinte sistema linear invariante no
tempo auxiliar
"
# "
#"
# "
#"
#
xλ k+1
I −T I xλ k
−T I 0 wωr k
=
+
,
0
I
xb k+1
0
I
xb k
wb k
#
"
h
i x
λk
+ vλ k ,
yx k = I 0
xb k
(5.14)
75
que vai ser utilizado seguidamente como o setup para o desenvolvimento no domínio da
resposta em frequência para o filtro de atitude variante no tempo (5.13). Na técnica de
síntese proposta, os ganhos de realimentação K1λ e K2λ em (5.13) são identificados com os
ganhos de Kalman estacionários para o sistema (5.14), onde as matrizes da covariância
Ξω , Ξb e Θλ representam como que botões de afinação (tuning knobs) para moldar a
resposta em frequência desejada do filtro de atitude.
O sistema invariante no tempo (5.14) adoptado para a determinação dos ganhos
de realimentação e da resposta em frequência do filtro, é similar à cinemática de atitude (5.12) para Q(λ) = Q(0). Embora, numa primeira análise, este facto sugira que
as propriedades do filtro proposto possam ser limitadas ao caso especifico de λk = 0, o
filtro é na realidade assimptoticamente estável para qualquer trajectória de atitude parametrizada por configurações não-singulares de ângulos de Euler. As propriedades de
estabilidade para o caso específico dos ângulos de Euler Z-Y-X são derivadas no teorema
que se apresenta seguidamente. No entanto a extensão deste resultado é imediata para
outras convenções de ângulos de Euler [60].
Teorema 1. Seja K1λ e K2λ os ganhos de Kalman estacionários para o sistema (5.14)
e assuma-se que o ângulo de roll descrito pela plataforma é majorado, |θ| ≤ θmax < π2 .
Então, o filtro complementar de atitude (5.13) uniformemente assimptoticamente estável
(UAE).
Demonstração. Seja λ̃k = λ̄k − λ̂k , b̃ω k = b̄ω k − b̂ω k a representação dos erros de
estimação. A dinâmica de erro associada é dada por
# "
#" #
"
Q(λ̄k )(I − K1λ )Q−1 (λ̄k−1 ) −T Q(λ̄k ) λ̃k
λ̃k+1
=
−K2λ Q−1 (λ̄k−1 )
I
b̃k
b̃k+1
"
#"
#
−T Q(λ̄k ) 0 wωr k
+
wb k
0
I
#
"
Q(λ̄k )(I − K1λ ) − Q(λ̄k−1 )
vλ k .
(5.15)
+
−K2λ
Por definição, o filtro é dito como sendo UAE se a origem do sistema (5.15) é UAE
na ausência de ruídos de observação e de estado [126]. Contudo, os ruídos de estado e de
observação são explicitados por conveniência. O sistema (5.14) pode ser escrito de forma
mais compacta na sua formulação em espaço de estados
h
onde xk = x′λ k
xk+1 = Fxk + Gwk , yk = Hxk + vk ,
i′
h
i′
x′b k , wk = wω′ r k wb′ k , yk = yx k , vk = vλ k ,
"
#
"
#
h
i
I −T I
−T I 0
F=
, G=
, e H= I 0 .
0
I
0
I
(5.16)
É relativamente simples provar que [F, H′ ] é detectável e [F, G] é completamente
estabilizável, então o sistema em malha fechada
x̃k+1 = (F − KH)x̃k + Gwk − Kvk ,
(5.17)
76
h
i′
′
′
onde K = K1λ
, é UAE [127]. Defina-se a transformação de variáveis de Lyapunov
K2λ
"
#
"
#
x̃λ k
λ̃x k
,
= Tk
x̃b k
b̃x k
"
#
Q(λ̄k−1 ) 0
Tk =
,
0
I
(5.18)
que está bem definida [128] porque θ é assumido limitado. Aplicando a transformação de
variáveis Tk a (5.17) fica
"
"
#
#
λ̃x k+1
−1 λ̃x k
+ Tk+1 Gwk − Tk+1 Kvk
= Tk+1 (F − KH)Tk
b̃x k
b̃x k+1
"
#"
#
Q(λ̄k )(I − K1λ )Q−1 (λ̄k−1 ) −T Q(λ̄k ) λ̃x k
=
−K2λ Q−1 (λ̄k−1 )
I
b̃x k
#
# "
"
Q(λ̄k )K1λ
−T Q(λ̄k )wωr k
vλ k .
−
+
K2λ
wb k
(5.19)
A origem de (5.17) é UAE e, pelas propriedades das transformações de Lyapunov, a
origem de (5.19) é UAE . Então, a origem de (5.15) é uniformemente assimptoticamente
estável, com pretendido.
Os resultados de estabilidade do Teorema 1 podem facilmente ser estendidos para o
caso em que se têm ganhos de Kalman variantes no tempo. Contudo, o filtro complementar proposto é desenhado no domínio da frequência, através de uma formulação invariante
no tempo (5.14), para obter a função de transferência desejada que consiga fundir os conteúdos espectrais de baixa frequência das observações de atitude com a informação de
alta frequência contida nas medidas dos sensores angulares de velocidade. São adoptados
ganhos de Kalman estacionários para se obter um filtro assimptoticamente estável, que
permite uma fácil implementação e teste em hardware de baixo custo. De notar que, em
condições de operação encontradas em algumas aplicações terrestres e oceânicas, o filtro
proposto (5.13) é também óptimo. Este resultado é apresentado no teorema seguinte.
Teorema 2. Sejam as perturbações em (5.12) e (5.13b) caracterizadas pelos ruídos brancos Gaussianos wωr ∼ N (0, Ξω ), wb ∼ N (0, Ξb ) e vλ ∼ N (0, Θλ ), respectivamente, e
assuma-se que os ângulos de pitch e roll são constantes. Então, o filtro de atitude complementar (5.13) é o filtro de Kalman estacionário para o sistema (5.12) no sentido em
que os ganhos de realimentação de Kalman Kopt k convergem assimptoticamente tal como
se apresenta em seguida
#
"
Q(λ̄k )(K1λ − I) + Q(λ̄k−1 ) (5.20)
lim Kopt k −
= 0.
k→∞ K2λ
Demonstração. A matriz da covariância do erro de estimação do filtro de Kalman para
o sistema (5.14) satisfaz
′
Pxλ k+1|k = FPxλ k|k−1 F′ + GΞG′ − FPxλ k|k−1 H′ S−1
P λ k HPxλ k|k−1 F ,
(5.21)
77
onde SP λ k = HPxλ k|k−1 H′ + Θλ , Ξ = Ξ0ω Ξ0b , consultar referências [126, 127] para a
demonstração de (5.21).
h Dadas
i as variáveis
de transformação (5.18), a matriz da covariλ̃x k+1
′
ância Σxλ k+1|k = E b̃
[ λ̃x k+1 b̃′x k+1 ] é dada por Σxλ k+1|k = Tk+1 Pxλ k+1|k T′k+1 e,
x k+1
utilizando (5.21), satisfaz
′
T−1
k+1 Σxλ k+1|k Tk+1
−1
′
− FT−1
k Σxλ k|k−1 Tk
′
= FT−1
k Σxλ k|k−1 Tk
−1
−1
−1
H′ S−1
P k HTk Σxλ k|k−1
⇓
F′ + GΞG′
−1 ′
F
T′k
Σxλ k+1|k = Zk Σxλ k|k−1 Z′k + Tk+1 GΞG′ T′k+1
−1 ′ −1
′
− Zk Σxλ k|k−1 T′k
H SΣλ k HT−1
k Σxλ k|k−1 Zk ,
′ −1
onde SΣλ k = HT−1
H′ + Θλ , e Zk = Tk+1 FT−1
k Σxλ k|k−1 (Tk )
k . Com um ligeiro abuso
de notação, sejam K1λ k e K2λ k a representação dos ganhos óptimos variantes no tempo
para o sistema (5.14). Formulando o filtro de atitude (5.13) com ganhos variantes no
tempo, obtém-se
"
#
#" # "
# "
T Q(λ̄k )
I −T Q(λ̄k ) λ̂k
λ̂k+1
ωr k
+
=
b̂k
b̂k+1
0
0
I
"
#
Q(λ̄k )(K1λ k − I) + Q(λ̄k−1 )
+
(yλ k − ŷλ k ).
K2λ k
(5.22)
A prova de optimalidade é conseguida mostrando que i) Σxλ k+1|k é a covariância do
erro do filtro de atitude (5.22) e que ii) Σxλ k+1|k é a covariância do erro do filtro óptimo
para a cinemática da atitude (5.12). Se estas condições forem verificadas, o filtro de
Kalman óptimo e estacionário para a cinemática de atitude (5.12) são respectivamente
dados pelos filtros de atitude complementares (5.13) e (5.22). Para uma discussão sobre
a optimalidade do filtro de Kalman e sobre a unicidade dos ganhos óptimos, sugere-se a
leitura de [126, 127].
A condição de ângulos de pitch e de roll constantes implica que Q(λ̄k+1 ) = Q(λ̄k ), e
′
′
portanto as cinemáticas (5.15) e (5.19) são idênticas, [λ̃x k b̃′x k ]′ = [λ̃k b̃′k ]′ and Σxλ k+1|k
é a covariância do erro do filtro de atitude (5.22).
A matriz Σxλ k+1|k é a covariância do erro do filtro de Kalman para o sistema
zk+1 = Zk zk + Tk+1 Gwz k ,
yz k = HT−1
k zk + vz k ,
(5.23)
onde zk ∈ R6 , wz ∼ N (0, Ξ), vz ∼ N (0, Θλ ). Utilizando Q(λ̄k+1 ) = Q(λ̄k ), as matrizes
do sistema (5.23) são dadas por
"
#
"
#
I −T Q(λ̄k )
−T Q(λ̄k ) 0
Zk =
, Tk+1 G =
,
0
I
0
I
h
i
−1 (λ̄
HT−1
=
,
Q
)
0
k−1
k
que são as matrizes de espaço de estados da cinemática de atitude (5.12) com a observação
de atitude dada por (5.13b). Consequentemente, o filtro de atitude (5.22) produz a
78
matriz da covariância do erro de estimação óptima Σxλ k+1|k para o sistema (5.12) e, pela
unicidade do filtro óptimo, o filtro de atitude (5.22) é um filtro de Kalman. Recorrendo a
K1λ k → K1λ e K2λ k → K2λ quando k → ∞, obtém-se (5.20), que completa a prova.
Os resultados de optimalidade do filtro complementar apresentados no Teorema 2
são válidos para aplicações onde os ângulos de pitch e de roll são constantes ou, por razões
práticas, podem ser considerados aproximadamente constantes. Para o caso de ângulos
de picth e de roll variantes no tempo, o desempenho do filtro complementar e dos filtros
óptimos pode ser comparada offline calculando as covariâncias dos erros de estimação dos
filtros, como está detalhado em [127]. Mais à frente neste trabalho, a optimalidade dos
ganhos de realimentação adoptados no processamento dos dados experimentais obtidos a
bordo do catamaran DELFIMx é analisada.
Embora os resultados de optimalidade para o filtro complementar sejam apresentados no Teorema 2, a síntese dos ganhos de realimentação é conseguida no domínio da
resposta em frequência devido às características dos sensores auxiliares de atitude em
estudo. Esta abordagem explora a região das baixas frequências onde as observações de
atitude são tipicamente mais precisas, sendo a região das altas frequências preenchida pela
integração dos giroscópios de velocidade, onde originam medidas de melhor qualidade.
5.3
Filtro de Posição
A cinemática em tempo continuo é dada por
p̄˙ = v̄,
v̄˙ = R̄B ā,
(5.24)
onde p̄ e v̄ são a posição e a velocidade no referencial da Terra, B ā é a aceleração no
referencial do corpo e R̄ representa a matriz de rotação entre o referencial do corpo {B}
e o referencial da Terra {E}, logo R̄ = E
B R.O equivalente em tempo discreto é obtido por
sample-and-hold das entradas [122] e é dado por
p̄k+1 = p̄k + T v̄k +
T2 B
R̄k āk ,
2
v̄k+1 = v̄k + T R̄k B āk .
(5.25)
Tal como foi apresentado na Secção 3.2.2 o acelerómetro mede uma grandeza denominada
por força especifica, que se define como a diferença entre as acelerações inercial e gravítica
do corpo rígido [94], B ak e B gk respectivamente, expressas no referencial do corpo,
fk = B ak − B gk + wf ,
(5.26)
onde wf ∼ N (0, Ξa ) é um ruído branco Gaussiano de média zero. A cinemática de
posição (5.25), recorrendo às medidas dos acelerómetros, é descrita por
"
#
# "
#"
# "
T2
R̄
I
T R̄k
p̄k+1
p̄k
k
2
(f + R̄′k E ḡ)
=
+
′
′
B v̄
B v̄
T
R̄
R̄
0
R̄
R̄
k+1
k
k+1 k
k+1 k
"
#
#"
T2
I
− 2 R̄k
wp k
+
,
′
0 −T R̄k+1 R̄k wf k
(5.27)
79
5.3. Filtro de Posição
onde B v̄k = R̄′k v̄k+1 é a velocidade expressa no referencial do corpo e wp ∼ N (0, Ξp ) é
um ruído branco Gaussiano de média zero que modela pequenas perturbações na posição.
O observador da cinemática de posição, ilustrado na Figura 5.4, é escrito como
"
# "
#"
# "
#
T2
I
T R̄k
p̂k+1
R̄
p̂k
k
2
=
+
(f + R̄′k E ḡ)
′
B v̂
′
B
0 R̄k+1 R̄k
T R̄k+1 R̄k
v̂k
k+1
#
"
K1 p
(yp k − ŷp k ),
+
′
R̄k+1 K2 p
ŷp k = p̂k ,
(5.28a)
(5.28b)
yp k = p̄k + vp k ,
onde yp k é a medida de posição fornecida pelo receptor de GPS e vp ∼ N (0, Θp ) é ruído
Gaussiano de observação de média zero. A força de propulsão do veículo é, em geral,
orientada fisicamente ao longo dos eixos que se encontram solidários com o corpo, produzindo movimentos cujas direcções são predominantes ao longo dos eixos do mesmo. Como
Figura 5.4: Filtro complementar de posição.
exemplo, atente-se na situação em que os propulsores estão montados e actuam ao longo
do eixo do x do corpo, as principais variações de velocidade são naturalmente expressas ao longo desse eixo. Também elevadas velocidades, devido a manobras agressivas,
introduzem alterações de alta frequência na velocidade quando expressa no referencial
da Terra, enquanto a velocidade no referencial do corpo mantém-se alinhada com direcção predominante de movimento do veículo. Como exemplo, se a velocidade medida no
referencial do corpo de um navio se mantém constante enquanto este descreve um movimento circular uniforme, as componentes do vector de velocidade no referencial da Terra
são sinusoidais. Consequentemente, as estimativas de velocidade do filtro de posição são
expressas nas coordenadas do referencial do corpo, em oposição a serem expressas no
referencial da Terra, com o objectivo de reduzir os requisitos de largura de banda em
situações de variações de atitude e actuação no veículo.
80
Os termos de realimentação K1 p e K2 p são identificados como aos ganhos de Kalman
para o sistema
#
#"
# "
# "
#"
"
2
wp k
I − T2
I T I xp k
xp k+1
,
+
=
wv k
0 −T
xv k
0 I
xv k+1
"
#
(5.29)
h
i x
pk
yx k = I 0
+ vp k ,
xv k
onde wv ∼ N (0, Ξa ) é um ruído branco Gaussiano de média nula com a covariância do
ruído do acelerómetro war . Na síntese do filtro de posição, as matrizes da covariância Ξp ,
Ξa , e Θp são utilizadas como tuning knobs para moldar a resposta em frequência do filtro.
A estabilidade e desempenho do filtro complementar de posição (5.28) são abordadas nas
proposições seguintes.
Teorema 3. Sejam K1 p e K2 p os ganhos de Kalman estacionários para o sistema (5.29).
Então o filtro complementar de posição (5.28) é UAE.
Demonstração. A estrutura da prova é semelhante à do Teorema 1. Definam-se os erros
de estimação p̃k = p̄k − p̂k e B ṽk = B v̄k − B v̂k . A cinemática associada é descrita por
"
#"
#
# "
I − K1p
T R̄k
p̃k
p̃k+1
=
B ṽ
−K2p R̄′k+1 R̄k B ṽk
k+1
# "
#
#"
"
2
K1p
wp k
I
− T2 R̄k
−
vp k .
+
R̄′k+1 K2p
0 −T R̄′k+1 R̄k war k
(5.30)
A formulação compacta em espaço de estados para o sistema (5.29) é descrito como
xk+1 = Fxk + Gwk ,
yk = Hxk + vk ,
(5.31)
h
i′
h
i′
onde xk = x′p k x′v k , wk = wp′ k wv′ k , yk = yx k , vk = vp k , F = [ 0I TII ], G =
h
i
h
i
2
I − T2 , e H =
I 0 . Os pares [F, H′ ] e [F, G] são detectáveis e completamente
0 −T
estabilizáveis, respectivamente. Logo, o sistema em malha fechada
x̃k+1 = (F − KH)x̃k + Gwk − Kvk ,
(5.32)
′
onde K = K′1p K′2p , é UAE [127]. Defina-se a transformação de variáveis de Lyapunov,
adoptada em [129], dado por
"
#
"
#
x̃p k
p̃k
,
= Tk
x̃v k
ṽk
Tk =
"
#
I 0
,
0 R̄k
(5.33)
e considere-se wv k = R̄k war k . Aplicando a transformação de Lyapunov a (5.32) fica
(5.30), então a origem de (5.30) é uniformemente assimptoticamente estável pela propriedades das transformações de Lyapunov [128].
5.3. Filtro de Posição
81
No seguinte teorema mostra-se que o filtro de posição é óptimo para a cinemática de posição (5.28), sob o pressuposto ligeiro de que os ruídos brancos Gaussianos da
tríade de acelerómetros são estocasticamente independentes, e caracterizados pela mesma
variância. Esta condição verifica-se em setups realísticos onde as medidas de força especifica são fornecidas por três acelerómetros, do mesmo fabricante e modelo, montados
ortogonalmente.
Teorema 4. Sejam as perturbações em (5.27) e (5.28b) caracterizadas por ruídos brancos
Gaussianos wp ∼ N (0, Ξp ), war ∼ N (0, ξa I), e vp ∼ N (0, Θp ). Então o filtro complementar de posição (5.28) é o filtro de Kalman estacionário para o sistema (5.27) no
sentido em que o ganhos de Kalman de realimentação Kopt k converge assimptoticamente
como se segue
#
"
K
1p
(5.34)
lim Kopt k −
= 0.
′
k→∞ R̄k+1 K2 p Demonstração. A matriz da covariância do erro de estimação do filtro de Kalman para
o sistema (5.31) satisfaz
′
Pxp k+1|k = FPxp k|k−1 F′ + GΞG′ − FPxp k|k−1 H′ S−1
(5.35)
P p HPxp k|k−1 F ,
onde SP p = HPxp k|k−1 H′ + Θ, Ξ = Ξ0p Ξ0a . Fazendo uso de um ligeiro abuso de notação,
sejam K1p k e K2p k a representação dos ganhos óptimos variantes no tempo do sistema
(5.29). Formule-se o filtro de posição (5.28) com ganhos variantes no tempo
"
# "
#"
# "
#
T2
p̂k+1
p̂k
I
T R̄k
R̄k
2
=
+
(f + R̄′k E ḡ)
B v̂
B v̂
′
′
R̄
0
R̄
R̄
T
R̄
k+1
k
k+1 k
k+1 k
"
#
K1p k
+
(yp k − ŷp k ),
R̄′k+1 K2p k
(5.36)
Aplicando
de Lyapunov (5.33), a matriz da covariância Σpk+1|k =
h
i a transformação
p̃k+1
′
′
E ṽk+1 [ p̃k+1 ṽk+1 ] é dada por Σpk+1|k = Tk+1 Px k+1|k T′k+1 e satisfaz
′ −1 ′ ′
F Tk+1 + Tk+1 GΞG′ T′k+1
Σpk+1|k = Tk+1 FT−1
k Σpk|k−1 Tk
−1
′ −1
′ −1
′ −1 ′ ′
− Tk+1 FT−1
Σ
H
S
HT
Σ
T
F Tk+1 ,
T
p
k|k−1
pk|k−1
k
k
k
Σp k
k
(5.37)
′ −1
onde SΣp k = HT−1
H′ + Θ. Assumindo que a matriz da covariância do
k Σpk|k−1 (Tk )
ruído dos acelerómetros é diagonal, Ξa = ξa I, as matrizes em (5.37) são dadas por
#
"
h
i
I
T R̄k
−1
−1
, HTk = I 0 ,
Tk+1 FTk =
0 R̄′k+1 R̄k
#
"
Ξp 0
′ ′
G′ T′k+1
Tk+1 GΞG Tk+1 = Tk+1 G
0 Ξa
#
"
Ξp
0
G′ T′k+1
= Tk+1 G
′
0 R̄k Ξa R̄k
#"
#"
#′
"
2
2
I
− T2 R̄k
Ξp 0
I
− T2 R̄k
,
=
0 Ξa 0 −T R̄′k+1 R̄k
0 −T R̄′k+1 R̄k
82
o que evidencia que Σpk+1|k é a matriz da covariância do erro óptima para a cinemática
de posição (5.27). Utilizando K1p k → K1p e K2p k → K2p quando k → ∞ produz (5.34)
e completa a prova.
Embora sejam apresentados resultados de optimalidade para o filtro de posição, o
sistema em malha fechada é obtido com síntese no domínio da frequência, e os ganhos
de realimentação K1 p e K2 p são os ganhos de Kalman estacionários para o sistema
(5.29). Neste enquadramento, os conteúdos espectrais de alta frequência das medidas
dos acelerómetros são explorados, removendo por filtragem os erros na compensação da
gravidade e das polarizações. Completa-se o espectro da saída do filtro fazendo uso da
informação de baixa frequência disponibilizada pelas observações de posição do GPS.
5.4
Implementação
5.4.1
Estimador de Atitude Magneto-Pendular
Por conveniência na leitura, apresenta-se em seguida, de forma sintética, os passos
da implementação analítica do MPS:
• Remoção da aceleração centrípeta das leituras do acelerómetro f = [fx , fy , fz ]′
f̂ = f − ω × B v.
• Cálculo dos ângulos de pitch (θ) e roll (φ) com f̂ = [fˆx , fˆy , fˆz ]′
φ = arctan2 −fˆy , −fˆz ,

!
ˆx sin φ

f


, sin φ 6= 0

arctan − fˆ
y
!
θ=
.
ˆx cos φ

f


, cos φ 6= 0

arctan − fˆ
(5.38)
(5.39)
z
• Cálculo do ângulo de yaw (ψ)
Medida do magnetómetro
B
mr = R′X (φ)R′Y (θ)R′Z (ψ)E m̄ + nm .
Medida do magnetómetro projectada no plano x-y do referencial {E}
Ea
m = RY (θ)RX (φ)B mr .
(5.40)
(5.41)
Ângulo de yaw
ψ = arctan2
E
m y Ea m x − E m x Ea m y , E m x Ea m x + E m y Ea m y .
(5.42)
onde E m̄ é conhecido e representa o campo magnético Terrestre expresso no referencial {E}, nm é o ruído na medida do magnetómetro, RX (φ), RY (θ), e RZ (ψ)
representam as matrizes de rotação elementares de roll, pitch, e yaw, respectivamente.
5.4. Implementação
5.4.2
83
Acoplamento do Filtro Complementar
O sistema de navegação proposto integra os filtros complementares de atitude e de
posição para produzir uma estimativa da atitude e da posição do veículo. Os blocos apresentados no diagrama da Figura 5.2 já foram detalhados anteriormente neste trabalho: os
filtros complementares de atitude e posição são descritos nas Secções 5.2 e 5.3 e são ilustrados nas Figuras 5.3 e 5.4, respectivamente, e os blocos do Sensor Magneto-Pendular
e da Remoção da Aceleração Centrípeta são descritos na Secção 3.4.2. Os termos de
atitude na cinemática do filtro de posição e a utilização de medidas pendulares no MPS
produzem acoplamentos entre os filtros de atitude e posição, ilustrado pelas ligações entre
blocos na Figura 5.2, e que são descritos de seguida.
A matriz de rotação de atitude R̄k e o termo de actualização (update) de atitude
′
R̄k+1 R̄k são adoptados na cinemática do filtro de posição (5.28), como ilustrado no diagrama de blocos da Figura 5.4. O termo de atitude R̄k é obtido pelo filtro de atitude,
pois é a melhor estimativa de atitude disponível na implementação prática do sistema
de navegação. O termo de actualização descrito por R̄′k+1 R̄k ≈ e−T [ωr k −b̂ω k ×] é obtido
utilizando a medida do giroscópio de velocidade e a estimativa da sua polarização, onde
[a×] é a matriz skew simétrica definida pelo vector a ∈ R3 de forma a que [a×] b = a × b,
b ∈ R3 . Da mesma forma, a matriz Q(λ̄k ) é construída recorrendo à melhor estimativa
de atitude a cada instante k, que é dado pelo filtro de atitude.
As medidas gravíticas utilizadas no cálculo da medida de atitude yλ são sujeitas à
distorção causada pelas acelerações lineares e angulares. Como uma forma de tornar mais
robusta a medida de atitude yλ , as acelerações angulares são compensadas recorrendo às
velocidades angular e linear como se mostra em (5.38), permitindo leituras válidas do
MPS mesmo na presença de acelerações centrípetas que ocorrem até em condições de
trimming tais como, trajectórias helicoidais.
As propriedades teóricas de estabilidade e desempenho dos filtros de posição e atitude demonstradas nas Secções 5.2 e 5.3 não podem ser generalizadas para o sistema
de navegação total devido ao acoplamento do filtro e devido à utilização de medidas
pendulares na observação auxiliar de atitude. Esta limitação é consequência dos sensores de atitude auxiliares escolhidos, sendo possível garantir a estabilidade e desempenho
com outros setups experimentais, e.g. recorrendo a sensores não pendulares, sensores
auxiliares baseados em visão e desacoplando os filtros de atitude e de posição fazendo
uso de unidades de referência de atitude externas. Para a implementação do sistema de
navegação proposto, simulações de Monte Carlo intensivas mostraram que na prática a
arquitectura é estável.
5.4.3
Filtragem Multi-Ritmo
Em geral, a frequência de amostragem do GPS é inferior à frequência de amostragem
dos sensores inerciais. Neste contexto, os ganhos de realimentação óptimos são obtidos
considerando o filtro de posição multi-ritmo como um estimador periódico, e adoptando os
resultados de optimalidade para sistemas periódicos demonstrados em [130]. Por motivos
de clareza, a estrutura multi-ritmo para o filtro de posição será descrita de forma breve
nas linhas seguintes. Sejam os períodos de amostragem do GPS e dos sensores inerciais
representados por TGPS e TINS , respectivamente, e defina-se o rácio nT = TTGPS
, nT ∈ N.
INS
84
O sistema (5.14) é periódico com periodo nT e pode ser escrito de forma compacta como
xk+1 = Fxk + Gwk ,
(5.43)
yk = Hk xk + vk ,
h
i′
h
i′
onde xk = x′λ k x′b k , wk = wω′ k wb′ k , yk = yx k , vk = vλ k , F = 0I −TI I ,
G = −T0 I 0I , e a matriz de observação do sistema é dada por
(
[I 0] if nkT ∈ N0 ,
Hk =
(5.44)
[0 0] otherwise.
O sistema (5.43) pode ser associado com um sistema invariante no tempo que modela
a dinâmica do estado no instante k = inT , i ∈ N0 , descrito por
xk+1 = F xk + G wk ,
(5.45)
yk = H xk + D wk + vk ,
onde xk = xknT , xk ∈ R6 ,
wk =
h
′
wkn
T
′
wkn
T +1
...
′
w(k+1)n
t −1
i′
h
i′
′
′
′
vk = vkn
v
...
v
knT +1
(k+1)nt −1 ,
T
h
i′
′
′
′
yk = ykn
y
...
y
knT +1
(k+1)nt −1 ,
T
,
wk ∈ R6nT ,
vk ∈ R3nT ,
yk ∈ R3nT ,
são os vectores de ruídos e de medidas aumentados, respectivamente, e
F = FnT , F ∈ M(6, 6),
h
i
G = FnT −1 G FnT −2 G ... G , G ∈ M(6, 6nT ),
i′
h
H = H′0 F′ H′1 ... FnT −1 ′ H′nT −1 , H ∈ M(3nT , 6),

0
0
···
···
0
..
H1 G
0
.


..  , D ∈ M(3n , 6n ),
D=
T
T
H2 FG
H2 G 0
.

..
. . . . . . .. 
.
.
HnT −1 FnT −1 G
···
··· HnT −1 G 0
que define um sistema invariante no tempo, com ruídos de medida e de estado correlacionados [130]. O ganho de realimentação óptimo para o sistema invariante (5.45) é dado
por
−1
K = [F P H′ + G Ξ D′ ] [Θ + D Ξ D′ + H P H′ ]
,
(5.46)
onde K ∈ M(6, 3nT ), Ξ = E(wk w′k ), Θ = E(vk v′k ), e a matriz P representa a covariância
estacionária do erro de estimação óptimo, dada pela solução da equação de Riccati
P = F∗ P F′∗ + G∗ G′∗ − F∗ P H′ S−1 H P F′∗ ,
85
5.4. Implementação
−1
onde S = Θ + D Ξ D′ + H P H′ , G∗ G′∗ = G Ξ G′ − G Ξ D′ [Θ + D Ξ D′ ] D Ξ G′ e F∗ =
′ −1
F − GΞD′ [Θ + D Ξ D
i a segmentação do ganho de realimentação
h ] H. Considerando
(5.46) dado por K = K0 K1 ... KnT −1 , Ki ∈ M(6, 3), i ∈ N0 , para o sistema (5.435.44), pode ser facilmente
provado
h
i que D = 0, Ki = 0, i 6= 0, e que então o ganho de
′
realimentação Kp = K′1 p K′2 p é simplesmente obtido por selecção da sub-matriz K0
e propagando para trás até ao instante de tempo da medida de GPS, i.e. Kp = F1−nT K0 .
Para mais detalhes sobre a síntese de estimadores óptimos para sistemas periódicos
lineares de tempo discreto, remete-se o leitor para [130] e referências incluídas. Uma
metodologia de análise em frequência canal a canal de um filtro multi-ritmo pode ser
encontrada em [116].
Capítulo 6
Resultados e Análise de Dados Reais
O presente Capítulo pretende apresentar, analisar e discutir os resultados experimentais obtidos com a implementação do algoritmo de navegação (para atitude e posição)
proposto no Capítulo 5, na arquitectura de hardware do catamaran DELFIMx, proposta
no Capítulo 4. Os presentes testes de mar foram efectuados na baía de Sesimbra, no mês
de Junho de 2008 (latitude 38o 26’N, longitude 9o 6’W). É também apresentado e discutido, o comportamento do sistema de navegação na presença de falhas nas medidas de
GPS.
6.1
Síntese dos Parâmetros dos Filtros
Os filtros de atitude e de posição, apresentados no Capítulo 5, são sintetizados
para produzir uma resposta em frequência em malha fechada que funde os conteúdos
espectrais complementares dos sensores inerciais e dos sensores auxiliares. Neste contexto,
as matrizes, que definem a ponderação entre o estado e as medidas, são utilizadas como
parâmetros de afinação e os ganhos do filtro são identificados com os ganhos estacionários
de Kalman. A ponderação (ou os pesos) adoptados e os ganhos correspondentes são
apresentados com detalhe na Tabela 6.1.
Tabela 6.1: Parâmetros do filtro complementar.
Ponderação do Estado
Ponderação da Observação
Ganho do Filtro
Filtro de
Atitude
Ξω = 3I
Ξb = 10−10 I
Θλ = 0.8 × 10−2 I
K1 λ = 2.97 × 10−1 I
K2 λ = 9.41 × 10−5 I
Filtro de
Posição
Ξp = 5 × 10−2 I
Ξa = 10I
Θp = I
K1 p = 0.59I
K2 p = 0.14I
A frequência de amostragem dos sensores inerciais (acelerómetros e giroscópios) é
de 56 Hz, as leituras do magnetómetro são obtidas a 8 Hz e as medidas de posição do
GPS têm frequência de 4 Hz. Para os testes experimentais, e porque a área de trabalho
é restrita, assume-se que a Terra é plana, que não tem movimento de rotação e que a
86
6.1. Síntese dos Parâmetros dos Filtros
87
força gravítica é constante. A atitude determinada é descrita no referencial geográfico, a
posição é descrita no referencial do plano tangente e a velocidade é descrita no referencial
do corpo. Visto que o referencial de navegação é local, é necessário definir a sua origem.
Habitualmente, uma de duas opções é escolhida. A primeira recorre às coordenadas
que definem a posição da estação fixa de GPS (para adquirir dados que possibilitam
pós-processamento e para transmitir correcções em tempo real) que foi instalada nas
proximidades da área da missão (esta localização pode ser obtida com elevada precisão).
A segunda passa por obter uma média (com dados de alguns minutos, durante a calibração
da IMU) das leituras de posição fornecidas pelo GPS da plataforma, enquanto ainda está
em terra. Nos testes efectuados, a primeira opção foi escolhida. Em qualquer dos casos, o
resultado obtido, torna-se a localização, no referencial da Terra, da origem do referencial
local. Embora existam métodos de conversão precisos de conversão entre as coordenadas
geodésicas do referencial da Terra e as coordenadas rectangulares do referencial tangente
local, a precisão obtida não compensa os custos computacionais. Uma aproximação útil
pode ser escrita como
xN orte = U (L − L0 )
(6.1)
yEste = U cos(L0 )(λ − λ0 ),
onde xN orte e yN orte representam as coordenadas rectangulares no referencial tangente
local, U = 1852 × 60 = 1111201 metros por grau de latitude, L e λ representam a
latitude e longitude medidas (no ECEF em coordenadas geodésicas) em graus e L0 e
λ0 representam a origem do referencial local (no ECEF em coordenadas geodésicas) em
graus.
A resposta em frequência complementar dos filtros em malha fechada é apresentada
na Figura 6.1 e foi obtida considerando Q(λ) = Q(0) e R̄k = I, ou seja, a resposta
em frequência do sistema invariante no tempo (5.14) e (5.29) utilizado na síntese do
filtro. Como ilustrado na Figura 6.1, a região de baixa frequência do MPS e do GPS são
fundidas com os conteúdos de alta frequência da integração temporal em malha aberta
das medidas inerciais, que são dadas por
λω k+1 = λω k + T Q(0)ω r k ,
2
pf k+1 = pf k + T vf k + T2 fr k , vf k+1 = vf k + T fr k .
(6.2)
As funções de transferência complementares são validadas, na prática, com dados
experimentais obtidos a bordo do catamaran DELFIMx.
Tal como foi discutido na Secção 5.2, o filtro de atitude proposto é óptimo para
ângulos de pitch e roll constantes e, para o caso de ângulos de pitch e roll variantes
no tempo, a degradação da performance pode ser analisada utilizando a propagação das
equações da covariância apresentadas em detalhe no Anexo A. Uma comparação numérica
da covariância do erro de estimação óptima e da covariância do erro de estimação obtida é
ilustrada na Figura 6.2, considerando os pesos apresentados na Tabela 6.1. Como se pode
observar pela Figura 6.2(b), a covariância do erro de estimação do filtro complementar
proposto está menos que 1% acima da covariância do erro de estimação óptima para
trajectórias com ângulos de pitch e roll agressivas ilustradas na Figura 6.2(a).
1
Um arco minuto de latitude é aproximadamente igual a uma milha náutica (1852 m) na superfície
da Terra.
88
Capítulo 6. Resultados e Análise de Dados Reais
5
5
0
0
−5
Magnitude [dB]
Magnitude [dB]
−5
−10
−10
−15
−20
−15
−25
−20
T1 (z) = λ̂(z)/λMP S (z)
T2 (z) = λ̂(z)/λω (z)
T1 (z) + T2 (z)
−25
0
−35
1
10
T1 (z) = p̂(z)/p GP S (z)
T2 (z) = p̂(z)/p a (z)
T1 (z) + T2 (z)
−30
0
10
1
10
Frequência [Hz]
10
Frequência [Hz]
(a) Filtro de atitude.
(b) Filtro de posição.
Figura 6.1: Funções de transferência do filtro complementar.
1.6
Yaw
Pitch
Roll
1.4
1.009
1.008
1.2
Opt k+1|k
)
1.007
)/tr(Σ
0.8
Filt k+1|k
Atitude [rad]
1
tr(Σ
0.6
1.006
1.005
1.004
1.003
0.4
1.002
0.2
0
11
1.001
12
13
14
k*T [s]
(a) Atitude.
15
16
17
1
11
12
13
14
(b) Rácio da covariância do erro
Figura 6.2: Desempenho do filtro de atitude (T =
6.2
15
16
17
k*T (s)
tr(ΣFilter )
tr(ΣOptimal )
1
s).
56
Análise dos Resultados Experimentais
Esta secção apresenta os resultados de estimação do sistema de navegação obtidos
com dados experimentais recolhidos a bordo do catamaran DELFIMx durante testes
de mar, utilizando a arquitectura hardware apresentada anteriormente. A trajectória
descrita pelo veículo DELFIMx é caracterizada principalmente por segmentos de rectas e
curvas, como ilustra a Figura 6.3(a), para aferir a performance do sistema de navegação
num cenário operacional realista.
Os resultados de atitude, posição e velocidade são apresentados nas Figuras 6.4, 6.5
e 6.6 respectivamente, onde as posições e medidas de yaw obtidas pelo receptor de GPS
são também incluídas para comparação.
Os resultados de estimação de atitude são os esperados, nomeadamente a estimativa
do ângulo de yaw é consistente com as manobras em curva executadas pela plataforma
e com as medidas de yaw fornecidas pelo GPS, e o valor médio dos ângulos de pitch e
89
6.2. Análise dos Resultados Experimentais
−300
350 s
−350
−400
400 s
300 s
250 s
200 s
150 s
100 s
0 s 50 s
450 s
986 s
500 s
750 s
550 s
−450
X [m]
700 s
950 s
650 s
800 s
600 s
−500
−550
900 s
−600
850 s
Filtro Comp.
GPS
−650
−200
−100
0
100
Y [m]
200
300
400
(a) Trajectória estimada, medidas de GPS a 4 (b) Vista aérea da trajectória na baía de Sesimbra.
Hz.
Figura 6.3: Resultados da trajectória estimada do DELFIMx.
8
0.15
0.1
6
0.05
Atitude [rad]
Yaw [rad]
4
2
0
−0.05
−0.1
0
−0.15
−2
Filtro Comp.
GPS
−4
0
100
200
300
400
500
600
Tempo [s]
(a) Yaw.
700
800
900
−0.2
−0.25
0
Pitch
Roll
100
200
300
400
500
600
Tempo [s]
700
800
900
(b) Pitch e roll.
Figura 6.4: Resultados da estimação de atitude.
roll estimados correspondem aos ângulos de instalação da arquitectura de navegação. De
notar que as medidas de yaw fornecidas pelo GPS são somente utilizadas com o propósito
de validação dos resultados, não sendo introduzidas no filtro. De salientar também que,
as variâncias dos ângulos de roll e pitch são 1.42o e 0.95o respectivamente, o que sugere
que a degradação da performance do filtro de atitude, devido às variações temporais, seja
pequena.
Os resultados de estimação das polarizações dos giroscópios de velocidade são apresentados na Figura 6.7(a) e provam que o filtro complementar de atitude tem a capacidade
de compensar polarizações de variação lenta no tempo, através de uma matriz Ξb de valor baixo no cálculo do ganho de realimentação, consultar Tabela 6.1 para maior detalhe.
Contudo, a incerteza inicial nas polarizações devem estar próximos da covariância estacionária das polarizações, i.e. o erro de calibração das polarizações deve ser pequeno para
o Ξb adoptado. Como se apresenta na Figura 6.7(b), uma ponderação de valor superior
para o parâmetro Ξb torna possível a compensação por parte do filtro de erros de cali-
90
−300
400
Filtro Comp.
GPS
−42
Filtro Comp.
GPS
−350
−42.5
Filtro Comp.
GPS
300
−43
−400
−43.5
100
z
Py[m]
P [m]
−44
−450
x
P [m]
200
−500
−44.5
−45
0
−45.5
−550
−46
−100
−600
−46.5
−650
0
100
200
300
400
500
600
Tempo [s]
700
800
900
−200
0
100
200
300
400
500
600
Tempo [s]
700
800
−47
0
900
100
200
300
400
500
600
Tempo [s]
700
800
900
(a) Eixo do x do referencial da (b) Eixo do y do referencial da (c) Eixo do z do referencial da
Terra (px ).
Terra (py ).
Terra (pz ).
Figura 6.5: Resultados da estimação de posição.
0.6
3
B
v
2.5
0.4
x
B
v
y
B
Velocidade no Corpo [m/s]
Velocidade Angular [rad/s]
v
0.2
0
−0.2
−0.4
ω −b
rx
ry
z
1.5
1
0.5
0
ωx
ω −b
−0.6
2
ωy
−0.5
ωr z−bω z
−0.8
0
100
200
300
400
500
600
Tempo [s]
700
(a) Velocidade angular.
800
900
−1
0
100
200
300
400
500
600
Tempo [s]
700
800
900
(b) Velocidade linear.
Figura 6.6: Resultados da estimação das velocidades linear e angular.
bração das polarizações, tendo como custo um aumento da covariância estacionária. O
compromisso entre a possibilidade de compensar erros grosseiros de calibração e a precisão a longo prazo da estimação das polarizações deve ser tida em atenção no processo de
desenvolvimento. Uma simples técnica de comutação de ganhos, utilizando valores grandes para Ξb , na inicialização do filtro e, valores pequenos para Ξb , no longo prazo, pode
ser considerada nos casos em que é necessária calibração no decorrer de uma operação.
6.2.1
Desempenho dos Filtros com Falhas de GPS
O problema das falhas ou bloqueios nas medidas de GPS é estudado, cancelando a
realimentação das mesmas em intervalos de tempo seleccionados, quando o veículo executa trajectórias circulares ou entra em trajectórias rectilíneas longas, como é detalhado
na Tabela 6.2. Os resultados das estimativas de posição durante os bloqueios de GPS são
apresentados na Figura 6.8 e com maior detalhe em Figura 6.9. Os resultados do sistema
de navegação, apresentados na Tabela 6.2, mostram que a velocidade de deriva de posição
é pequena durante as falhas de GPS, e que o filtro de posição opera sem depender demasiado das observações de posição fornecidas pelo GPS, explorando a informação dada
pelas medidas inerciais.
91
0.02
0.02
0.018
0.018
0.016
0.016
0.014
0.014
0.012
0.012
bω[rad/s]
bω[rad/s]
0.01
0.008
0.006
0.006
0.004
0.002
bω x
0.004
bω y
0.002
bω z
0
0
0.01
0.008
100
200
300
400
500
600
Tempo [s]
700
800
900
bω x
bω y
b
ωz
0
0
50
100
150
200
250
Tempo [s]
300
350
400
(a) Compensação da polarização com variação (b) Compensação do erro de calibração, Ξb =
temporal lenta,Ξb = 10−10 .
10−7 .
Figura 6.7: Resultados da estimação da polarização do giroscópio de velocidade.
Tabela 6.2: Deriva da posição final e média devido a falhas de GPS.
Intervalo de Tempo [s]
[370 380]
[480 550]
[615 750]
[800 820]
6.2.2
Final [m]
Média [m/s]
2.38
1.91
15.37
7.14
0.238
0.027
0.114
0.357
Validação dos Filtros no Domínio da Frequência
A validação, no domínio da frequência das funções de transferência complementares, é realizada utilizando a função de Matlab spectrogram para calcular a magnitude
da Transformada de Fourier de tempo curto (short-time Fourier transform) das estimativas de posição e atitude, das medidas dos sensores auxiliares, e da integração das
medidas dos sensores inerciais. Recorrendo a uma janela de Hamming de 512 amostras
de comprimento e 500 segmentos sobrepostos [131], os conteúdos espectrais dos sinais
de atitude e posição seleccionados são analisados. Para ilustrar a fusão no domínio da
frequência das medidas do magnetómetro e medidas pendulares com as leituras inerciais,
os ângulos de yaw e pitch calculados pelo MPS, pela integração em relação ao tempo
do giroscópio de velocidade, e pelo filtro de atitude são apresentadas na Figura 6.10 e
na Figura 6.11. A filtragem da posição é demonstrada no domínio da frequência na
Figura 6.12, onde os conteúdos em frequência da posição px dada pela observação de
GPS, pela integração temporal das leituras dos acelerómetros e pela posição fornecida
pelo filtro, são apresentados. Embora uma análise rigorosa, no domínio da frequência
utilizando um espectrograma, esteja comprometida pela formulação multi-ritmo do sistema de navegação, o espectrograma indica que as estimativas de atitude e de posição são
obtidas pela fusão de informação de baixa frequência das observações dos sensores auxiliares, com a informação de alta frequência da integração temporal das medidas inerciais.
Assim, os parâmetros de síntese do filtro originam a fusão sensorial desejada no domínio
92
−300
−350
−300
350 s
−400
400 s
300 s
250 s
200 s
150
100 s s
0 s 50 s
−400
450 s
986 s
X (m)
500 s
750 s
550 s
−450
Px[m]
−350
700 s
950 s
−500
650 s
800 s
600 s
−500
−450
−550
−550
900 s
−600
850 s
Comp. Filter
GPS Unit
Comp. Filter, no GPS
−650
−100
0
100
Y (m)
200
−600
−650
0
300
Filtro Comp.
GPS
Filtro Comp., sem GPS
100
200
300
(a) Trajectória estimada com bloqueio do sinal de
GPS.
500
600
Tempo [s]
700
800
900
(b) px .
−42
400
300
400
Filtro Comp.
GPS
−43
−44
−45
200
Pz[m]
Py[m]
−46
100
−47
−48
0
−49
−50
−100
−51
−200
0
100
200
300
400
500
600
Tempo [s]
(c) py .
700
800
900
−52
0
Filtro Comp.
GPS
100
200
300
400
500
600
Tempo [s]
700
800
900
(d) pz .
Figura 6.8: Resultados da estimativa de posição com falhas nas medidas de GPS.
da frequência, e produzem boas estimativas de atitude, de posição e das polarizações dos
giroscópios de velocidade no domínio do tempo.
93
−290
−390
−400
−300
475 s
−410
−310
495 s
−420
385 s
345 s
X [m]
X [m]
365 s
−320
325 s
−330
515 s
−430
535 s
−440
555 s
−450
−460
−340
Filtro Comp.
GPS
−350
−80
−60
−470
Filtro Comp.
GPS
−480
−40
−20
0
20
−80
−60
−40
−20
Y [m]
Y [m]
(a) Falha de GPS em [370 380] s.
0
20
40
(b) Falha de GPS em [480 550] s.
980 s
−400
−350
760 s
960 s
780 s
−450
−400
940 s
−450
740 s
780 s
680 s
X [m]
X [m]
760 s
720 s
700 s
660 s
920 s
640 s
−500
820 s
−550
620 s
600 s
800 s
−500
900 840
s s
−550
−600
Filtro Comp.
GPS
0
50
100
150
200
Y [m]
250
300
(c) Falha de GPS em [615 750] s.
350
Filtro Comp.
GPS
150
200
250
300
880 s860 s
350
Y [m]
400
450
500
(d) Falha de GPS em [800 820] s.
Figura 6.9: Detalhes da trajectória estimada com falhas nas medidas de GPS.
(a) Medida auxiliar (MPS).
(b) Integração do giroscópio de
velocidade.
(c) Estimativa do filtro.
Figura 6.10: Espectrogramas das medidas de yaw e da estimativa do filtro.
(a) Medida auxiliar (MPS).
(b) Integração do giroscópio de
velocidade.
Figura 6.11: Espectrogramas das medidas de picth e da estimativa do filtro.
(a) Medida auxiliar (GPS).
(b) Integração do acelerómetro.
Figura 6.12: Espectrogramas das medidas de px e da estimativa do filtro.
Capítulo 7
Conclusões e Trabalho Futuro
7.1
Conclusões
O esforço de desenvolver e testar um ASC, para fins científicos, levado a cabo pelo
DSOR, e no qual este trabalho se inseriu, resultou numa arquitectura de hardware (sensores e actuadores e respectiva interface, sistemas de energia, comunicações) e de software
(algoritmos de navegação, controlo, comando e comunicações) capaz de transformar a
estrutura mecânica de um catamaran, num veículo marinho autónomo de superfície operacional.
No que aos filtros de navegação diz respeito, foi proposto um filtro complementar
de atitude e outro de posição e foram derivadas as suas propriedades de estabilidade,
bem como o seu desempenho. Recorrendo à parametrização da orientação por ângulos de
Euler, o filtro de atitude tem a capacidade de compensar dinamicamente as polarizações
dos giroscópios de velocidade e é estável para trajectórias descritas por configurações não
singulares. O filtro de posição estima a velocidade no referencial do corpo e a posição
no referencial da Terra e é assimptoticamente estável. Os filtros de atitude e posição
foram integrados para produzir um sistema de navegação completo, cuja estrutura pode
ser representada num diagrama de blocos simples, recorrendo a ganhos de realimentação
estacionários.A estrutura proposta foi facilmente implementada em hardware de baixo
custo e baixo consumo energético. Os ganhos do filtro foram sintetizados no domínio da
frequência para moldar uma resposta em frequência que explorasse os conteúdos espectrais
de baixa frequência dos sensores auxiliares e a informação contida nas altas frequências
dos giroscópios de velocidade. Aspectos relacionados com a implementação de todo o
sistema de navegação foram detalhados, nomeadamente uma medida auxiliar de atitude
baseada em medidas magnéticas e pendulares e o problema de diferentes frequências
de amostragem foi abordado recorrendo a resultados óptimos para sistemas periódicos.
O sistema de navegação foi validado com dados experimentais, em testes de mar com
o catamaran autónomo DELFIMx. As polarizações dos giroscópios de velocidade foram
compensadas, e os conteúdos espectrais complementares dos sensores auxiliares e inerciais
produziram boas estimativas de atitude e posição. Foi também verificado que, o sistema
de navegação produz bons resultados, apresentando uma deriva pequena, na presença de
falhas de curta duração nas leituras de GPS.
Em conjunto, a solução de hardware e software desenvolvida de raiz no DSOR e
para a qual este trabalho contribuiu, provou ser extremamente fiável quando posta à
98
7.2. Trabalho Futuro
99
prova nas diversas missões levadas a cabo pelo veículo marinho autónomo de superfície
DELFIMx.
7.2
Trabalho Futuro
Propriedades de estabilidade e desempenho foram derivadas separadamente para
os filtros de atitude e de posição. O passo seguinte será generalizar estas propriedades
ao sistema de navegação completo, ou mesmo tentar desacoplar os filtros de atitude e
posição. A estimação offline das polarizações dos acelerómetros, adoptada neste trabalho,
é somente adequada para missões de curta ou média duração do ASC, portanto, métodos
de calibração online devem ser estudados num futuro próximo.
Outra direcção de trabalho bastante pertinente na área da fusão sensorial, é uma
caracterização aprofundada dos sensores inerciais recorrendo a ferramentas que permitem obter uma melhor descrição estocástica dos seus erros, tal como a Allan Variance. A
calibração de alguns parâmetros, tais como factores de escala, polarizações, não ortogonalidade entre eixos, com o auxílio de uma mesa de calibração, representa outro factor que
pode levar a um aumento significativo do desempenho de todo o sistema de navegação. A
caracterização em temperatura dos referidos parâmetros (excepto a não ortogonalidade)
e da arquitectura de aquisição de sinal, constitui mais um refinamento, essencial para
sistemas de alta precisão.
No que diz respeito à calibração e modelação do erro do magnetómetro, sugere-se,
como trabalho futuro, a realização de mais testes experimentais que possibilitem aumentar o grau de confiança nos modelos e nos algoritmos apresentados neste trabalho. De
salientar a importância de se obter uma medição de yaw de grande exactidão (recorrendo
a manobras que tirem partido das leituras de GPS) para assim ser possível aferir a validade dos modelos. Sugere-se, também, a continuação do estudo das perturbações no
espaço dos três eixos do magnetómetro quando o veículo perfaz trajectórias no espaço
de atitude com ângulos de roll e de pitch diferentes de zero. Quando representada no
espaço das três coordenadas do sensor, esta perturbação traduz-se no aparecimento de
um elipsóide onde, em condições ideais, deveria surgir uma superfície esférica.
Apêndice A
Desempenho do Filtro Atitude
O sistema (5.15) pode ser reescrito de forma compacta como
"
#
" #
"
#
λ̃k+1
λ̃k
wω k
= (Fk − Kk Hk )
+ Gk
− Kk Q(λ̄k−1 )vλ k ,
b̃k+1
b̃k
wb k
(A.1)
onde
"
#
"
I −T Q(λ̄k )
−T Q(λ̄k )
Fk =
, Gk =
0
I
0
"
#
Q(λ̄k )(K1λ − I)Q−1 (λ̄k−1 ) + I
Kk =
, Hk
K2λ Q−1 (λ̄k−1 )
#
0
,
I
h
i
= I 0 .
É conhecidoh
[127] que
do erro de estimação, representada por
i a covariância
λ̃k+1
′
′
Σk+1|k = E b̃
[ λ̃k+1 b̃k+1 ] , satisfaz a equação da propagação
k+1
Σk+1|k = (Fk − Kk Hk )Σk|k−1 (Fk − Kk Hk )′
+ Gk ΞG′k + Kk Q(λ̄k−1 )ΘQ(λ̄k−1 )′ K′k .
(A.2)
A covariância do erro de estimação do filtro de Kalman para a cinemática de atitude
(5.12), representada por Pk+1|k , satisfaz
′
Pk+1|k = Fk Pk|k−1 F′k + Gk ΞG′k − Fk Pk|k−1 H′k S−1
P k Hk Pk|k−1 Fk ,
(A.3)
onde SP k = Hk Pk|k−1 H′k + Θ. O desempenho do filtro de atitude proposto pode ser
estudada offline, comparando a covariância do erro de estimação dada por (A.2) com a
covariância do erro óptima descrita em (A.3), tal como é ilustrado na análise apresentada
no Capítulo 6.
101
Apêndice B
Magnetómetro: Modelação do Erro e
Calibração
B.1
Descrição e Modelação das Fontes de Erro
Nos parágrafos seguintes é apresentada uma descrição sucinta das principais fontes
de erro que afectam as leituras de um magnetómetro.
Declinação Magnética
Tal como foi referido anteriormente, o não conhecimento da declinação magnética
na região onde se está a navegar, pode levar a erros graves na obtenção de uma medida
de heading (rumo). Em geral, o fenómeno de declinação magnética não representa um
problema de difícil resolução, visto que é relativamente fácil a obtenção dos valores de
correcção para um determinado local de interesse.
Distorção Hard Iron
Neste tipo de distorção, estão envolvidos os materiais ferromagnéticos com propriedades magnéticas permanentes, isto é, materiais que sofreram, no passado, o efeito de
um campo magnético (deliberadamente ou não) que os magnetizou. Devido a serem materiais duros (hard iron), com menor permeabilidade magnética relativa, são de difícil
desmagnetização, comportando-se assim como ímanes permanentes. Estes materiais geram campos magnéticos que se sobrepõem ao campo magnético da Terra perturbando a
sua leitura.
Os materiais que podem gerar erros de leitura podem existir em dois locais, ou
estão no ambiente ou pertencem à estrutura do veículo. Das fontes de campo magnético
perturbador do meio envolvente, identificam-se os materiais com propriedades magnéticas
que se encontram no solo e no subsolo, e possíveis estruturas metálicas que existam perto
das trajectórias do veículo.
Consoante a sua localização, as perturbações fazem-se sentir de forma diferente
pelo sensor. As ambientais, de origem geológica, originam perturbações invariantes no
tempo e em geral pode-se afirmar que também o são no espaço, já que estes fenómenos
abrangem áreas normalmente superiores às cobertas por uma missão normal de um veículo
103
104
Anexo B. Magnetómetro: Modelação do Erro e Calibração
autónomo. Estes fenómenos, em geral, estão mapeados o que possibilita a sua calibração
em offline.
Distorção Soft Iron
Os materiais ferromagnéticos, ditos "macios", têm a capacidade de gerar campos
magnéticos quando estão sob o efeito de um campo magnético exterior. Têm a referida
característica, devido à sua elevada permeabilidade magnética.
Em relação às perturbações produzidas por estes campos magnéticos, estas são
diferentes das originadas pelo hard iron no sentido em que dependem da atitude do
veículo, já que, o campo magnético terrestre penetra o veículo de forma não uniforme,
quando por exemplo o veículo tem um movimento de rotação, no plano horizontal.
Distorção de Desalinhamento
Surgem erros de desalinhamento quando, numa montagem não ideal, não se consegue um alinhamento perfeito da tríade de magnetómetros com o referencial do corpo
do veículo. Esta fonte de erro, não sendo fácil de eliminar totalmente, pode ser bastante
minimizada. No espaço de heading (yaw ), este erro revela-se como uma constante que é
somada à medida heading verdadeira.
Distorção Devido a Erros de Factor de Escala
Em condições ditas ideais, os três magnetómetros da tríade são exactamente iguais.
Na realidade, não se consegue obter os três dispositivos com uma sensibilidade perfeitamente igual. As consequências deste fenómeno são, por exemplo, leituras diferentes
quando são sujeitos ao mesmo campo magnético.
Distorção Devido a Equipamentos Eléctricos
A existência de cablagem que transporta corrente eléctrica, motores eléctricos ou
outros dispositivos electrónicos no veículo, gera campos magnéticos que se sobrepõem de
forma corruptiva ao campo magnético terrestre.
Este tipo de distorção não tem uma correcção algorítmica trivial, devido ao carácter não determinístico e variante no tempo dos campos magnéticos que corrompem as
medidas. Assim, a solução para este problema está na colocação cuidada dos sensores em
zonas do veículo com menos ruído electromagnético de forma a minimizar a exposição às
referidas perturbações.
Distorção Devido à Não Ortogonalidade nos Eixos do Sensor
Os erros produzidos por este fenómeno podem ser desprezados, já que, a não ortogonalidade dos eixos dos magnetómetros aparece nos manuais dos mesmos como sendo
da ordem de ±0.1o , não produzindo desvios que se comparem aos originados por outras
fontes de erro.
B.2. Modelo do Erro das Medidas do Magnetómetro
B.2
105
Modelo do Erro das Medidas do Magnetómetro
Em seguida apresentam-se os efeitos de algumas destas distorções no espaço de
heading e no espaço das coordenadas do magnetómetro. A análise, que se apresenta,
pretende caracterizar os fenómenos de distorção somente para manobras que mantenham
o veículo na horizontal, portanto, com os ângulos de roll e de pitch nulos.
Espaço de Heading
Na literatura [132], [133] e [134], a perturbação que aparece na medida de yaw
obtida a partir das leituras do magnetómetro, devido aos efeitos do hard iron, pode ser
aproximada por
EHI (ψm ) ≃ RHI sin(ψm + ζHI ),
(B.1)
onde ψm representa o heading medido com a leitura do magnetómetro, RHI e ζHI representam a amplitude e desvio de fase do sinal de erro provocado pelo hard iron, respectivamente. Depois de algumas operações trigonométricas, a equação (B.1) pode ser reescrita
da seguinte forma
EHI (ψm ) ≃ B sin(ψm ) + C cos(ψm ).
(B.2)
Este efeito é frequentemente designado por erro de ciclo único, já que a cada rotação
completa, o erro é aproximado por um período de uma sinusóide.
Os efeitos dos materiais ditos do tipo soft iron são responsáveis pelo aparecimento
de uma sinusóide de frequência dupla, em relação à que aparece nos efeitos hard iron.
Este fenómeno modela-se no espaço de heading da seguinte forma
ESI (ψm ) ≃ RSI sin(2ψm + ζSI ),
(B.3)
onde RSI e ζSI representam a amplitude e desvio de fase do sinal de erro provocado pelo
soft iron, respectivamente. Tal como foi feito para a equação (B.1), a equação (B.3) pode
ser reescrita na forma
ESI (ψm ) ≃ D sin(2ψm ) + E cos(2ψm ).
(B.4)
O desalinhamento horizontal entre o referencial do corpo e o referencial do sensor
são modelados de forma exacta no espaço de heading como um offset
EDesal (ψm ) = A.
(B.5)
Ao juntar os efeitos das fontes de erros apresentadas anteriormente, define-se um
modelo aproximado para o erro no espaço de heading. O heading verdadeiro do veículo
pode ser calculado com
ψreal = ψm − EHI+SI+Desal (ψm ),
(B.6)
onde EHI+SI+Desal (ψm ) é aproximadamente dado por
EHI+SI+Desal (ψm ) ≃ A + B sin(ψm ) + C cos(ψm ) + D sin(2ψm ) + E cos(2ψm ).
(B.7)
106
Nas Figuras B.1(a) e B.1(b), faz-se um resumo gráfico das três perturbações modeladas, sendo a Figura B.1(b)(gráfico b2 ) uma ilustração do modelo da perturbação total,
definida na equação B.7, quando o veículo faz uma rotação de 360o , no plano horizontal.
(b ) Erro devido ao Soft Iron
(a1) Erro de Desalinhamento
1
0.3
1.5
E M ( ψm ) = 0.052
1
HI
( ψ ) = 0.209 sin(ψ ) + 0.140 cos(ψ )
m
m
m
0.1
0.5
[rad]
[rad]
E
0.2
0
0
−0.1
−0.2
−0.5
−1
−0.3
−0.4
−pi
−3pi/4
−pi/2
−pi/4
0
ψm [rad]
pi/4
pi/2
3pi/4
−pi
−3pi/4
−pi/4
0
ψ [rad]
pi/4
pi/2
3pi/4
m
(b2) Erro total (Desalinhamento + Hard Iron + Soft Iron)
(a2) Erro devido ao Hard Iron
0.5
0.1
E SI ( ψm ) = 0.087 sin(2ψm) + 0.026 cos(2ψm)
0.4
0.05
E M + HI + SI ( ψm ) = 0.052 + 0.209 sin(ψm) + 0.140 cos(ψm) + 0.087 sin(2ψm) + 0.026 cos(2ψm)
0.3
[rad]
[rad]
−pi/2
0
0.2
0.1
0
−0.05
−0.1
−0.1
−pi
−3pi/4
−pi/2
−pi/4
0
ψm [rad]
pi/4
pi/2
3pi/4
−0.2
−pi
−3pi/4
−pi/2
−pi/4
0
ψ [rad]
pi/4
pi/2
3pi/4
m
(a) Perturbação de desalinhamento (a1 ) e soft iron
(a2 ).
(b) Perturbação de hard iron (b1 ) e total (b2 ).
Figura B.1: Evolução do modelo do erro em função de yaw medido com diferentes perturbações.
Espaço do Sensor
Espera-se de um modelo de erro, no espaço do sensor, para além de uma descrição
mais rica do fenómeno, a capacidade de modelar o sensor de uma forma mais realista,
visto que se actua directamente nas medidas do sensor e não numa qualquer relação entre
as mesmas, ou parte delas. Um novo modelo para o erro, no espaço do sensor que alia a
teoria apresentada em [134] e em [135], é sugerido neste trabalho
B
M
M
mnão ideal = B
M Rβ CSF B Rβ
B
CSI B mideal + B δmHI ,
(B.8)
onde os índices B e M designam respectivamente descrição no referencial do corpo {B}
M
e descrição no referencial do magnetómetro {M } (sensor). As matrizes B
CSF são
M Rβ e
definidas mais à frente. Este modelo é apresentado com mais detalhe em seguida.
Em [134] sugere-se a modelação dos efeitos de hard iron e de soft iron da seguinte
forma
B
mHI+SI = B CSI B mideal + B δmHI ,
(B.9)
onde a matriz B CSI modela os efeitos de soft iron em {B}, B δm modela o offset provocado pelo fenómeno de hard iron em {B} e B mideal representa o campo magnético
verdadeiro sem as perturbações descrito também em {B}. Em seguida, apresenta-se o
modelo anterior evidenciando a estrutura da matriz B CSI
107
B.2. Modelo do Erro das Medidas do Magnetómetro
 

m(HI+SI)x
(1 + a)
b
c
 
 B

d
(1 + e)
f
 m(HI+SI)y  = 

B
m(HI+SI)z
g
h
(1 + k)

B
 
midealx
 
B
midealy  + 
B
midealz
B

δmHIx

B
δmHIy  (B.10)
B
δmHIz
B
Os parâmetros a, b, c, d, e, f , g, h e k são responsáveis por modelar os efeitos de
soft iron e B δHIx , B δmHIy e B δmHIz modelam os efeitos de hard iron.
Para trajectórias no plano horizontal (roll e pitch nulos), e para um ângulo dip
que se supõe igual a zero, pode-se afirmar que B midealz é também nulo. Assim sendo, é
permitida a redução da dimensão do modelo para
"
B
B
m(HI+SI)x
m(HI+SI)y
#
=
"
(1 + a)
b
d
(1 + e)
#"
B
B
midealx
midealy
#
+
"
B
B
δmHIx
δmHIy
#
(B.11)
Os pontos cardeais representados nas Figuras B.2(a), B.3(a), B.4(a) e B.5(a) representam a leitura do magnetómetro quando este está orientado segundo esses mesmos
pontos cardeais, sob o efeito da distorção respectiva. Para a análise das perturbações
de hard iron e de soft iron, supõe-se que o referencial {B} é coincidente com referencial
{M }, sendo indiferente a utilização do índice B ou do índice M .
Na Figura B.2 apresenta-se, para os parâmetros do modelo descrito anteriormente
B
( δmHIx = 0.3 e B δmHIx = 0.3), as perturbações devido ao hard iron, respectivamente
no referencial do sensor e no espaço de heading. No referencial do sensor, observa-se
uma translação da circunferência, que está directamente relacionada com a adição às
componentes horizontais do vector do campo magnético das componentes horizontais do
vector de perturbação de hard iron.
Representaçao da distorçao de Hard Iron no espaço de heading
Representaçao da distorçao de Hard Iron no referencial do sensor
0.5
Efeito do Hard Iron
Sem Distorçao
Com Distorçao HI
300
0.4
B
δm
HI
Norte
Sul
Este
Oeste
0.3
0.2
EHI = ψm − ψreal [rad]
200
Xh [mG]
100
0
0.1
0
−0.1
−0.2
−100
−0.3
−0.4
−200
−0.5
−300
−200
−100
0
100
200
Yh [mG]
(a) No referencial do sensor.
300
400
−pi
−3pi/4
−pi/2
−pi/4
0
ψreal [rad]
pi/4
pi/2
3pi/4
pi
(b) No espaço de heading.
Figura B.2: Representação da distorção de hard iron.
De salientar, a diferença entre a distorção produzida pela modelação no espaço do
sensor e a distorção que se sugere para o espaço de heading quando se tenta representar
os efeitos de hard iron. Ao fazer-se uso dos dados produzidos pelo modelo (B.9) e se
108
obtém os valores de heading respectivos, o erro originado não é uma sinusóide perfeita, o
que leva a concluir que o modelo no espaço de heading é um modelo com aproximações
mais grosseiras que o do espaço do sensor [134].
Na Figura B.3 apresenta-se, para os parâmetros do modelo descrito pela equação
(B.11) (a = 0.4; b = 0.2; d = 0.2; e = 0.4), as perturbações devido ao soft iron,
respectivamente no referencial do sensor e no espaço de heading.
Representaçao da distorçao de Soft Iron no referencial do sensor
Representaçao da distorçao de Soft Iron no espaço de heading
0.15
Sem Distorçao
Com Distorçao SI
Norte
Sul
Este
Oeste
300
200
Efeito do Soft Iron
0.1
0.05
ψm − ψreal [rad]
Xh [mG]
100
0
0
−0.05
−100
−0.1
−200
−0.15
−300
−0.2
−400
−300
−200
−100
0
Yh [mG]
100
200
300
−pi
400
−3pi/4
−pi/2
−pi/4
ψ
0
[rad]
pi/4
pi/2
3pi/4
pi
real
Figura B.3: Representação da distorção de soft iron.
A perturbação relacionada com o efeito soft iron manifesta-se de uma forma diferente da que é originada pelo hard iron. Embora também introduza uma polarização nas
medições, esta polarização depende do rumo, ao contrário da que é introduzida pelo hard
iron, que é constante quando descrita no referencial do veículo.
Para se modelar a distorção introduzida por diferentes factores de escala em cada
eixo do sensor, modifica-se o modelo do erro, multiplicando pela matriz M CSF . Para o
conseguir, e supondo que pode existir um desalinhamento entre o referencial do sensor e
o referencial do corpo, é necessário descrever B mHI+SI em {M }. Para tal, é necessário
recorrer-se à matriz de rotação M
B Rβ :
#
cβ
sβ
M
B
M
eM
mmedido = M CSF M
CSF =
B Rβ =
B Rβ mHI+SI , com
−sβ cβ
(B.12)
onde β representa o desalinhamento horizontal entre o referencial do corpo e o referencial
do sensor e Kx e Ky representam os factores de escala do magnetómetro para os eixos do
x e do y respectivamente.
Na Figura B.4, apresenta-se somente os efeitos de diferentes factores de escala para
cada eixo do magnetómetro, quer no espaço de sensor, quer no espaço de heading. No
caso apresentado (Kx > Ky ) observa-se que o eixo maior da elipse fica alinhado segundo
o eixo do x do sensor, caso contrário (Kx < Ky ), este ficaria alinhado segundo o eixo do
y do sensor.
Na Figura B.5, apresenta-se somente os efeitos de uma instalação não rigorosa, isto
é, não se conseguir um alinhamento perfeito entre o referencial do sensor e o referencial
"
Kx 0
0 Ky
#
"
109
B.3. Algoritmos de Calibração de um Magnetómetro
Representação da distorção devido a diferentes factores de escala para cada eixo do magnetómetro no referencial do sensor
250
Sem Distorçao
Com Distorçao Kx = 1.100, Ky = 0.900
200
Norte
Sul
Este
Oeste
150
Representação da distorção devido a diferentes factores de escala para cada eixo do magnetómetro no espaço de heading
0.15
Efeito do Factor de Escala K = 1.100, K = 0.900
x
y
0.1
0.05
[rad]
100
0
ψ −ψ
Xh [mG]
real
50
m
0
−0.05
−50
−100
−0.1
−150
−0.15
−200
−250
−0.2
−300
−200
−100
0
Yh [mG]
100
200
300
−pi
−3pi/4
−pi/2
−pi/4
0
ψreal [rad]
pi/4
pi/2
3pi/4
pi
Figura B.4: Representação da distorção devido a diferentes factores de escala para cada
eixo do magnetómetro.
do corpo. A Figura B.5 (a) ilustra este fenómeno no espaço de sensor, e a Figura B.5 (b)
ilustra o mesmo fenómeno no espaço de heading.
Distorçao devido ao desalinhamento representado no referencial do sensor
Distorçao devido ao desalinhamento representado no espaço de heading
0.1047
250
Efeito do Desalinhamento β = 0.105 [rad]
200
0.1047
150
0.1047
100
Sem Distorçao(1)
Este(1)
−100
Norte (2)
m
−50
0.1047
real
(1)
Sul(1)
ψ −ψ
Xh [mG]
Norte
0
[rad]
Com Distorçao(2) β = 0.105 [rad]
50
0.1047
Oeste(1)
0.1047
Sul(2)
Este(2)
−150
Oeste
(2)
0.1047
−200
−250
0.1047
−300
−200
−100
0
Yh [mG]
100
200
300
−pi
−3pi/4
−pi/2
−pi/4
ψ
0
[rad]
pi/4
pi/2
3pi/4
pi
real
Figura B.5: Representação da distorção devido ao desalinhamento no plano horizontal
entre os eixos do magnetómetro e o referencial do corpo.
B.3
Algoritmos de Calibração de um Magnetómetro
No presente trabalho, entende-se por algoritmos de calibração, algoritmos matemáticos, implementados em software com o objectivo de obter parâmetros que permitam a
correcção, segundo um determinado modelo de erro, das leituras de um magnetómetro
solidário com um veículo. Embora existam procedimentos que, por ajuste, ou adição de
peças magnéticas, consigam calibrar uma bússola ou magnetómetro, esse não é o objectivo
deste trabalho.
110
Critérios de Avaliação de um Algoritmo de Calibração
Utilização de referências externas. São desaconselháveis visto que não é simples
a determinação, numa qualquer localização remota, de um conjunto mínimo de pontos
cardeais com um nível de exactidão elevado.
Duração da calibração. Não é muito importante como critério de desenvolvimento
de algoritmos, desde que se mantenha dentro de limites de duração razoáveis de poucos
minutos.
Utilização somente de dados do magnetómetro ou de outros sensores. É um
critério importante, já que se pode estar na presença de setups de calibração em que os
sensores que, supostamente poderiam ser utilizados como referência, não oferecem um
grau de exactidão desejada, ou mesmo a não existência de outro sensor adequado. No
caso em que se tem ao dispor sensores que possam contribuir para uma melhor calibração do magnetómetro, é aconselhado o desenvolvimento de algoritmos que integrem esses
dados.
Viabilidade de execução da manobra de calibração. Para a extracção de leituras
do magnetómetro para calibração, pressupõe-se que se desenvolveu uma manobra que
origine valores, no mesmo, que possibilitam o funcionamento do algoritmo de calibração.
Estas manobras têm que ser factíveis para o veículo em questão, sendo este um factor
determinante para viabilização do algoritmo de calibração.
Algoritmos de Calibração para o Espaço de Heading
Em geral, os algoritmos de calibração presentes na literatura ([135] e [133]), passam
pela identificação dos parâmetros do modelo do erro definido na equação (B.7), normalmente recorrendo a medidas de heading fornecidas por outros sensores previamente
calibrados (como por exemplo da integração de um giroscópio ou outros), ou referências externas fazendo depois uma aproximação segundo um critério de minimização que
origine os parâmetros que caracterizam o modelo.
Em geral, estes algoritmos são sensíveis a erros originados pela dificuldade de geração de referências externas. Outra característica menos favorável está relacionada com
o facto destes métodos só servirem nas aplicações em que o magnetómetro é necessário
exclusivamente para a obtenção de medidas de yaw.
Algoritmos de Calibração para o Espaço do Sensor
Pretende-se com o algoritmo que se apresenta em seguida, obter parâmetros que
possibilitem a correcção das leituras do magnetómetro. A ênfase vai para a correcção das
perturbações causadas pelos fenómenos de hard iron e de soft iron.
Assume-se que os erros de factor de escala são eliminados por calibração do magnetómetro sem este estar acoplado a um veículo (os factores de escala são característicos do
magnetómetro e não do seu ambiente). Neste caso, o modelo que vai gerar as perturbações
nas saídas do magnetómetro para posterior calibração, reduz-se a:
111
"
B
m(HI+SI)x
B
m(HI+SI)y
#
=
"
(1 + a)
b
d
(1 + e)
#"
B
midealx
B
midealy
#
+
"
B
δmHIx
B
δmHIy
#
(B.13)
Supõe-se que o erro de desalinhamento foi eliminado por uma instalação rigorosa
(M
R
β é uma matriz identidade) e que é negligenciável a diferença entre os factores de
B
escala dos dois eixos do sensor (M CSF é uma matriz identidade). Para estas condições,
os referenciais {B} e {M } são coincidentes, sendo indiferente a utilização do índice B ou
do índice M .
Este algoritmo de calibração requer que o veículo experimente o maior número
possível de valores de yaw, sempre com os ângulos de roll e de pitch nulos (rotação
no plano horizontal). Idealmente, os valores obtidos das leituras do eixo do x e do y
descreveriam uma circunferência quando representados no plano xy do referencial do
sensor (consultar a Figura 3.9 no Capítulo 3), na realidade isso não sucede.
Este algoritmo, tenta transformar o que na realidade se pode obter (uma elipse
descentrada e rodada no caso em que as perturbações são mais complexas), no que em
condições ideais se deveria obter (uma circunferência centrada na origem), não pretendendo identificar os parâmetros do modelo da equação (B.13).
Para o conseguir, recorre-se ao algoritmo de ajuste de elipses descrito em [136].
Este algoritmo fornece parâmetros que caracterizam a referida elipse (deslocamento do
seu centro em relação à origem - M δ m̂HIx e M δ m̂HIx -, dimensão do eixo maior e do eixo
menor e o ângulo - η - do eixo maior em relação ao eixo Yh do referencial do sensor) que
melhor se ajusta aos dados obtidos, segundo o critério dos mínimos quadrados. Depois
de obtidos estes parâmetros, consegue-se corrigir ainda no espaço das variáveis do sensor,
todos as futuras leituras. Para tal, aplica-se o seguinte conjunto de operações a cada
leitura:
- Remoção da distorção hard iron
#
# "
# "
"
B
B
B
δ m̂HIx
m(HI+SI)x
m(HI)x corrigido
.
(B.14)
− B
= B
B
δ m̂HIy
m(HI+SI)y
m(HI)y corrigido
- Rotação
"
#
=
fc 0
1
#"
B
m′(HI)x corrigido
B
m′(HI)y corrigido
"
cos(η) − sin(η)
sin η
cos η
#"
B
m(HI)x corrigido
B
m(HI)y corrigido
#
(B.15)
- Escalamento
"
m′′(HI)x corrigido
B ′′
m(HI)y corrigido
B
#
=
"
m′(HI)x corrigido
B ′
m(HI)y corrigido
B
#
, com fc =
- Rotação Inversa
"
# "
#"
B
m(HI+SI)x corrigido
cos(η) sin(η)
=
B
− sin η cos η
m(HI+SI)y corrigido
max
max
B
m′(HI)y corrigido
B m′
(HI)x corrigido
B
m′′(HI)x corrigido
B
m′′(HI)y corrigido
(B.16)
#
(B.17)
112
Em seguida, na Figura B.6, apresenta-se este procedimento de uma forma gráfica.
Para tornar a notação mais simples designa-se o eixo do sensor que coincide com o eixo do
x do referencial do corpo por Xh e por Yh o eixo do sensor que coincide com o referencial
do y do mesmo referencial.
(a) Remoçao da perturbaçao devido ao Hard Iron
(b) Rotaçao das leituras do magnetometro
Hard Iron Nao Corrigido
Hard Iron Corrigido
δB
Norte
Sul
Este
Oeste
400
300
Nao Rodada
Rodada
Norte
Sul
Este
Oeste
300
200
200
100
Xh [mG]
Xh [mG]
100
0
0
−100
−100
−200
−200
−300
−300
−400
−300
−200
−100
0
100
Yh [mG]
200
300
400
500
−400
−300
(a) Correcção da polarização do hard iron.
−200
−100
0
Yh [mG]
100
200
300
400
(b) Rotação da elipse.
(c) Escalamento
(d) Rotaçao inversa das leituras do magnetometro
400
400
300
300
Nao Escalada
Escalada
Norte
Sul
Este
Oeste
200
100
200
Rodada
(1)
100
Nao Rodada
Xh [mG]
Xh [mG]
(2)
0
Norte
0
(1)
Sul
(1)
Este
(1)
−100
−100
Oeste(1)
Norte
−200
(2)
Sul(2)
−200
Este
(2)
−300
Oeste(2)
−300
−400
−400
−500
−400
−300
−200
−100
0
Yh [mG]
100
(c) Escalamento.
200
300
400
500
−500
−400
−300
−200
−100
0
Yh [mG]
100
200
300
400
500
(d) Rotação inversa.
Figura B.6: Ilustração do processo de correcção das perturbações que afectam as medidas
do magnetómetro quando o mesmo completa uma volta de 360o no plano horizontal.
Os pontos cardeais representados na Figura B.6 representam a leitura do magnetómetro quando este está orientado segundo esses mesmos pontos cardeais, sob o efeito da
distorção e depois da respectiva transformação.
Quando se obtém o valor de heading a partir das leituras do magnetómetro, antes
e depois da correcção, observa-se uma melhoria significativa, tal como se demonstra na
Figura B.7.
Os resultados provam a validade algorítmica deste método de calibração. Mais à
frente, apresentam-se resultados de simulação que evidenciam o aumento do desempenho
ao nível da obtenção do heading recorrendo às medidas corrigidas do magnetómetro.
Este algoritmo, para além de não se basear num modelo de erro aproximado, tem
as seguintes vantagens:
113
(a) Erro no heading obtido das leituras do magnetometro antes e depois da correcçao
−8
0.4
1
ψm − ψreal [rad] (Mag. corrigido)
ψm − ψreal [rad] (Mag. corrigido)
ψm − ψreal [rad] (Mag. nao corrigido)
0.3
Erro no heading obtido das leituras do magnetometro depois da correcçao
x 10
0.8
0.6
0.2
0.4
ψm − ψreal [rad]
[rad]
0.1
0
−0.1
0.2
0
−0.2
−0.4
−0.2
−0.6
−0.3
−0.8
−0.4
−pi
−3pi/4
−pi/2
−pi/4
0
ψreal [rad]
pi/4
pi/2
3pi/4
pi
(a) Comparação antes e depois da correcção.
−1
−pi
−3pi/4
−pi/2
−pi/4
0
ψreal [rad]
pi/4
pi/2
3pi/4
pi
(b) Pormenor depois da correcção.
Figura B.7: Efeito da calibração no erro da medida de heading a partir do magnetómetro.
- As correcções são feitas directamente nas saídas do magnetómetro e não em outras
medidas obtidas com base nas primeiras
- Não necessita de outros sensores.
- Obriga à execução de uma manobra de calibração que, para a generalidade dos
veículos, é simples de executar.
Como desvantagens, pode-se afirmar que:
- As correcções são feitas directamente nas saídas do magnetómetro e não em outras
medidas obtidas com base nas primeiras.
- O algoritmo de calibração pode ser pesado, quer ao nível da capacidade computacional, quer ao nível de utilização de memória que, conforme o sistema utilizado, se
pode tornar num problema ou não.
- O desempenho do algoritmo degrada-se com o aumento dos ângulos de roll e de
pitch.
Considera-se que, para veículos com trajectórias predominantemente no plano horizontal, este algoritmo de calibração produza bons resultados.
Considerações Finais Sobre Algoritmos de Calibração
Quando se executa um procedimento de calibração, é aconselhável ter presente
que os resultados do mesmo só são válidos para as mesmas condições, ou seja, para os
mesmos sensores, veículo e instalação nesse mesmo veículo. Quando se altera a instalação
do magnetómetro, é de esperar que o procedimento de calibração produza resultados
diferentes.
Apêndice C
Descrição do Hardware
C.1
Placa MC-XAS3
A placa MC-XAS3 é parte de uma arquitectura, com uma topologia caracterizada
pelo empilhamento de várias placas de igual dimensão partilhando o mesmo barramento,
que contêm dispositivos com as mais diversas aplicações, o que torna o sistema muito
flexível.
C.1.1
Trata-se de uma placa microcontroladora de uso geral, com capacidade de comunicação série de tempo real (CAN 2.0) e série RS-232, sendo vocacionada para aplicações
de controlo distribuído em tempo real onde o tamanho e o consumo energético são de
extrema importância. Na Figura C.1, apresenta-se a placa MC-XAS3.
Figura C.1: Placa MC-XAS3.
É utilizado o microcontrolador Philips XA-S3. Este circuito pertence à família
Semiconductors XA (eXtendend Architecture) da Philips e consiste num microcontrolador
de 16 bit com 24 linhas de endereços a funcionar a 30 MHz. O microcontrolador contém
um ADC, três timers/counters, a função de Watchdog, PCA (Programmable Counter
115
116
Anexo C. Descrição do Hardware
Array), uma interface com o barramento I2 C (Inter-Integrated Circuit 1 ), duas portas
universal asynchronous receiver/transmitter (UART) e alguns portos entrada/saída que
o tornam adequado para um leque variado de funções.
C.1.2
-
Características Específicas
Um microcontrolador de 16 bit Philips XAS3.
Dois controladores CAN Intel 82527.
Uma XPLA Philips/Xilinx PZ5128.
Até 512 kbyte de memória flash e permite 1 Mbyte de memória RAM estática.
Uma única fonte alimentação de 5 V.
Até 15 Mbyte de memória externa mapeada para periféricos.
A informação anterior foi extraída de [137]. Na Figura C.2 apresenta-se o diagrama
de blocos da placa.
Figura C.2: Diagrama de blocos da placa MC-XAS3 (extraído de [11]).
C.1.3
1
Características do Microcontrolador Philips XAS3
Compatibilidade com núcleo 8051.
Espaço de endereçamento de 24 bit (16 Mbyte de código e dados).
CPU estático de 16 bit.
Instruções rápidas de multiplicação e divisão.
Conversor analógico-digital (ADC) de 8 bit de resolução e 8 canais.
Duas enhanced UART com taxas de transmissão independentes.
Frequência de relógio do microprocessador até 30 MHz.
O Inter-Integrated Circuit é um barramento série multi-master criado pela Philips que é utilizado
para conectar periféricos de baixa velocidade a uma placa mãe, ligar circuitos integrados em sistemas
embebidos, etc.
117
C.2. Arquitectura de Aquisição de Sinal
- Duração típica de 100 ns por instrução.
- Modos de operação com poupança de energia.
Suporte para CAN na Especificação 2.0:
-
Comunicações CAN até 1 Mbit/s.
Duas interfaces CAN Bus independentes.
Controlador CAN Intel 82527 a 16 MHz.
Philips 82C250 CAN transceiver com slope control.
Capacidades de endereçamento.
Interface de 16 bit.
C.2
C.2.1
Arquitectura de Aquisição de Sinal
Cada placa AD24B3C dispõe de três Texas Instruments ADS1210 Sigma-Delta 24
bit Analog to Digital Converter (ADC) com entradas analógicas diferencias. Para se obter
um melhor desempenho, as tensões de alimentação digital e analógicas estão separadas.
Várias placas AD24B3C, até um máximo de quatro, podem ser empilhadas formando uma
arquitectura com a capacidade de obter amostras de doze canais independentes dispondo
cada um deles de entradas diferenciais. Permite uma amostragem sincronizada, quer ao
nível de cada placa, quer ao nível da arquitectura completa, visto que a fonte de relógio
dos ADC é partilhada no barramento. A placa AD24B3C é apresentada na Figura C.3.
(a) Camada superior.
(b) Camada inferior.
Figura C.3: Placa AD24B3C.
A arquitectura completa e é composta por quatro placas AD24B3C que são empilhadas mecanicamente é apresentada na Figura C.4. Esta solução de montagem permite
a este sistema ser mecanicamente flexível e expansível.
118
Figura C.4: Arquitectura de aquisição de sinal analógico composta por placas AD24B3C
empilhadas.
A interface com esta arquitectura é conseguida através de um barramento desenvolvido especificamente para o efeito que permite ao utilizador endereçar individualmente (recorrendo a um dispositivo de lógica programável em cada placa) cada conversor
ADS1210.
C.2.2
ADC Texas Instruments ADS1210
Estes circuitos são desenhados para aplicações em que sejam necessárias medições de
elevada resolução. Trata-se de conversores do tipo Delta-Sigma de alta resolução (24 bit)
funcionando com uma única fonte de alimentação de 5 V. Aceitam entradas diferenciais
que são ideais para ligações directas a transdutores ou sinais de baixa tensão. Conseguese uma resolução efectiva de 23 bit usando um amplificador de baixo ruído em taxas de
conversão até aos 10 Hz. Resoluções efectivas de 20 bit conseguem-se até uma frequência
de amostragem de 1 kHz através da utilização do modo Turbo (Turbo Mode). De seguida,
apresenta-se uma lista mais detalhada das especificações deste circuito integrado [138].
2
Conversor Analógico-Digital Delta-Sigma.
Resolução efectiva de 23 bit a 10 Hz e de 20 bit a 1000 Hz.
Entradas diferenciais.
Amplificador de ganho programável (PGA).
Interface com barramento Serial Peripheral Interface 2 (SPI).
SPI é uma marca pertencente à Motorola, Inc.
119
- Frequência de corte programável até 15.6 kHz.
- Referência interna/externa.
- Auto-calibração integrada no circuito integrado.
Cada conversor é constituído por um amplificador de ganho programável (PGA),
um modulador Delta-Sigma de segunda ordem, um filtro digital programável, um microcontrolador, um circuito gerador de relógio e uma tensão de referência. Para mais detalhe
consultar o manual [139].
Circuito Programável Xilinx XC9536
O circuito que gera a lógica da placa MC-XAS3 e da placa AD24B3C é o XC9536 da
Xilinx. Este circuito tem por função gerar alguns sinais de controlo para os dispositivos
ligados, quer ao microcontrolador, quer aos ADC, desenvolver as máquinas de estados
necessárias e permitir alguma flexibilidade ao sistema.
O XC9536 é um circuito de lógica programável de alto desempenho e de utilização
genérica que permite programação in-system.
Características Específicas (extraído de [140])
- Atraso de propagação na parte lógica de 5 ns.
- Frequência de operação até 100 MHz.
- 36 macrocélulas com 800 portas lógicas úteis.
- Até 34 pinos de entrada/saída.
- Programação in-system a 5 V.
- Suporte IEEE Std 1149.1 boundary-scan (JTAG).
- Mode de baixo consumo enérgico configurável ao nível de cada macrocélula.
- Controlo do tempo de subida em cada pino de saída.
- Ligação programável de qualquer pino à massa do circuito.
- Capacidade de protecção de firmware.
- Capaz de fornecer até 24 mA num pino de saída.
- Compatibilidade entre entradas/saídas de 3.3 V e 5 V.
- Tecnologia avançada CMOS (complementary metal-oxide-semiconductor ) 5 V Fast
flash.
- Capacidade de ser programado em paralelo com outros dispositivos da mesma familia.
120
C.2.3
Caracterização do Desempenho da Placa AD24B3C
Existem técnicas específicas para medir e quantificar o desempenho de ADC. Dois
testes básicos incluem o uso de histogramas e a Fast Fourier Transform (FFT). Cada
tipo de teste fornece uma perspectiva única do desempenho do circuito.
O tipo de teste a usar é baseado no parâmetro a medir. Por exemplo, os histogramas
são utilizados para medir a exactidão em DC ou características estáticas como o offset,
por outro lado as FFT são uma ferramenta para medir o desempenho dinâmico, como
por exemplo a linearidade.
Neste caso, os sinais são na sua maioria de baixa frequência e filtrados (filtro passabaixo), por isso optou-se por apenas usar os histogramas para medir e quantificar o
desempenho dos conversores.
A saída de um ADC varia para uma entrada constante devido ao ruído. O ruído é
definido por uma Função Densidade de Probabilidade (PDF) que representa a probabilidade de eventos discretos. A forma da PDF descreve a exactidão da saída do ADC e a
sua característica de ruído.
Os testes realizados às três placas utilizadas foram feitos nas mesmas condições, fios
de sinal blindados, afastados de possíveis fonte de ruído e curto-circuitados entre si.
Para caracterizar cada ADC utilizaram-se medidas como a Resolução Efectiva (Effective Resolution,(ER)), bits livres de ruído (Noise Free Bits ou Peak-to-Peak Resolution,(NFb)) e Relação Sinal Ruído (Signal to Noise Ratio,SNR). As equações, para
calcular estes valores, apresentam-se de seguida.
O peso de cada LSB (Least Significative Bit) é dado por
VF S
,
(C.1)
LSB[V] = VQ =
2N
onde N representa o número de bits na palavra digital de saída (24 bit) e VF S representa
o alcance de medida máximo do ADC (Full-Scale Range Voltage), que para a presente
aplicação é igual a 10 V.
O valor quadrático médio (Root Mean Square, RMS) do ruído de uma sequência
discreta de amostras de um ADC é dado por
Vrms[V] = std (sADC (k) × VQ ) ,
(C.2)
onde std representa o cálculo do desvio padrão (standard deviation) e sADC (k) representa
uma sequência de amostras do ADC em estudo.
A Resolução Efectiva (ER) pode ser expressa em duas unidades diferentes: em bits
RMS (referenciado à saída digital) ou em volt RMS (referenciado à entrada analógica).
A ER, em unidades de bit é dada por [138]
10
20 log
− 1.76
Vrms[V]
ER[bitrms] =
,
(C.3)
6.02
e a resolução Noise Free Bits é dada por [138]
NFb[bit rms] = ER[bit rms] − 2.723.
(C.4)
121
Analiticamente, define-se o SNR por
SNR[dB] = 20 log
10
6.6 × Vrms[V]
(C.5)
.
Neste anexo apenas se apresenta os resultados do teste de uma das placas utilizadas.
Para informação sobre o desempenho das restantes placas consultar [139].
Analisando os histogramas da Figura C.5(a), Figura C.5(b), Figura C.6 (depois
de subtraída a média das leituras) e a Tabela C.1, conclui-se que se desenvolveu uma
placa de aquisição de sinal analógico de elevado desempenho. Para aplicações em sistema
de navegação, é fundamental poder contar com conversores de elevada resolução, pois
todo o processamento de sinal e cálculo posterior é baseado nos valores fornecidos por
estes. Para além disso, é fundamental que a limitação de exactidão não esteja do lado
dos conversores, mas sim dos sensores utilizados, de modo a conseguir-se obter o melhor
desempenho das medidas que estes fornecem.
(a) ADC 0
(b) ADC 1
Figura C.5: Histogramas dos ADC0 e ADC1 da placa AD24B3C.
Figura C.6: Histograma do ADC2 da placa AD24B3C.
122
Tabela C.1: Desempenho da placa AD24B3C.
Effective Resolution
Signal to Noise Ratio
Noise Free bits
C.3
C.3.1
ADC0
ADC1
ADC2
19.0488
100.043
16.326
18.872
98.9788
16.1493
18.997619
99.734787
16.274882
Unidades
[bit]
[dB]
[bit]
Placa ASHDG14If - Interface com GPS Ashtech
A placa ASHDG14If foi projectada para fazer a interface entre a placa de circuito
impresso receptora do Sistema de Posicionamento Global Ashtech DG14 e o barramento
ao qual está ligado a placa MC-XAS3. Visto que o DG14 funciona com lógica de 3 V,
e a placa MC-XAS3 com lógica de 5 V, esta placa faz a conversão bidireccional entre os
níveis lógicos 3 V e 5 V.
Figura C.7: Placa ASHDG14If.
C.3.2
- Interface do GPS com o barramento da placa MC-XAS3.
- Interface do GPS com um dispositivo RS-232 externo.
- Fornece o sinal Pulso Por Segundo (PPS) à placa MC-XAS3 e dispositivos externos.
- Escolha pelo utilizador da interrupção na placa MC-XAS3.
- Permite a escolha da tensão eléctrica de alimentação da antena (3 V ou 5 V).
- Escolha pelo utilizador da interrupção na placa MC-XAS3.
- Alimentação externa ou através do barramento da placa MC-XAS3.
- Conversão interna de 5 V para 3 V.
C.4. Placa DSPIf - Interface com D.Module.VC33
C.4
123
Placa DSPIf - Interface com D.Module.VC33
C.4.1
A placa DSPIf foi desenvolvida para fazer a interface com o módulo de processamento digital D.Signt.T D.Module.VC33 e a placa MC-XAS3. A razão que levou ao
desenvolvimento desta placa prende-se com a falta de capacidade de processamento da
placa MC-XAS3 (baseada num microcontrolador de 16 bit). Com a placa D.Module.VC33,
incorporou-se nesta arquitectura de tempo real toda a capacidade computacional de um
a sete DSP de 32 bit, de vírgula flutuante com desempenho até 150 MFLOPS (Milhões
de Operações de Vírgula Flutuante por Segundo). A filosofia do conceito de interface
ilustra-se na Figura C.8 que se caracteriza por um canal de comunicação implementado
com uma memória RAM de dois portos.
Figura C.8: Diagrama conceptual da interface entre a placa MC-XAS3 e o
D.Module.VC33.
C.4.2
Os circuitos integrados mais importantes nesta placa são:
- IDT High Speed 2 k × 16 Dual-Port SRAM.
- Xilinx XCR5128 Complex Programmable Logic Device.
Com a integração da placa DSPIf, conseguiu-se criar um canal de comunicação entre
dois sistemas com características bastante diferentes, tendo-se recorrido a uma memória
RAM de dois portos. Ao contrário da maioria dos sistemas de memória partilhada (que
são de acesso multiplexado), este tipo de memória tem dois portos independentes fisicamente disponíveis, com as respectivas linhas de controlo, barramentos de dados e de
124
(a) Diagrama de blocos da placa DSPIf.
(b) Placa DSPIf.
Figura C.9: Diagrama de blocos e imagem da placa DSPIf.
endereçamento. Na Figura C.9(a) apresenta-se o diagrama funcional da placa DSPIf com
a memória de dois portos que, a partir deste momento, vai ser designada por DP-RAM.
A Complex Programmable Logic Device XPLA funciona como ponte na interface
entre a placa MC-XAS3 e a DP-RAM, e entre o D.Module.VC33 e a DP-RAM, gerando
para cada tipo de acesso, os sinais de controlo correspondentes. A placa DSPIf oferece
um canal de informação entre o D.Module.VC33 e a placa MC-XAS3 que possibilita do
lado da MC-XAS3 uma taxa de transferência de dados mínima de cerca de 1 Mbyte/s,
podendo a do DSP ser mais de 10 vezes superior.
C.5
C.5.1
Placa D.Signt.T D.Module.VC33
O D.Module.VC33 é uma placa de processamento digital de sinal de vírgula flutuante de desempenho médio, que pertence à família D.Module (consultar Figura C.10). O
seu objectivo são aplicações embebidas do tipo stand-alone que requerem funcionalidade
e flexibilidade máximas e baixo consumo de potência. Os requisitos de baixo consumo
tornam possível a sua utilização em aplicações móveis alimentadas a baterias. Dispõem de
um conjunto de funções denominado por D.Module.BIOS que permite tratar da programação de baixo nível de hardware. Uma CPLD programável pelo utilizador providencia
32 sinais de entrada/saída que possibilitam a interface flexível com dispositivos ou barramentos standard. A manutenção em campo é facilitada pela Set-Up Utility que permite
armazenar parâmetros específicos a cada aplicação por meio de ficheiros de texto recorrendo à memória Flash. É compatível ao nível de código objecto com o DSP TMS320C31
o que permite duplicar o desempenho de sistemas antigos já que se passa de 75 MFLOPS
(C31) para 150 MFLOPS (VC33).
- DSP TMS320VC33 a 150 MHz, vírgula flutuante 32/40 bit, vírgula fixa 24/32 bit,
C.5. Placa D.Signt.T D.Module.VC33
125
Figura C.10: Placa D.Module.VC33.
DMA.
- Memória:
34k × 32 bit de memória de acesso duplo interna ao DSP
64k ou 256k x 32 bit de memória SRAM na placa, 1 wait state (33 ns)
512 kbyte de memória flash não volátil, arquitectura de sectores uniformes
- 1 UART 16C650 com taxas de transmissão até 460 kbyte, FIFO (First In, First Out)
de transmissão e recepção 32 words , RTS/CTS e Xon/Xoff Auto-Flow-Control,
suporte DMA, interface RS-232 (opção RS422/485).
- 2 timers internos do DSP de 32 bit, geração de relógio, pulsos ou contagem de
eventos externos.
- 1 porto série síncrono de transmissão e 1 porto série síncrono de recepção interno
ao DSP com taxa de transmissão até 32 Mbit/s, 2 timers de 16 bit para geração de
relógio e sincronização de tramas ou relógios externos.
- Barramento externo de 32 bit de dados 8 M de espaço de endereçamento.
- 32 portos de entrada/saída programáveis pelo utilizador (CPLD XCR3064XL programável in-system com 64 macrocélulas e pinos de entrada, saída ou bi-direccionais).
- 4 interrupções externas, 7 interrupções internas com disparo ao flanco descendente
multiplexadas com a UART e a CPLD.
- Tensões de alimentação únicas de 3.3 V a 5 V, com consumo em modo idle de 6
mA, consumo típico de 100 mA com todas as interfaces tolerantes a 5 V.
- Sofware D.Module.BIOS que permite fazer inicialização e configuração do módulo,
inicialização da UART e das comunicações, programar a memória flash e com funções de Boot-Loader.
- Software Set-Up Utility que permite fazer o upload de ficheiros ASCII (American
Standard Code for Information Interchange) e binários, programar a CPLD, configurar o módulo, memory dump, alterar a memória e executar programas/funções.
- Watchdog e supervisor de tensões de alimentação, interface JTAG para in-circuit
emulation.
126
C.5.2
DSP Texas Instruments TMS320VC33
O TMS320VC33 é um processador digital de sinal de vírgula flutuante de 32 bit,
fabricado com a tecnologia 0.18 µm four-level-metal CMOS Timeline. O TMS320VC33
faz parte da geração TMS320C3X de DSP da Texas Instruments.
O barramento interno dos TMS320C3X e o conjunto de instruções especiais de processamento digital de sinal permite executar 150 (MFLOPS). A optimização, em termos
de velocidade de execução, é fruto da implementação em hardware de funções habitualmente implementadas em software ou microcode. Este tipo de abordagem permite um
desempenho até agora inexistentes num único circuito integrado. O TMS320VC33 pode
executar multiplicações em paralelo com operações da Arithmetic and Logic Unit (ALU)
em inteiros ou vírgula flutuante num ciclo único. O TMS320VC33 suporta uma vasta
gama de aplicações que vão desde processador principal a co-processador dedicado, disponibilizando um largo espaço de endereçamento, suporte de linguagens de alto nível,
modos de endereçamento e conjunto de instruções flexíveis. Com o TMS320VC33 ganhase em relação ao TMS320C31 1 Mbit de SRAM interna. Dispõe também de um porto
série, 2 timers de 32 bit entre outros.
- Ciclo de instrução de 13 ns.
- 150 Milhões de Operações de Vírgula Flutuante por Segundo (MFLOPS).
- 34k x 32 bit (1.1 Mbit) de SRAM de acesso duplo configurada em 2 × 16k mais 2
× 1k blocos para aumentar o desempenho interno.
- Baixo consumo: < 200 mW a 150 MFLOPS.
- Operações de inteiros de 16-/32 bit e de vírgula flutuante de 32-/40 bit.
- Interrupções externas seleccionáveis EDGEMODE.
- Endereços de 24 bit e instruções de words de 32 bit.
- 8 registos de precisão estendida.
- Periféricos mapeados internamente.
- 1 porto série.
- 2 timers de 32 bit.
- Acesso directo à memória (DMA).
- Execução paralela da ALU e do multiplicador num único ciclo.
- 2 modos de baixo consumo.
- Boot-Program Loader.
A informação anterior foi extraída de [141] e [142].
127
C.6. Placa MC_AVRCAN128
C.6
C.6.1
Placa MC_AVRCAN128
A placa MC_AVRCAN128 foi desenvolvida em torno do microcontrolador Atmel
AVR AT90CAN128 com o propósito de constituir um sistema de utilização genérica
para interface a sensores e actuadores com a capacidade de interface com o CAB bus. As
camadas superior e inferior da placa MC_AVRCAN128 são apresentadas na Figura C.11.
O integrado AT90CAN128 é descrito com maior detalhe em C.6.2.
Figura C.11: Placa MC_AVRCAN128.
C.6.2
Com o objectivo de aumentar a flexibilidade de integração num qualquer sistema, os
periféricos do microcontrolador AVR AT90CAN128 foram disponibilizados em conectores
para permitir fazer a interface com o exterior. As interfaces possíveis são:
- Interface com CAN bus.
- Interface Two-Wire Interface.
3
(TWI) (compatível com I2 C).
- Interface SPI.
- 2 canais de geração e 1 captura de PWM (Pulse Width Modulation) de 16 bit.
- Porto paralelo de entrada/saída de uso genérico (com interrupções).
TWI (Two-Wire Interface) é na sua essência igual ao barramento I2 C e é utilizado por vários fabricantes de circuitos integrados, tais como a Atmel, com uma designação alternativa para evitar questões
relacionadas com direitos de patente.
3
128
Atmel AVR AT90CAN128
-
Arquitectura RISC (Reduced Instruction Set Computer ) avançada.
Memória de programa e de dados não volátil.
Interface JTAG (compatível com a norma IEEE std.1149.1).
Controlador CAN 2.0A e 2.0B.
Watchdog timer programável com oscilador integrado.
Temporizador/Contador síncrono de 8 bit.
Temporizador/Contador assíncrono de 8 bit.
2 temporizadores/contadores de 16 bit.
ADC de aproximações sucessivas de 10 bit.
3 tipos de interfaces série (TWI, 2 USART, SPI).
8 interrupções externas, oscilador interno RC, 5 modos de baixo consumo.
Tensão eléctrica de operação de 2.7 V a 5.5 V.
Frequência máxima de operação (8 MHz a 2.7 V, 16 MHz a 4.5 V).
Interface CAN Bus
-
15 Message Objects com identificadores e máscaras independentes.
Modos de transmissão, recepção, resposta automática e Frame Buffer
Taxa de transmissão máxima de 1 Mbit/s com oscilador de 8 MHz.
Time stamping, TTC, Listening Mode (Spying ou Autobaud )
129
C.7. Placa HMR_MB - Interface com HMR3300
C.7
C.7.1
Placa HMR_MB - Interface com HMR3300
A placa HMT_MB foi desenvolvida para fazer a interface com a placa do magnetómetro Honeywell HMR3300. Fornece interface mecânico, eléctrico e electrónico ao
HMR3300 permitindo a este dispositivo ser facilmente integrado numa larga variedade de
arquitecturas distribuídas visto que possibilita acesso ao CAN bus e ao protocolo RS-232.
As camadas superior e inferior da placa HMR_MB são apresentadas na Figura C.12. O
integrado AT90CAN128 é descrito com maior detalhe em C.6.2.
Figura C.12: Placa HMR_MB.
Na Figura C.13 apresenta-se uma ilustração do empilhamento da placa do magnetómetro na placa HMR_MB.
Figura C.13: Placa do HMR3300 empilhada na placa HMR_MB.
130
C.7.2
Diagrama de Blocos
Na Figura C.14 apresenta-se o diagrama de blocos da placa HMR_MB.
Figura C.14: Diagrama de blocos da placa HMR_MB.
131
C.8. Placa BatMonit
C.8
C.8.1
Placa BatMonit
A placa BatMonit, contém como circuitos principais, o microcontrolador Atmel AVR
AT90CAN128 e o Fuel Gauge MAX1660 da Maxim. Foi desenvolvida para monitorizar
a carga e descarga de baterias e dispõe da capacidade de detectar condições perigosas
de carga e de descarga das mesmas. Quando estas situações são detectadas, consegue,
protegendo a bateria, desligar o carregador ou a carga a que está conectada. As camadas
superior e inferior da placa BatMonit são apresentadas na Figura C.15. O integrado
AT90CAN128 é descrito com maior detalhe em C.6.2.
Figura C.15: Placa BatMonit.
C.8.2
Circuito Integrado Fuel Gauge (Maxim MAX1660)
O MAX1660 é um contador de cargas eléctricas digital que executa duas funções
extremamente importantes na manutenção de baterias recarregáveis: fuel gauging e protecção contra excesso de corrente. Monitoriza a corrente de carga e descarga de um pack
de baterias e regista cada uma delas em dois contadores de Coulomb independentes.
- 1% de precisão num intervalo de medição de corrente dos 600 µA a 4 A (RSEN SE =
30 Ohm)
- Tensão de offset de entrada de 5 µV (máximo de 28 µV).
- Interface série SMBus 2-Wire (interrupção opcional).
- Referência de precisão interna de 2.00 V.
132
-
Regulador linear de 3.3 V para alimentar circuitos externos.
2 modos de baixo consumo (< 1 µA Shutdown Current).
Contadores de 32 bit independentes para carga e descarga.
Protecção de sobrecarga e sobredescarga.
Protecção da bateria contra curto-circuito.
Drivers integrados para MOSFET (Metal Oxide Semiconductor Field Effect Transistor ) de potência.
- 80 µA de corrente de operação.
C.8.3
Diagrama de Blocos
Na Figura C.16 apresenta-se o diagrama de blocos da placa BatMonit.
Figura C.16: Diagrama de blocos da placa BatMonit.
133
C.9. Placa SWLNPWR
C.9
Placa SWLNPWR
C.9.1
A placa SWLNPWR contém quatro fontes de alimentação comutadas de alta eficiência desenvolvidas para gerarem tensões de alimentação reguladas a partir de uma
única fonte de tensão que pode variar entre 2.7 V e 24 V. As tensões de saída de cada
fonte comutada é individualmente configurada através de um circuito resistivo e pode
variar entre os 3 V e os 24 V. A camada superior da placa SWLNPWR é apresentada na
Figura C.17. O circuito integrado AT90CAN128 é descrito com maior detalhe em C.6.2.
Figura C.17: Placa SWLNPWR.
C.9.2
-
Tensão de entrada de 2.7 V a 24 V.
Tensão de saída de 3 V a 24 V.
Corrente máxima de saída de 1.5 A (750 mA com regulador linear).
Tensões de saída positivas e negativas.
Tensão de saída opcional de muito baixo ruído 1µV (0.1 Hz - 10 Hz) a 15 mA.
134
C.9.3
Diagrama de Blocos
Na Figura C.18 apresenta-se o diagrama de blocos da placa SWLNPWR.
#$'
#$
!"
!"
!"
!"
#$(
#$
#$)
#$*
Figura C.18: Diagrama de blocos da placa SWLNPWR.
Apêndice D
Especificações Técnicas dos Sensores
D.1
Acelerómetro Crossbow CXL02TG3
O princípio de funcionamento do acelerómetro pode socorrer-se de diversos conceitos
físicos. No entanto, a grandeza medida é independente da tecnologia utilizada portanto,
conceptualmente, o dispositivo equivale ao sistema físico que consiste numa massa ligada a
uma mola cuja frequência natural é muito superior à frequência máxima de funcionamento
do acelerómetro, como referido em [80]. Da segunda lei de Newton, uma massa sujeita
a acelerações sofre uma força que resulta na distensão da mola, originando uma força
elástica de sentido contrário. Medindo o comprimento da mola determina-se a aceleração
segundo o eixo de leitura do acelerómetro. Como qualquer massa está constantemente
sujeita à força gravítica, os acelerómetros medem uma aceleração que não existe, de
sentido contrário à gravidade. Assim a medida designada por força específica, resulta da
aceleração do veículo menos a aceleração gravítica. Um modelo possível para as medidas
de um acelerómetro em movimento é dado por
f=
d Bv
+ ω × B v − B g,
dt
B
(D.1)
onde ddtv é a aceleração linear, ω × B v é a aceleração centrípeta, e B g é o vector de
gravidade no referencial {B}. Para este trabalho, foi escolhido o acelerómetro CXL02TG3
da Crossbow Technology, Inc. cuja fotografia é apresentada na Figura D.1.
Trata-se de um acelerómetro triaxial de alto desempenho com um intervalo de medição entre −2 g e +2 g. O sensor fornece medidas em formato de sinal analógico já
com condicionamento de sinal interno o que facilita, de forma significativa, a integração
noutros sistemas de aquisição de sinal, visto que não necessita de mais circuitos externos
de condicionamento. Emprega tecnologia MEMS tendo um elemento sensível capacitivo
diferencial com 3 camadas de silício o que lhe confere grande estabilidade e muito baixo
ruído nas medições. Para funcionar necessita somente de uma fonte de alimentação única
que pode ir de 3.3 V a 5.5 V. Dispõe também de um sensor de temperatura interno que
permite a sua operação com grande precisão em condições de temperatura extremas. É
uma escolha bastante viável e atractiva para sistemas operados por baterias (tal como
é a plataforma desenvolvida neste trabalho) visto que apresenta um consumo de corrente eléctrica de somente 1.5 mA. A Tabela D.1 apresenta um resumo das principais
características do Crossbow CXL02TG3.
135
136
Anexo D. Especificações Técnicas dos Sensores
Figura D.1: Acelerómetro CXL02TG3 da Crossbow Technology, Inc..
Tabela D.1: Especificações técnicas do acelerómetro Crossbow CXL02TG3 (extraído de
[13]).
Especificação
Intervalo de medição
Sensibilidade
Densidade de ruído
Ruído a Largura de Banda de 100 Hz
Resposta em frequência
Temperatura de Operação
Resistência ao choque
Resistência à vibração (20 a 500 Hz)
Tensão eléctrica de operação
Corrente eléctrica de operação
Mínimo
767
Típico
±2
833
20
0.6
200
−40
3.3
1.5
Máximo
900
+125
6000
20
5.5
2
Unidades
[g]
[mV/g]
√
[µg/ 2 Hz]
[mg] rms
[Hz]
[o C]
[g]
[g] rms
[V]
[mA]
Em termos mecânicos, este sensor apresenta também boas características para utilização em plataformas móveis, visto que se apresenta sob a forma de uma pequena caixa
de alumínio anodizado industrial que é resistente à humidade e robusta mecanicamente.
D.2
Giroscópio de Velocidade Silicon Sensing Systems CRS03
Este sensor transforma velocidades angulares num valor analógico de tensão eléctrica
que é proporcional à grandeza física medida. É alimentado electricamente por uma fonte
de tensão de 5 V e é conhecido por ter um bom desempenho em condições severas de
vibração, choque e temperatura, o que o torna uma boa opção para plataformas marinhas
onde são abundantes as variações de temperatura e vibrações mecânicas. Na Figura D.2
apresenta-se uma ilustração do giroscópio Silicon Sensing CRS03.
137
D.2. Giroscópio de Velocidade Silicon Sensing Systems CRS03
Figura D.2: Giroscópio de velocidade CRS03 da Silicon Sensing Systems.
Tabela D.2: Especificações técnicas do giroscópio de velocidade Silicon Sensing Systems
CRS03 (extraído de [14]).
Especificação
Valor
Unidades
Factor de escala
Variação com a temperatura do factor de escala
Polarização (depois de power-up)
Polarização (com a temperatura)
Tempo de resposta
Largura de banda
Quiescent noise (típico)
Temperatura de operação
Resistência ao choque
Tensão eléctrica de operação
Corrente eléctrica de operação
Massa
±100
20
±3
±100
±10
0.5
10
1
−25o Ca + 85
200
4.75 a 5.25
< ±50
25
[o /s]
[mV/o /s]
[%]
[mV]
[o /s]
[s]
[Hz]
[mV] (rms)
[o C]
[g] (1 [ms] 1/2sin)
[V] (ratiometric)
[mA]
[g]
138
D.3
Magnetómetro Honeywell HMR3300
O HMR3300 Digital Compass Solutions apresentado na Figura D.3, é um dispositivo
que inclui toda a electrónica e sensores básicos para fornecer uma leitura digital de rumo.
Para tal, faz uso de 3 sensores magnéticos e um acelerómetro biaxial que fornece leituras
Figura D.3: Magnetómetro HMR3300 (extraído de [12]).
de pitch e roll visto que a sua instalação coloca os dois eixos de medida na horizontal da
placa. A Tabela D.3 apresenta de forma compacta algumas das principais características
deste sensor.
Tabela D.3: Características do Honeywell HMR3300 Digital Compass (extraído de [12]).
Características
Benefícios
Solução compacta numa Placa de
Tamanho reduzido para integração
Circuito Impressa de 2.54 × 3.81 cm com placas mãe
Bússola precisa
Precisão ±1o no plano horizontal,
resolução ±0.1o
Compensação de Tilt
compensação de ângulos de pitch e roll
até ±60o (com acelerómetros)
Repetibilidade 0.5o
Sensores magnetoresistivos para consistência
Frequência de amostragem
Rápida computação do rumo
de 8 Hz
essencial em aplicações de controlo
Compensação interna de
Calibração a pedido do utilizador
Hard-Iron
e posterior correcção de offsets
Temperatura de Operação
Utilização comercial e
o
o
entre −40 e +85 C
industrial
Comunicações UART e
Linguagem de comandos
SPI
intuitiva
Este tipo de dispositivos é utilizado em aplicações onde é necessária uma elevada
precisão na medida de um rumo. Esta precisão é fornecida através da utilização de sensores magnetoresistivos o que torna esta solução uma bússola digital de estado sólido. A
139
D.3. Magnetómetro Honeywell HMR3300
integração deste dispositivo noutros sistemas é trivial visto só ser necessário uma interface com lógica de 5 V e a troca de comandos no formato ASCII. O seu baixo consumo
energético (máximo de 24 mA a 6 V), faz com que seja uma boa opção para sistemas
com recursos energéticos limitados.
O HMR3300 inclui acelerómetros MEMS (microelectromechanical systems) que lhe
possibilitam fazer leituras tri-axiais do campo magnético terrestre com compensação de
tilt, isto é, permite obter leituras de rumo mesmo quando o dispositivo não se encontra
na horizontal.
As Tabelas D.4, D.5 e D.6 resumem as especificações técnicas do HMR3300.
Tabela D.4: Especificações técnicas para a medida de yaw do Honeywell HMR3300 Digital
Compass (extraído de [12]).
Características (rumo) Condições
Mínimo
Nivelado
0o a ±30o
±30 a ±60o
Precisão
Resolução
Histerese
Repetibilidade
Típico
1
3
4
0.1
0.2
0.2
Máximo Unidades
[o ] (rms)
[o ] (rms)
[o ] (rms)
[o ]
[o ]
[o ]
0.4
0.4
Tabela D.5: Especificações técnicas para a medida de roll e pitch do Honeywell HMR3300
Digital Compass (extraído de [12]).
Características
Condições
Precisão
Pitch e Roll
0o a ±30o
±30 a ±60o
Resolução
Histerese
Repetibilidade
Mínimo Típico
Máximo Unidades
[o ]
[o ]
[o ]
[o ]
[o ]
[o ]
±60
0.5
1.2
0.4
1.0
0.1
0.2
0.2
Tabela D.6: Especificações técnicas para a medida de campo magnético do Honeywell
HMR3300 Digital Compass (extraído de [12]).
Características
Condições
Campo magnético
Densidade de fluxo do
campo magnético máximo
Resolução
Mínimo
Típico
Máximo
[Gauss]
±2
0.1
Unidades
0.5
[mGauss]
140
D.4
GPS Thales Navigation DG14
O receptor de GPS DG14 processa sinais da constelação de satélites do Sistema de
Posicionamento Global (Global Positioning System,GPS), de satélites geoestacionários
da rede Satellite-based Augmentation System (SBAS) incluindo: Wide Area Augmentation System network (WAAS), da rede European Geostationary Navigation Overlay
System (EGNOS), da rede Japanese Multi-function Transport System System (MSAS), e
de transmissões de beacons de 300 kHz para fornecer medidas em tempo real de posição,
velocidade e tempo. Na Figura D.4 apresenta-se uma ilustração do referido GPS.
O DG14 utiliza catorze canais discretos e paralelos para efectuar medidas de código
e fase de Coarse/Acquisition (C/A) (para obter pseudo-ranges) e para fazer medidas de
fase da portadora L1 (1575.42 MHz). Para medições de WAAS, EGNOS, ou MSAS,
pode utilizar dois dos canais paralelos. O DG14 recebe sinais de satélites através de uma
antena de banda-L e de um amplificador de baixo ruído.
Foi desenvolvido para operar em modo autónomo ou em modo diferencial (DGPS),
tendo a capacidade de desempenhar a função de estação base de referência ou de estação
móvel, fornecendo ou utilizando correcções diferenciais em tempo real no formato RTCM
(Radio Technical Commission for Maritime Services) SC-104 (versão 2.2). O formato
RTCM SC-104 é um formato standard para transmissão de correcções diferenciais.
Figura D.4: GPS DG14 da Thales.
Para além das aplicações relacionadas com navegação de veículos (posicionamento),
este dispositivo encontra também aplicações como solução de baixo custo em sistemas de
atitude ou monitorização de deformações em estruturas.
D.4. GPS Thales Navigation DG14
141
Em seguida, apresenta-se de forma sumariada algumas das características técnicas
do GPS Thales DG14:
-
-
Receptor GPS de 14 canais (12 para código e fase, 2 para SBAS (WAAS/EGNOS/MSAS)).
Tensão de alimentação: 5 V.
Consumo energético de cerca de 1.2 watt).
Datums definidos pelo utilizador e outros predefinidos.
Comunicações série bi-direccionais por três portos RS-232.
Saída de dados raw (código e fase).
Captura precisa da fase da portadora.
Saída no formato NMEA-0183 V3.0.
Frequência de amostragem configurável para posição e dados raw até 20 Hz.
Informação sobre a latência da medida de posição.
Saída de dados raw (código e fase).
Saída 1 Pulso Por Segundo (5 V TTL) com precisão: 200 ns (autónomo) 50 ns
(diferencial).
Algoritmos baseados em filtragem de Kalman.
Velocidade máxima: 514 m/s.
Altitude máxima: 18.288 km.
Precisão na velocidade: 95 %: 0.0514 m/s.
Time To First Fix
Re-acquisition 3 s
Hot start 11 s
Warm start 35 s
Cold start 90 s
Precisão da posição em tempo real:
• Autónomo:
CEP: 3.0 m
95%: 5.0 m
• Diferencial:
- Estação base local:
CEP: 40 cm
95%: 90 cm
- Beacon:
CEP: 70 cm
95%: 1.6 m
- SBAS:
CEP: 1.0 m
95%: 3.0 m
Bibliografia
[1] Projecto EFACEC/IST, 1991.
[2] National Aeronautics and Space Administration. http://www.nasa.gov, 2008.
[3] Schiebel Group. http://www.schiebel.net/, 2008.
[4] The Institute of Navigation Museum. http://www.ion.org/museum, 2008.
[5] Caruso, M. A New Perspective on Magnetic Field Sensing. Honeywell Inc., 1998.
[6] National Oceanic and Atmospheric Administration. http://www.ngdc.noaa.gov/,
2008.
[7] Alves, J. Arquitecturas distribuídas para controlo de veículos autónomos. Master’s
thesis, Instituto Superior Técnico, Abril 2006.
[8] IEEE Std 1431-2004. IEEE Standard Specification Format Guide and Test Procedure for Coriolis Vibratory Gyros. IEEE Aerospace and Electronic Systems Society,
2004.
[9] Silicon Sensing Systems. http://www.siliconsensing.com, 2008.
[10] Titterton, D. and Weston, J. Strapdown Inertial Navigation Technology. EE Radar,
Sonar, Navigation and Avionics Series, 2004.
[11] Alves, J. and Silvestre, C. A Distributed Architecture For Realtime Control. Technical Report, IST/ISR, 1999.
[12] Honeywell. Digital Compass Solutions HMR3200/HMR3300, December 2005.
[13] Crossbow Technology, Inc. CXL-TG Series-High performance accelerometer triad,
2006.
[14] Silicon Sensing Systems Limited. CRS03 rate gyro datasheet, 2000.
[15] Committee on Autonomous Vehicles in Support of Naval Operations. Autonomous
Vehicles in Support of Naval Operations. The National Academic Press, Washington, D.C., 2005.
[16] Lobo Pereira, F. Sistemas e veículos autónomos - aplicações na defesa. Curso de
Defesa Nacional, 2005.
143
144
BIBLIOGRAFIA
[17] Joint Robotics Program. FY2004 Joint Robotics Master Plan. OUSD Defense
Systems/Land Warfare and Munitions,Pentagon, Washington, D.C., 2004.
[18] Pascoal, A., Silvestre, C., Oliveira, P., Bjerrum, A., Ayela, G., Paul-Pignon, J.,
Bruun, S., and Petzelt, C. Marius: An autonomous underwater vehicle for coastal
oceanography. IEEE Robotics and Automation Magazine, Special Issue on Robotics
and Automation in Europe: Projects funded by the Commission of the European
Union, pages 46–59, December 1997.
[19] Blidberg, D. The development of autonomous underwater vehicles (auvs): A brief
summary. AUSI, ICRA, Seoul, Korea, May 2001.
[20] Instituto de Sistemas e Robótica, Lisboa. http://www.isr.ist.utl.pt, 2008.
[21] Instituto Superior Técnico, Lisboa. http://www.ist.utl.pt, 2008.
[22] Woods Hole Oceanography Institution. http://www.whoi.edu/, 2008.
[23] National Oceanography Centre, Southampton,Underwater Systems Laboratory.
http://www.noc.soton.ac.uk, 2008.
[24] Bluefin Robotics Corporation. http://www.bluefinrobotics.com, 2008.
[25] MIT Sea Grant’s AUV Lab. http://auvlab.mit.edu, 2008.
[26] Autonomous Undersea Systems Institute. http://www.ausi.org, 2008.
[27] Falmouth Scientific, Inc. http://www.falmouth.com, 2008.
[28] Marine and Industrial Dynamic Analysis Research Group, University of Plymouth,
Plymouth, UK . http://www.tech.plymouth.ac.uk/sme/springerusv, 2008.
[29] Marine Robotic Vessels International. http://www.mrvint.com, 2008.
[30] Robotic Marine Systems, LLC . http://www.maribotics.com, 2008.
[31] CNR-ISSIA, University of Genova, Italy. http://www.charlie.ge.issia.cnr.it,
2008.
[32] Pascoal, A., Oliveira, P., Silvestre, C., Sebastião, L., Rufino, M., Barroso, V.,
Gomes, J., Coince, P., Ayela, G., and others. Robotic ocean vehicles for marine
science applications: the european asimov project. Oceans, 2000.
[33] Bell Helicopter. http://www.bellhelicopter.com, 2008.
[34] General Atomics Aeronautical Systems, Inc. http://www.ga-asi.com, 2008.
[35] Aerosonde Pty, Ltd. http://www.aerosonde.com/, 2008.
[36] General Atomics Aeronautical Systems, Inc. http://www.is.northropgrumman.com,
2008.
[37] Boeing. http://www.boeing.com, 2008.
145
BIBLIOGRAFIA
[38] Mettler, B., Tischler, M. B., and Kanade, T. System identification of small-size
unmanned helicopter dynamics. In Presented at the American Helicopter Society
55th Forum, May 1999.
[39] Mettler, B., Tischler, M. B., and Kanade, T. System identification modeling of
a small-scale unmanned helicopter. Journal of the American Helicopter Society,
October 2001.
[40] Evans, J., Inalhan, G., Jang, J. S., Teo, R., and Tomlin, C. Dragonfly:a versatile
uav platform for the advancement of aircraft navigation and control. In 20th IEEE
Digital Avionics Systems Conference, October 2001.
[41] Jang, J. S. and Tomlin, C. Design and implementation of a low cost, hierarchical
and modular avionics architecture for the dragonfly uavs. In AIAA Guidance,
Navigation, and Control Conference, Monterey, August 2002.
[42] Shim, H. Hierarchical Flight Control System Synthesis for Rotorcraft-based Unmanned Aerial Vehicles. PhD thesis, University of California, Berkeley, December
2000.
[43] Gavrilets, V., Shterenberg, A., Dahleh, M. A., and Feron, E. Avionics System For
A Small Unmanned Helicopter Performing Aggressive Maneuvers. MIT Cambridge,
2000.
[44] Sanghyuk, P. Avionics and Control System Development for Mid-Air Rendezvous
of Two Unmanned Aerial Vehicles. PhD thesis, MIT Cambridge, February 2004.
[45] Kahn, A. D. The design and development of a modular avionics system. Master’s
thesis, Georgia Institute of Technology, April 2001.
[46] Dittrich, J. S. Design and integration of an unmanned aerial vehicle navigation
system. Master’s thesis, Georgia Institute of Technology, May 2002.
[47] DragonFly
UAV
Project,
http://airtraffic1.stanford.edu/~uav, 2008.
Stanford
University.
[48] Stanford University. http://www.stanford.edu, 2008.
[49] Yamaha Motor Co. Ltd. http://www.yamaha-motor.co.jp/global/, 2008.
[50] Autonomous Helicopter Project, Carnegie Mellon Robotics Institute.
http://www-2.cs.cmu.edu/afs/cs/project/chopper/www/heli_project.html,
2008.
[51] Carnegie Mellon University. http://www.cmu.edu, 2008.
[52] Massachusetts Institute of Technology. http://web.mit.edu, 2008.
[53] Projecto
AVATAR:
Autonomous
Vehicle
Aerial
Tracking
And
Reconnaissance.
The
Robotic
Embedded
Systems
Laboratory.
http://robotics.usc.edu/~avatar/index.html, 2008.
146
BIBLIOGRAFIA
[54] The Robotic Embedded Systems Laboratory, University of Southern California.
http://asimov.usc.edu/resl/index.html, 2008.
[55] University of Southern California. http://www.usc.edu, 2008.
[56] Unmanned Aerial Vehicle Research Facility, Georgia Institute of Technology.
http://controls.ae.gatech.edu/uavrf, 2008.
[57] Georgia Institute of Technology. http://www.gatech.edu, 2008.
[58] Projecto
BEAR,
University
of
California
http://robotics.eecs.berkeley.edu/bear, 2008.
at
Berkeley.
[59] University of California at Berkeley. http://www.berkeley.edu, 2008.
[60] Craig, J. J. Introduction to Robotics: Mechanics and Control. Prentice-Hall, 3
edition, 2003.
[61] Craig, J. Introduction to Robotics: Mechanics and Control, Second Edition.
Addison-Wesley Publishing, 1986.
[62] Savage, P. G. Strapdown Analytics, volume 1. Strapdown Associates, Inc., Maple
Plain, MN, 2000.
[63] Farrel, J. Integrated Aircraft Navigation. New York. Academic Press Inc., 1976.
[64] Savage, P. Strapdown inertial navigation integration algorithm design part 1: Attitude algorithms. Journal of Guidance, Control and Dynamics, 21(1):19–18, 1998.
[65] Bortz, J. E. A new mathematical formulation for strapdown inertial navigation.
IEEE Transactions on Aerospace and Electronic Systems, AES-7(1):61–66, 1971.
[66] Farrel, J. Aided Navigation, GPS with High Rate Sensors. The McGraw-Hill Companies, 2008.
[67] Marques, S. Small satellites attitude determination methods. Master’s thesis,
Instituto Superior Técnico,Universidade Técnica de Lisboa, 2001.
[68] Groves, P. D. Principles of GNSS, Inertial and Multi-Sensor Integrated Navigation
Systems. Artech House, 2008.
[69] Miranda, J. M., Luis, J. F., Costa, P. T., and Santos, F. M. Manual de Fundamentos
de Geofísica. Faculdade de Ciências da Universidade de Lisboa, 2004.
[70] Antunes, C. Apontamentos das Aulas de Introdução à Geodesia. Faculdade de
Ciências da Universidade de Lisboa.
[71] The Johns Hopkins Applied Research Lab. http://sd-www.jhuapl.edu/Transit,
2008.
[72] NIMA. DoD World Geodetic System 1984 (WGS-84)-Its Definition and Relationships with Local Geodetic Systems, NIMA TR 8350.2, January 2000.
BIBLIOGRAFIA
147
[73] Andrews, W. J. A chronicle of timekeeping. Scientific American, 2002.
[74] Grewal, M. S., Weill, L. R., and Andrews, A. P. Global Positioning Systems, Inertial
Navigation, and Integration, 2nd Edition. John Wiley & Sons, 2007.
[75] Hellman, H. The development of inertial navigation. Journal of the Institute of
Navigation, 9(2):81–93, 1962.
[76] Draper, C. S. Origins of inertial navigation. AIAA Journal of Guidance and Control,
4(5):449–463, 1981.
[77] Lawrence, A. Modern Inertial Technology: Navigation, Guidance and Control.
Springer Verlag, New York, 1998.
[78] Kayton, M. and Fried, W. R. Avionics Navigation Systems. John Wiley & Sons,New
York, 1997.
[79] Advisory
Group
for
Aerospace
Research
&
Development
(AGARD/NATO).
Multilingual
aeronautical
dictionary.
ftp://ftp.rta.nato.int/PubFullText/AGARD/Misc/AGARD-Misc-MAD, 1980.
[80] Kelly, A. Modern Inertial and Satellite Navigation Systems. Carnegie Mellon University, 1994.
[81] Merhav, S. Aerospace Sensor Systems and Applications. Springer-Verlag New York
Inc., 1996.
[82] Grewal, M. S., Weill, L. R., and Andrews, A. P. Global Positioning Systems, Inertial
Navigation, and Integration. John Wiley & Sons, January 2001.
[83] European Space Agency. http://www.esa.int, 2008.
[84] COSPAS-SARSAT. http://www.cospas-sarsat.org, 2008.
[85] Pires, A. and Ferraz, N. Sistema de navegação para helicóptero autónomo por
integração insgps. Projecto de Final de Curso, Instituto Superior Técnico, 2002.
[86] Calvário, J. and Vasconcelos, J. Estratégias de fusão sensorial para sistemas de
navegação com aplicação a helicópteros autónomos. Projecto de Final de Curso,
Instituto Superior Técnico, 2003.
[87] ISO. Iso international standard 11898: Road vehicles - interchange of digital information - controller area network (can) for high-speed communication. Technical
report, International Organization for Standarization (ISO), November 1993.
[88] Can specification version 2.0. Technical report, Robert Bosch GmbH, September
1991.
[89] Draper Laboratory. http://www.draper.com, 2008.
148
BIBLIOGRAFIA
[90] Bernstein, J., Cho, S., King, A. T., Kourepenis, A., Maciel, P., and Weinberg,
M. A micromachined comb-drive tuning fork rate gyroscope. Proc IEEE Micro
Electro Mechanical Systems Workshop (MEMS ’93) Fort Lauderdale, pages 143–
148, February 1993.
[91] Sumitomo Precision Products. http://www.spp.co.jp, 2008.
[92] Atlantic Inertial Systems . http://www.atlanticinertialsystems.com, 2008.
[93] BAE Systems. http://www.baesystems.com, 2008.
[94] Britting, K.R. Inertial Navigation Systems Analysis. John Wiley & Sons, Inc.,
1971.
[95] Gelb, A. Applied Optimal Estimation. The M.I.T. Press, 1974.
[96] Kinsey, J. C., Eustice, R. M., and Whitcomb, L. L. A survey of underwater vehicle navigation: Recent advances and new challenges. In Proceedings of the 7th
IFAC Conference of Manoeuvring and Control of Marine Craft (MCMC), Lisbon,
Portugal, 2006.
[97] Crassidis, J. L., Markley, F. L., and Cheng, Y. Survey of nonlinear attitude estimation methods. Journal of Guidance, Control, and Dynamics, 30(1):12–28, JanuaryFebruary 2007.
[98] Markley, F. L. Attitude error representations for Kalman filtering. Journal of
Guidance, Control, and Dynamics, 26(2):311–317, March-April 2003.
[99] Pittelkau, M. E. Rotation vector in attitude estimation. Journal of Guidance,
Control, and Dynamics, 26(6):855–860, November-December 2003.
[100] Dissanayake, G., Sukkarieh, S., Nebot, E., and Durrant-Whyte, H. The aiding
of a low-cost strapdown inertial measurement unit using vehicle model constraints
for land vehicle applications. IEEE Transactions on Robotics and Automation,
17(5):731–747, Oct 2001.
[101] Bierman, G. J. Factorization Methods for Discrete Sequential Estimation. New
York. Academic Press Inc., 1977.
[102] Grewal, M. S. and Andrews, A. P. Kalman Filtering : Theory and Practice Using
MATLAB, 2nd Edition. John Wiley & Sons, January 2001.
[103] Julier, S. J. and Uhlmann, J. K. Unscented filtering and nonlinear estimation.
Proceedings of the IEEE, 92(3):401–422, Mar 2004.
[104] Crassidis, J. L. Sigma-point Kalman filtering for integrated GPS and inertial navigation. IEEE Transactions on Aerospace and Electronic Systems, 42(2):750–756,
2006.
BIBLIOGRAFIA
149
[105] Mahony, R. and Hamel, T. Advances in Unmanned Aerial Vehicles: State of the
Art and the Road to Autonomy, volume 33 of Intelligent Systems, Control and
Automation: Science and Engineering, chapter 11 - Robust Nonlinear Observers
for Attitude Estimation of Mini UAVs. Springer, 2007.
[106] Rehbinder, H. and Ghosh, B. K. Pose estimation using line-based dynamic vision
and inertial sensors. IEEE Transactions on Automatic Control, 48(2):186–199,
February 2003.
[107] Rehbinder, H. and Hu, X. Nonlinear state estimation for rigid body motion with
low-pass sensors. Systems and Control Letters, 4(3):183–190, July 2000.
[108] Brown, R. and Hwang, P. Introduction to Random Signals and Applied Kalman
Filtering. John Wiley & Sons, February 1997.
[109] Anderson, W. G. and Fritze, E. H. Instrument approach system steering computer.
Proceedings of Institute of Radio Engineers, 41(2):219–228, February 1953.
[110] Wirkler, W. H. Aircraft course stabilization means. U.S. Patent 2,548,278, 1951.
[111] Wiener, N. Extrapolation, Interpolation and Smoothing of Stationary Time Series.
John Wiley and Sons, New York, 1949.
[112] Brown, R. G. Integrated navigation systems and Kalman filtering: A perspective.
Journal of the Institute of Navigation, 19(4):335–362, 1972.
[113] Higgins, W. T. A comparison of complementary and Kalman filtering. IEEE
Transactions on Aerospace and Electronic Systems, AES-11(3):321–325, 1975.
[114] Yun, X., Bachmann, E. R., McGhee, R. B., Whalen, R. H., Roberts, R. L., Knapp,
R. G., Healey, A. J., and Zyda, M. J. Testing and evaluation of an integrated
gps/ins system for small auv navigation. Oceanic Engineering, IEEE Journal of,
24(3):396–404, Jul 1999.
[115] Whitcomb, L. L., Yoerger, D. R., and Singh, H. Combined Doppler/LBL based
navigation of underwater vehicles. In Proceedings of the 11th International Symposium on Unmanned Untethered Submersible Technology, New Hampshire, USA,
August 1999.
[116] Pascoal, A., Kaminer, I., and Oliveira, P. Navigation system design using
time varying complementary filters. IEEE Aerospace and Electronic Systems,
36(4):1099–1114, October 2000.
[117] Roberts, J., Corke, P., and Buskey, G. Low-cost flight control system for a small
autonomous helicopter. In Proceedings of IEEE Int. Conf. on Robotics and Automation, pages 546–551, Taipai, September 2003.
[118] Jung, D. and Tsiotras, P. Inertial attitude and position reference system development for a small UAV. In AIAA Infotech at Aerospace, Rohnert Park, CA, May
2007.
150
BIBLIOGRAFIA
[119] Vasconcelos, J. F., Cardeira, B., Silvestre, C., Oliveira, P., and Batista, P. Discretetime complementary filters for attitude and position estimation: Design, analysis
and experimental validation. Submetido e aceite com pequenas alterações na IEEE
Transactions on Control Systems Technology, 2009.
[120] Vasconcelos, J. F., Silvestre, C., Oliveira, P., Batista, P., and Cardeira, B. Discrete time-varying attitude complementary filter. Submetido e aceite na American
Control Conference, 2009.
[121] Vasconcelos, J. F., Calvário, J., Oliveira, P., and Silvestre, C. GPS aided IMU
for unmanned air vehicles. In Proceedings of the 5th IFAC/EURON Symposium
on Intelligent Autonomous Vehicles, Instituto Superior Técnico, Lisboa, Portugal,
July 2004.
[122] Franklin, G. F., Powell, J. D., and Workman, M. Digital Control of Dynamic
Systems. Addison Wesley, 3rd edition, 1998.
[123] Gower, J. C. and Dijksterhuis, G. B. Procrustes Problems. Number 30 in Oxford
Statistical Science Series. Oxford University Press, USA, 2004.
[124] Wahba, G. A least-squares estimate of satellite attitude. SIAM Review, 7(3):409
problem 65–1, 1965.
[125] Bar-Itzhack, I. Y. and Harman, R. R. Optimized TRIAD algorithm for attitude determination. Journal of Guidance, Control and Dynamics, 20(1):208–211, January
1997.
[126] Jazwinski, A. H. Stochastic Processes and Filtering Theory. Academic Press, 1970.
[127] Anderson, Brian D. O. and Moore, John B. Optimal Filtering. Dover Publications,
1979.
[128] Rugh, W. J. Linear System Theory. Prentice-Hall, 2 edition, 1995.
[129] Batista, P., Silvestre, C., and Oliveira, P. Position and velocity navigation filters
for marine vehicles. In Proceedings of the 17th IFAC World Congress, Seoul, South
Korea, July 2008.
[130] Bittanti, S., Colaneri, P., and Nicolao, G. An algebraic riccati equation for the
discrete-time periodic prediction problem. Systems & Control Letters, pages 71–78,
1990.
[131] Oppenheim, A. V., Schafer, R. W., and Buck, J. R. Discrete-Time Signal Processing. Signal Processing. Prentice-Hall, 2 edition, 1999.
[132] Bowditch, N. The American Practical Navigator. Defense Mapping Agency, Hydrographic/Topographic Center, Bethesda, Maryland, USA, 1995.
[133] Mach, J. J. Toward auto-calibration of navigation sensors for miniature autonomous
underwater vehicles. Master’s thesis, Faculty of the Virginia Polytechnic Institute
and State University, Blacksburg, Virginia, 2003.
BIBLIOGRAFIA
151
[134] Denne, W. Magnetic Compass Deviation and Correction. Brown, Son, & Ferguson
Ltd., 1979.
[135] Elkaim, G. H., Gebre-Egziabher, D., Powell, J. D., and Parkinson, W. B. A nonlinear, two-step estimation algorithm for calibrating solid-state strapdown magnetometers. 8th St. Petersburg Conference on Navigation Systems (IEEE/AIAA), St.
Petersburg, Russia, May 2001.
[136] Fitzgibbon, A. W., Pilu, M., Fisher, R. B., and Parkinson, W. B. Direct leastsquares fitting of ellipses. IEEE Transactions on Pattern Analysis and Machine
Intelligence, 21(5):476–480, May 1999.
[137] Philips Semiconductors. XA-S3 Datasheet, Dezembro 2001.
[138] Burr-Brown. ADS1210 Datasheet, September 2005. literature number SBAS034B.
[139] Baltazar, F., Cardeira, B., and Dias, P. Manuais da arquitectura de navegação.
Relatório Interno, ISR-DSOR, 2004.
[140] Xilinx. XC9500 In-System Programmable CPLD Family, April 2006. DS063 (v5.4).
[141] Texas Instruments. TMS320VC33 Datasheet, January 2004. literature number
SPRS087E.
[142] Texas Instruments. TMS320C3X User’s Guide, March 2004. literature number
SPRU031F.

Ficheiro PDF - Departamento de Engenharia Mecânica

Transcrição

Documentos relacionados

aula gps

Kirkenes - Bergen (2012)

Filtro de Lubrificante para Motores Detroit Diesel DD13®, DD15® e

mercosul/gmc/res. nº 88/94 regulamento técnico sobre

o marco referencial teórico - Prof. Dr. Luiz Carlos dos Santos

INTRODUÇÃO

Chuveiro Búzios Instrução de Instalação Manutenção Medidas de

Chuveiro Búzios Teto Instrução de Instalação Manutenção Medidas

1000 Mile Trial: A participação portuguesa

Sensores para medições de Vibrações Mecânicas – Acelerómetros