II.6 Discussão - DECOM

Transcrição

II.6 Discussão - DECOM
UNIVERSIDADE ESTADUAL DE CAMPINAS
FACULDADE DE ENGENHARIA ELÉTRICA E DE COMPUTAÇÃO
DEPARTAMENTO DE COMUNICAÇÕES
!"!$# %'&(
Autor
Alexandre Freire da Silva Osorio
Orientador
prof. Dr. João Marcos Travassos Romano
Co-Orientador
Dr. André Louzada Brandão
Banca Examinadora: prof. Dr. João Marcos Travassos Romano (UNICAMP)
prof. Dr. Leonardo Silva Resende (UFSC)
prof. Dr. Michel Daoud Yacoub (UNICAMP)
prof. Dr. Amauri Lopes - suplente (UNICAMP)
Tese apresentada à Faculdade de Engenharia Elétrica e de Computação da Universidade
Estadual de Campinas como parte dos requisitos exigidos para a obtenção do título de Mestre
em Engenharia Elétrica.
Campinas, Julho de 1998
FICHA CATALOGRÁFICA ELABORADA PELA
BIBLIOTECA DA ÁREA DE ENGENHARIA - BAE - UNICAMP
Os5a
Osorio, Alexandre Freire da Silva
Antenas adaptativas; conceitos e aplicações em
comunicações móveis / Alexandre Freire da Silva
Osorio.—Campinas, SP: [s.n.], 1998.
Orientador: João Marcos Travassos Romano.
Dissertação (mestrado) - Universidade Estadual
de Campinas, Faculdade de Engenharia Elétrica e de
Computação.
1. Antenas ajustáveis. 2. Processamento de
sinal adaptativo. 3. Sistemas de comunicação móvel..
I.Romano, João Marcos Travassos. II. Universidade
Estadual de Campinas. Faculdade de Engenharia Elétrica
e de Computação. III. Título.
Aos meus pais, Jurandyr e Cleusa, e ao meu irmão,
Marcelo, que me dão todo o apoio de que preciso,
sempre com muito amor.
À Fátima, anjinho que é a luz da minha vida.
)* !$
Ao prof. João Marcos, pela orientação, honestidade e aplicação.
Ao Dr. André Brandão, meu co-orientador, pelas enriquecedoras discussões.
Aos ilustres membros da banca examinadora, pelas valorosas críticas e sugestões.
A Rodrigo Cavalcante, aluno de doutorado, pelo companheirismo na árdua tarefa de
montagem do Laboratório de Processamento de Sinais para Comunicações Móveis, ainda em
fase de construção, e pelas valorosas ajudas com a sua larga experiência acadêmica e de
simulações.
Aos estagiários de iniciação científica Romis Ribeiro e Maurício Sol, pela inestimável ajuda
na codificação das centenas de linhas necesárias para a construção do nosso ambiente de
simulação. Sem eles, certamente o trabalho teria transcorrido de forma bem mais lenta.
Ao engenheiro Castelo Branco, do CPqD da Telebrás, pela excelente oportunidade que está
me proporcionando de aplicar os resultados obtidos neste trabalho através de convênio
firmado entre a Unicamp e a Telebrás.
Ao CNPq, pelo financiamento deste trabalho de mestrado.
À Fátima, que, apesar das muitas horas em que, por conta deste trabalho de tese, deixamos de
realizar aquilo que mais prezamos que é estarmos juntos, manteve todo o seu puro amor por
mim.
Aos funcionários e funcionárias do Decom, Lúcia, Mário, Celi, Márcia e Lena, pela dedicação
e carinho.
A todos os meus grandes amigos e amigas, Nelson, Alê, Bia, Cadão, Massa, Paulinha, Jorge,
Zezinho, Ivan, Paula, Fred e mais tantos outros com quem estive muito ligado durante a
execução deste trabalho. Com eles meu prazer em viver é certamente muito maior.
+(* In many times space signal processing techniques solve problems that time processing
techniques are not allowed to do. As important examples of these problems we may mention
co-channel interference canceling and fading counteractions, when the durations of the
fadings are larger than the total delay of the time filter. Both problems are very relevant in
mobile communications systems.
In this thesis we describe the main space processing techniques, commonly called
adaptive antennas techniques. By means of a bibliographic survey, we identify two branches
in which the development of these techniques has occurred. The detection branch consists of
techniques developed initially for use in radars and sonars while the diversity branch includes
space diversity techniques, developed initially as fading counteractions techniques.
We join both branches when we verify that it’s possible to realize diversity using
detection branch techniques. In this thesis we show that this was verificated in a work that
exploited the application of space processing in mobile communications systems.
In order to demonstrate the possibility of application of the space filters in typical
mobile communications environments we present some results published in the specialized
literature. Our own simulations results comparing the performances of the adaptive space
algorithms in nulling multipath components and co-channel interference are presented too.
,(#!$
As técnicas de processamento espacial de sinais viabilizam a solução de problemas
muitas vezes impossíveis de serem resolvidos por processamento temporal. Como exemplos
significativos desses problemas podemos citar o cancelamento de interferência co-canal e o
combate ao desvanecimento quando este possui duração maior que o atraso total do filtro
temporal, problemas estes muito relevantes em sistemas de comunicações móveis.
Nesta tese descrevemos as principais técnicas de processamento espacial, comumente
conhecidas como técnicas de antenas adaptativas. Através de levantamento e análise
bibliográfica, identificamos que o desenvolvimento dessas técnicas aconteceu segundo dois
ramos distintos. O ramo detecção é formado pelas técnicas desenvolvidas para aplicação
inicialmente em radares e sonares, enquanto que o ramo diversidade inclui as técnicas de
diversidade espacial de sinais, desenvolvidas inicialmente com a finalidade de combater
desvanecimentos em sinais de rádio.
No momento em que vislumbra-se a possibilidade de realizar diversidade utilizando
técnicas desenvolvidas no ramo deteção, faz-se a junção dos dois ramos. Nesta tese
mostramos que essa possibilidade foi verificada em um trabalho que explora a aplicação de
processamento espacial em sistemas de comunicações móveis.
Procuramos demonstrar a viabilidade de aplicação dos filtros espaciais em ambientes
típicos de comunicações móveis. Para isso, utilizamos resultados publicados na literatura e
resultados próprios de simulações que comparam a performance dos algoritmos espaciais
adaptativos no combate ao ruído de multipercurso e à interferência co-canal.
- INTRODUÇÃO
I.1 ORGANIZAÇÃO DA TESE
PROCESSAMENTO ADAPTATIVO ESPACIAL
1
4
6
II.1 INTRODUÇÃO
6
II.2 EQUAÇÃO DE WIENER-HOPF
7
II.3 ALGORITMOS ITERATIVOS
10
LMS
10
RLS
13
CMA
14
II.4 PROCESSAMENTO ESPACIAL COM ARRAYS DE ANTENAS
17
II.5 MODELO DE SINAIS
18
II.6 DISCUSSÃO
22
III. RAMO DETECÇÃO
23
III.1 O ARRAY DE APPLEBAUM
24
III.2 O ARRAY COM SINAL PILOTO
31
III.3 O ARRAY DE GRIFFITHS
33
i
III.4 O ARRAY DE FROST
34
III.5 O GSC
39
III.6 O ARRAY DE RESENDE (ALGORITMO CFLS)
40
III.7 ARRAYS PARCIALMENTE ADAPTATIVOS
47
GRAUS DE LIBERDADE DE UM ARRAY
47
ARRAYS PARCIALMENTE ADAPTATIVOS
48
III.8 SUMÁRIO
49
IV. ESTIMAÇÃO DE DIREÇÃO DE CHEGADA DE SINAIS
IV.1 FATORAÇÃO ESPECTRAL DE
R xx
50
51
IV.2 SOLUÇÃO GEOMÉTRICA
53
IV.3 ALGORITMOS BASEADOS EM ESPECTROS
54
MÉTODOS DE ARRAYS FORMADORES DE FEIXES
ESTIMAÇÃO UTILIZANDO O ARRAY DE BARTLETT
MÉTODOS DE SUBESPAÇO
54
56
57
MUSIC
58
ROOT MUSIC
59
ESPRIT
60
IV.4 ALGORITMOS PARAMÉTRICOS
ALGORITMO DE MÁXIMA VEROSSIMILHANÇA
IV.5 DISCUSSÃO
63
64
65
V. RAMO DIVERSIDADE
67
V.1 DESVANECIMENTO
67
V.2 DIVERSIDADE
69
V.3 ESQUEMAS DE DIVERSIDADE
71
ii
DIVERSIDADE POR SELEÇÃO
71
DIVERSIDADE POR COMBINAÇÃO
73
V.4 O VÉRTICE DO “Y”: COMBINAÇÃO ÓTIMA
74
V.5 COMPARAÇÃO ENTRE OS MÉTODOS
75
COMBINAÇÃO POR RAZÃO MÁXIMA X COMBINAÇÃO ÓTIMA
V.6 ESQUEMAS DE DIVERSIDADE E ARRAYS ADAPTATIVOS
ARRAYS DE ANTENAS EM COMUNICAÇÕES MÓVEIS
VI.1 REDUÇÃO DE INTERFERÊNCIA CO-CANAL
77
78
80
81
REDUÇÃO DE ICC EM SISTEMAS GSM
88
REDUÇÃO DE ICC EM SISTEMAS CDMA
90
VI.2 RESULTADOS DE SIMULAÇÕES
93
PRIMEIRA SIMULAÇÃO
96
SEGUNDA SIMULAÇÃO
101
DISCUSSÃO
106
VII. CONCLUSÕES
107
VIII. REFERÊNCIAS
109
iii
.0/
.132457638:9;5
Classicamente as técnicas de processamento adaptativo são empregadas em filtros
temporais transversais, como o da Figura I.1. Neles a saída é a soma de N amostras temporais
do sinal de entrada, ponderadas pelos N coeficientes do filtro. Os coeficientes são variados
segundo algum algoritmo para satisfazer o critério de otimização da função custo utilizada.
sensor
atrasadores
x(k)
x(k-1)
T
x(k-2)
T
x(k-N+1)
...
T
coeficientes do filtro
w1∗
w2∗
w3∗
...
w ∗N
Σ
y(k)
Figura I.1 - Filtro adaptativo temporal
Neste trabalho estaremos tratando de filtragem adaptativa espacial. Assim, ao invés do
filtro processar amostras atrasadas de um sinal de entrada, como no caso do filtro temporal,
ele processa amostras espaciais de uma frente de onda captada por um conjunto (array) de
antenas (Fig. I.2). A característica de interesse do sinal processado é sua direção de chegada
1
ao array, que perfaz o mesmo papel da freqüência num filtro temporal. O análogo espacial do
espectro de freqüências de um filtro temporal é o padrão de irradiação, que reflete a
sensibilidade do array em relação à direção de chegada dos sinais captados1.
O processamento realizado por meio de arrays de antenas possui aplicações em
diferentes sistemas como radares, sonares, sistemas sismológicos e de comunicações. Nossa
principal motivação em tratar desse assunto, que vem sendo pesquisado desde a década de
1950, é que só recentemente as pesquisas têm se voltado para aplicações em comunicações
móveis, com obtenção de bons resultados e prognósticos promissores.
elementos do array
coeficientes do filtro
interferente
x1(k)
x2(k)
ϕi
w2∗
Σ
y(k)
...
...
ϕd
w1∗
xN(k)
sinal
desejado
w ∗N
...
algoritmo
adaptativo
critério de
otimização
Figura I.2 - Filtro adaptativo espacial linear genérico
Os sinais de rádio em comunicações móveis sofrem desvanecimento devido ao fato de
sua propagação dar-se em múltiplos percursos [Yacoub, 1993]. Para contornar esse problema,
técnicas de equalização temporal têm sido utilizadas, mas que não são eficientes quando a
duração do desvanecimento é maior que o atraso total do equalizador. Os esquemas de
diversidade em arrays de antenas são insensíveis à duração do desvanecimento pois baseiamse no fato de que, para antenas suficientemente espaçadas, os sinais em cada uma delas são
descorrelacionados entre si, diminuindo assim a probabilidade de ocorrência de
1
O padrão de irradiação de um array é obtido medindo-se a potência de saída em resposta a um sinal
monocromático de amplitude unitária que incide segundo várias direções, no intervalo [0,2π ) .
2
desvanecimento em todas elas ao mesmo tempo.
Um outro fenômeno que degrada a qualidade de recepção é a interferência causada por
sinais que ocupam a mesma faixa de freqüências do sinal desejado. Arrays de antenas provêm
um meio efetivo para redução da interferência co-canal por serem insensíveis à banda de
freqüências ocupada pelos sinais processados.
Nosso intuito nesta tese é apresentar as principais técnicas de processamento espacial
existentes e uma visão geral do estado da arte para aplicações em comunicações móveis. Para
isso realizamos um extenso levantamento bilbiográfico do tema e constatamos que sua
evolução aconteceu em dois ramos de pesquisas que, apesar de estarem preocupados em
resolver problemas distintos, encontraram em comunicações móveis um ambiente comum de
aplicação.
O primeiro ramo, que denominamos ramo detecção, esteve historicamente associado a
pesquisas de arrays de antenas em radares e sonares, procurando desenvolver métodos
efetivos de detecção de sinais desejados e cancelamento de interferentes. As técnicas
utilizadas envolvem arrays de antenas empregando algoritmos adaptativos e o quadro de
pesquisadores inclui, entre outros, um dos criadores do algoritmo LMS (B. Widrow) e do
algoritmo LMS com restrições (O. Frost), bastante utilizados também em filtros temporais.
Basicamente o que caracteriza uma técnica como pertencente a esse ramo é o fato de os
elementos do array (as antenas) estarem espaçados por uma distância máxima, dita distância
coerente do array, que garante a correlação entre os sinais por eles captados.
Após expormos os principais algoritmos do ramo detecção, apresentamos as técnicas
mais utilizadas de estimação de direção de chegada de sinais, necessárias para a
implementação de algoritmos que necessitam dessa informação em suas formulações.
No segundo ramo de pesquisas, denominado ramo diversidade, a preocupação inicial era
de combater o desvanecimento dos sinais de rádio. Para isso são empregados métodos de
diversidade espacial, cujo princípio é obter sinais descorrelacionados na recepção e, por
combinação de todos eles ou por seleção do que possui melhor qualidade, produzir um sinal
3
de saída melhor segundo um certo critério, que pode ser, por exemplo, a relação sinal/ruído
(SNR) ou a relação sinal/ruído+interferentes (SINR).
A separação das técnicas que empregam arrays de antenas em técnicas de arrays
adaptativos (primeiro ramo de pesquisas) e técnicas de diversidade espacial (segundo ramo)
não é usual na literatura. No entanto, acreditamos que ela seja necessária para que se forme
um juízo a respeito da aplicabilidade dos métodos desenvolvidos em ambos os ramos, pois
são baseados em fundamentos muito diferentes, apesar de servirem como solução para
problemas semelhantes.
I.1 Organização da Tese
O Capítulo II apresenta os conceitos básicos da teoria de filtragem adaptativa e alguns
dos principais algoritmos que têm sido utilizados em arrays de antenas: LMS, RLS e CMA.
No final do Capítulo há um modelamento dos sinais utilizados nos arrays de antenas que será
utilizado ao longo de todo o texto.
O Capítulo III trata dos principais algoritmos desenvolvidos a princípio para aplicações
em radares e sonares, que chamaremos apenas de algoritmos de arrays adaptativos. Em
seguida, no Capítulo IV, são descritos os principais métodos de estimação de direções de
chegada de sinais, utilizados na aplicação de alguns dos algoritmos de arrays adaptativos em
sistemas de comunicações. Apesar da completa associação existente entre os assuntos tratados
nesses dois capítulos, optamos por isolar os algoritmos de arrays adaptativos em um capítulo
próprio pela relevância que o assunto possui no âmbito deste trabalho de tese e também por
considerarmos que essa atitude beneficiou a clareza e a fluência do texto, dada a grande
extensão do Capítulo III.
No Capítulo V descreveremos os esquemas de diversidade espacial desenvolvidos para
combate ao desvanecimento de sinais de rádio. O capítulo termina com uma comparação de
4
performance entre os métodos apresentados, publicada na literatura especializada.
Uma visão geral da aplicabilidade de arrays de antenas em comunicações móveis é
apresentada no Capítulo VI. É abordada sua utilidade no combate à interferência co-canal,
através de resultados obtidos na literatura, e na diminuição da interferência de multipercurso,
onde se faz um estudo comparativo, através de resultados de simulações, entre as
performances dos algoritmos mais significativos apresentados durante a tese. O Capítulo VII
tece conclusões a respeito desta tese, abrindo perspectivas para trabalhos futuros.
5
.0.0/
457=>??A@:BC>1325EDF63@GH2 @I2J K5
<
LM?GA@:=J @:N
Iniciaremos este capítulo revisando alguns dos princípios da teoria de processamento
adaptativo, estabelecendo assim uma base teórica para que posteriormente possamos focalizar
a atenção no processamento realizado por meio de arrays de antenas.
II.1 Introdução
Um filtro adaptativo espacial linear genérico pode ser esquematizado como na Figura
[
I.2. As seqüências x1 ( k )
x2 (k )
O
]
x N ( k ) são as amostras espaciais da entrada externa e
y(k) é a saída do filtro. O algoritmo adaptativo busca otimizar uma determinada função custo,
alterando automaticamente, para isso, os coeficientes do filtro a cada iteração.
De acordo com a abordagem feita em [Diniz, 1997], para que um filtro adaptativo seja
completamente especificado, é necessário definir:
1) a aplicação, que define também os tipos dos sinais a serem tratados. Entre elas,
podemos citar cancelamento de eco acústico, equalização de canais, predição de sinais,
6
controle adaptativo, cancelamento de interferências, etc.;
2) a estrutura do filtro, quer seja de resposta finita (FIR) ou infinita (IIR) e
3) o algoritmo adaptativo (LMS, RLS, CMA, etc.).
Os algoritmos adaptativos, por sua vez, são compostos basicamente por três itens:
1) a função custo;
2) o método de otimização dessa função, que pode ser o método de Newton, o
método da descida mais íngreme (steepest descent), ou algum dos métodos quasiNewton [Diniz, 1997];
3) a definição do sinal de erro.
A equação de Wiener-Hopf, cuja dedução veremos resumidamente a seguir, está na base
de toda a teoria de filtragem adaptativa.
II.2 Equação de Wiener-Hopf
A Figura II.1 representa a estrutura de um filtro adaptativo espacial linear de N
coeficientes. A k-ésima amostra do sinal de saída, y(k), é a soma das k-ésimas amostras dos
sinais nas saídas dos elementos do array
[
coeficientes do filtro w1 ( k ) w2 ( k )
Q
[ x ( k ) x ( k ) P x ( k )] ponderadas pelos
w ( k )] . O índice k denota a dependência das
1
2
N
N
amostras com o tempo. d(k) é o sinal de referência e e(k) é o erro entre a saída e o sinal de
referência.
7
x1(k)
w1∗
x2(k)
w2∗
xN (k)
...
y(k)
Σ
...
...
w∗N
e(k)
algoritmo
adaptativo
-
+
Σ
d (k)
Figura II.1 - Filtro adaptativo espacial linear de N coeficientes
Se considerarmos o filtro num instante k qualquer, sua saída será dada por
N
∑ w x (k )
∗
i i
(II.1)
y ( k ) = w H x( k )
(II.2)
y( k ) =
i =1
Ou, em notação matricial
onde x( k ) = [ x1 ( k )
x2 ( k )
R
x N ( k )] e w( k ) = [ w1
T
w2
S
wN ] .
T
Podemos escolher a função custo do filtro como sendo o erro quadrático médio (em
inglês, MSE - Mean Square Error) entre a saída y(k) e o sinal de referência d(k). Ou seja
8
[ ]
= E{[ d ( k ) − y ( k )] [ d ( k ) − y ( k )]}
= E{[d ( k ) − w x( k )] [d ( k ) − w x( k )]}
= E[ d ( k ) − d ( k ) w x( k ) − d ( k ) w x ( k ) + w x ( k )x ( k ) w ]
= E[ d ( k ) ] − w E[d ( k )x( k )] − w E[d ( k )x ( k )] + w E[x( k )x ( k )]w
= E[ d ( k ) ] − w E[d ( k )x( k )] − E[d ( k )x( k )] w + w E[x( k )x ( k )]w
ψ = E e( k )
2
∗
2
H
∗
∗
H
2
H
∗
2
H
∗
H
∗
T
T
∗
T
∗
T
T
H
∗
∗
H
H
(II.3)
∗
H
Assim
[
ψ = E d (k )
2
]− w
H
rdx − rdxH w + w H R xx w
(II.4)
onde,
 d ∗(k)x1 ( k ) 
 ∗

d (k)x 2 ( k ) 
∗

rdx = E[ d ( k )x( k )] = E


 ∗

d (k)x N ( k ) 
T
(II.5)
e
R xx = E[x( k )x H ( k )]
 x1 ( k ) x1∗ ( k )

x 2 ( k ) x1∗ ( k )

=E


∗
 x N ( k ) x1 ( k )
V
U
UV
x1 ( k ) x 2∗ ( k )
x 2 ( k ) x 2∗ ( k )
V
x N ( k ) x 2∗ ( k )
U
x1 ( k ) x ∗N ( k ) 

x 2 ( k ) x ∗N ( k ) 


∗
x N ( k ) x N ( k )
V
(II.6)
R xx é a matriz de auto-correlação do vetor de entrada e rdx é o vetor de correlação
cruzada entre o sinal de referência e o vetor de entrada.
Para minimizar a função custo, calculamos inicialmente seu vetor gradiente [Haykin,
1996]:
9
∇ w (ψ ) =
∂ψ
= 2(R xx w − rdx )
∂w
(II.7)
O vetor w opt que anula o gradiente em (II.7) e que portanto contém as coordenadas
cartesianas do ponto de mínimo da função custo MSE é dado pela seguinte expressão
w opt = R −1
xx rdx
(II.8)
A Equação (II.8) é chamada de Equação de Wiener-Hopf e está na base de toda a teoria
de processamento adaptativo.
II.3 Algoritmos Iterativos
O algoritmo LMS é simples e robusto e, principalmente por causa disso, o mais
utilizado até hoje. Apresentamos também nesta seção o algoritmo RLS como uma alternativa
de convergência mais rápida, porém com maior custo computacional.
Finalmente, para os casos onde não se dispõe de informação suficiente sobre o sinal
desejado para a geração do sinal de referência apresentamos um algoritmo “cego” conhecido
como CMA (de Constant Modulus Algorithm), de aplicação recente em arrays para
comunicações móveis.
LMS
O algoritmo LMS (de Least Mean Square), idealizado por Widrow e Hoff em 1959,
utiliza uma aproximação estocástica para o cálculo do gradiente da função custo MSE. O
método de minimização da função custo, conhecido como steepest descent (literalmente,
10
descida mais íngreme), realiza a busca pelo ponto mínimo da função percorrendo, a cada
atualização do vetor de coeficientes, a função custo no sentido oposto ao do seu vetor
gradiente que, como se sabe, aponta no sentido do máximo crescimento da curva. Dessa forma
podemos representar a expressão iterariva para atualização do vetor de coeficientes como
W
w ( k + 1) = w ( k ) − µ∇ w (ψ )
(II.9)
onde µ é o passo de adaptação, que regula a velocidade de convergência e a estabilidade do
algoritmo e ψ é a função MSE, definida em (II.3) e repetida aqui por conveniência.
[
ψ = E e( k )
2
]
(II.10)
e(k) é o erro entre o sinal de referência e a saída do filtro, dado por
e( k ) = d ( k ) − w H x ( k )
(II.11)
A partir de (II.10) e (II.11) podemos calcular a aproximação estocástica do gradiente da
função custo
X
∂ ( e ∗ ( k ) e( k ) )
∇ w (ψ ) =
∂w
∂e( k )
= 2e∗ ( k )
∂w
∗
= −2e ( k )x( k )
(II.12)
Substituindo (II.12) em (II.9) obtemos a expressão final de adaptação dos coeficientes
w ( k + 1) = w ( k ) + 2 µe∗ ( k )x( k )
(II.13)
A Figura II.2 mostra o caminho de convergência de um filtro espacial linear LMS sobre
as curvas de nível de uma função MSE. No experimento realizado a entrada é um sinal
monocromático de amplitude unitária e o sinal de referência é o próprio sinal de entrada. A
11
relação SNR na entrada é 10 dB. O filtro possui dois coeficientes reais, o passo de adaptação é
igual a um centésimo e foram necessárias 1000 iterações para que o algoritmo convergisse.
A solução ótima de Wiener para esse caso com a matriz R xx e o vetor rdx estimados é
[
]
[
]
T
w opt = 0,819 − 0,003 . O algoritmo convergiu em torno dos valores estimados
Y
T
w opt = 0,847 − 0,017 . A Figura II.3 mostra a função custo MSE.
0.6
0.4
w2
0.2
0
-0.2
-0.4
-0.6
0
0.2
0.4
0.6
0.8
1
1.2
w1
Figura II.2 - Convergência do algoritmo LMS em um filtro de dois coeficientes reais
Figura II.3 - Função custo MSE do exemplo acima
12
Pela observação de (II.13) entendemos porque o LMS é ainda hoje o algoritmo utilizado
pela maioria das aplicações. Sua expressão é elegante e extremamente simples, restringe-se a
uma soma e dois produtos e não necessita de cálculos de médias ou de quadrados. Entretanto
sua velocidade de convergência, para entradas correlacionadas, é baixa se comparada a de
outros algoritmos como o RLS, que veremos a seguir.
RLS
Uma maneira de aumentar a velocidade de convergência do algoritmo adaptativo é
calcular diretamente o vetor de coeficientes pela equação de Wiener (II.8). O algoritmo RLS
(de Recursive Least Squares) realiza a busca iterativa pelo vetor de coeficientes ótimo
diretamente através da equação de Wiener utilizando aproximações estocásticas das matrizes
R xx e rdx , que são atualizadas recursivamente a cada iteração, da seguinte maneira:
k
R xx ( k ) = ∑ ϕ k −i x(i )x H (i )
(II.14)
i =1
k
k
i =1
i =1
R xx ( k ) = ∑ ϕ k −1x(i )x H (i ) rxd ( k ) = ∑ ϕ k −i x(i )d ∗ (i )
(II.15)
A aproximação estocástica do vetor de pesos ótimo é, então
Z
[
\
−1
w opt ( k ) = R xx
( k )rdx ( k )
(II.16)
O fator 0 < ϕ ≤ 1 é chamado fator de esquecimento e tem por função fazer com que
valores passados dos sinais tenham pesos menores do que os valores mais recentes no cálculo
dos atuais conteúdos das matrizes.
Podemos rearranjar (II.14) e (II.15) para obtermos uma regra recursiva para os cálculos
das matrizes
13
]
^
R xx ( k ) = ϕR xx ( k − 1) + x( k )x H ( k )
(II.17)
_
(II.18)
`
rdx ( k ) = ϕrdx ( k − 1) + d ∗ ( k )x( k )
Para calcularmos a inversa de (II.17), utilizamos o lema da inversão de matrizes [Diniz,
1997] para obtermos
 −1
R −xx1 ( k − 1)x( k )x H ( k )R −xx1 ( k − 1)x( k − 1) 
R ( k ) = ϕ R xx ( k − 1) −

ϕ + x H ( k )R −xx1 ( k − 1)x( k )


−1
xx
−1
(II.19)
Substituindo (II.19) e (II.18) em (II.16) e rearranjando os termos, obtemos a expressão
final do algoritmo RLS
ϕ −1R −xx1 ( k − 1)x( k )
w( k ) = w ( k − 1) +
[ d ∗ ( k ) − w H ( k − 1)x( k )]
1 + ϕ −1x H ( k )R −xx1 ( k − 1)x( k )
(II.20)
Pode-se demonstrar [Diniz, 1997] que o algoritmo RLS minimiza uma função custo que
é uma aproximação estocástica e recursiva da função MSE, na forma
a
ψ
=
k
∑ϕ
k −i
e(i )
2
(II.21)
i =1
onde o erro e(k) é dado por (II.11).
CMA
Existe uma classe de algoritmos que não necessitam de sinal de referência, e que por
isso mesmo são chamados de cegos. Entre eles, o denominado CMA (de Constant Modulus
Algorithm) é de nosso particular interesse pois existem estudos, como em [Mayrargue, 1994],
[Ohgane, 1991], [Chiba et. al., 1995] ou [Ohgane et. al., 1993], que comprovam sua eficiência
14
em arrays de antenas para comunicações móveis.
O CMA otimiza a saída do array em sistemas que empregam modulações onde os
módulos dos sinais são constantes (e.g. FM, PSK, GMSK, etc.). A função custo do algoritmo
pode ser representada por
ψ pq
[ ] 
[ ]  

E ak
1 
p
= E  y ( k ) −
4 
E ak
î 
pq
q
(II.22)
p
onde a k é um símbolo do alfabeto do sinal desejado e p e q são números inteiros quaisquer.
Minimizar ψ pq significa minimizar o erro entre o módulo do sinal de saída e o módulo do
sinal desejado.
O algoritmo adaptativo desenvolvido em [Treichler e Agee, 1983] considera p = q = 2
e uma modulação onde a k = 1 . Para atingir o mínimo da curva de ψ 22 , utiliza o mesmo
método steepest descent aplicado no LMS. Portanto as expressões dinâmicas dos dois
algoritmos são idênticas (repetida aqui por conveniência):
b
( )
w ( k + 1) = w ( k ) − µ∇ w ψ pq
(II.23)
A estimação (valores instantâneos no lugar das médias temporais) do gradiente de ψ 22
com relação a w pode ser calculada a partir de (II.22):
c
∇ w (ψ 22 ) =
]d [
[
1
2
y ( k ) − 1 ⋅ ∇ w w H ( k ) x( k ) x H ( k ) w ( k )
2
[
]
= [ y ( k ) − 1] ⋅ y ( k )x( k )
]
= y ( k ) − 1 ⋅ x( k ) x H ( k ) w ( k )
2
(II.24)
2
Substituindo (II.24) em (II.23) temos a expressão final do algoritmo CMA.
15
{[
]
}
w (k + 1) = w (k ) − µ y (k ) − 1 ⋅ y (k )x(k )
2
(II.25)
Se definirmos o “erro” do algoritmo como sendo a expressão
[
2
]
e∗ ( k ) = y ( k ) − 1 ⋅ y ( k )
(II.26)
ao substituí-lo em (II.25) obtemos uma expressão equivalente à do LMS (Eq. II.13)
w ( k + 1) = w ( k ) − µe∗ ( k )x( k )
(II.27)
O algoritmo foi desenvolvido como uma solução para corrigir a modulação AM
incidental provocada pelo desvanecimento em sinais de rádio. Seus autores demonstram que
se o filtro conseguir eliminar a modulação AM, necessariamente o desvanecimento causado
pelo multipercurso estará sendo corrigido. Demonstra-se também que os coeficientes ótimos
do CMA convergem para a solução de Wiener se o erro e o sinal de saída forem
estatisticamente independentes, da forma como segue.
Se supusermos que a saída pode ser representada como
y ( k ) = e( k ) + y 0 ( k )
(II.28)
onde y 0 (k ) é um sinal de módulo unitário e e(k) possui módulo muito menor que um, então
demonstra-se [Treichler e Agee, 1983] que a função custo pode ser escrita como
ψ 22 =
{
}
{
}
1
1
2
2
E e( k ) + E e( k ) cos( 2φ )
2
2
(II.29)
onde φ é o ângulo existente entre os complexos y 0 (k ) e e(k). Se esses dois processos forem
estatisticamente independentes entre si, o segundo termo de (II.29) é zero e então:
16
ψ 22 =
{
1
2
E e( k )
2
}
(II.30)
Ou seja, ψ 22 reduz-se à função MSE na iminência da convergência do algoritmo CMA
(o módulo de e(k) é muito menor que um) e, portanto, sua minimização leva à solução de
Wiener.
II.4 Processamento Espacial com Arrays de
Antenas
Podemos dizer que a evolução histórica das pesquisas sobre arrays de antenas ocorreu
em dois ramos distintos, na forma de um “Y”. No primeiro ramo o objetivo principal é
cancelar interferentes em sinais de radares e sonares. A ação do desvanecimento nesses
sistemas é pequena, já que nas comunicações por radar sempre há uma linha de visada entre a
antena e o objeto desejado, onde o sinal desejado é forte.
No segundo ramo do “Y” encontram-se os pesquisadores interessados na melhoria da
qualidade dos sinais de rádio, corrompidos por desvanecimento. Foi na década de 1920 que se
descobriu que a propagação em multipercurso provoca um tipo de ruído (em inglês, fading)
que desvanece o sinal de rádio [Romano e Brandão, 1997]. A partir daí e com a crescente
popularização do rádio, intensificaram-se as buscas de soluções para esse problema. É até de
certo modo intuitivo pensar em uma solução onde se tenha a liberdade de escolher, entre dois
ou mais sinais disponíveis, aquele que é menos afetado pelo desvanecimento, ou numa outra
em que se possa de alguma forma combinar esses sinais para que o sinal resultante seja o mais
próximo possível do sinal ótimo segundo um critério pré-determinado. As soluções propostas
por esse ramo de pesquisas utilizaram esse tipo de técnica, denominada diversidade, tanto em
nível temporal, como espacial ou freqüencial [Brandão, 1995].
A evolução das técnicas de diversidade espacial levou esse último ramo a encontrar-se
17
com o primeiro, formando o ramo inferior do “Y”. O interesse despertado por institutos de
pesquisa e empresas do setor em utilizar os resultados dessas pesquisas para resolver
problemas em sistemas móveis celulares foi o elemento atrativo entre ambos. A partir de
então os arrays de antenas têm sido vistos como boa alternativa para solução de alguns dos
problemas mais críticos presentes nesses sistemas, como combate ao desvanecimento e à
interferência co-canal, com conseqüente aumento de capacidade (número de usuários por
célula).
Antes de descrevermos as técnicas desenvolvidas em ambos os ramos, apresentaremos
um modelo de sinais, utilizado ao longo de todo o texto.
II.5 Modelo de Sinais
A Figura I.2 representa um array de antenas linear e uniforme (os elementos estão
dispostos em linha reta e equidistantes) de N elementos captando dois sinais provenientes de
fontes pontuais distintas. O meio é considerado isotrópico e não dispersivo, de forma que as
ondas propagam-se em linhas retas. Considera-se também que as fontes de sinais estão
localizadas longe o bastante de maneira que a radiação incidente no array é uma soma de
ondas planas. No referencial espacial onde o array se encontra, a elevação (coordenada no
eixo ‘z’) é desprezada, de tal forma que a direção de chegada dos sinais reduz-se a uma
variável unidimensional ϕ [− π , π ] .
Podemos representar a k-ésima amostra do i-ésimo sinal incidente no array em notação
complexa como
si ( k ) = c( k ) ⋅ e j ( ωk +φ ( k ) )
(II.31)
onde c(k) e φ ( k ) são, respectivamente, o módulo e a fase do sinal e ω é a freqüência angular
da portadora.
18
Para o caso de arrays onde a separação entre os elementos é menor do que a distância
coerente do array1, podemos descrever o sinal na saída do n-ésimo elemento, considerandose I sinais incidentes, cada um com direção de chegada ϕ i , 1 ≤ i ≤ I , como
I
x n (k ) = ∑ a n (ϕ i ) ⋅ si (k )e j ( f n (ϕi ) )
(II.32)
i =1
onde a n (ϕ i ) é a resposta complexa do n-ésimo elemento do array na direção ϕ i e f n (ϕ i ) é
uma função dependente da geometria do array que explicita a fase acrescida ao sinal no nésimo elemento, em relação à fase do sinal no elemento de referência (geralmente o primeiro),
pelo fato dele incidir na direção ϕ i . Por exemplo, para um array linear uniforme (Fig. II.4)
f n (ϕ i ) = −2πn
d
senϕ i
λ
(II.33)
onde d é a distância entre elementos e λ é o comprimento de onda na freqüência ω . Podemos
reescrever (II.32) em notação matricial para podermos considerar conjuntamente todos os N
elementos e todos os I sinais incidentes, na seguinte forma
x( k ) = A (ϕ )s( k ) + n( k )
(II.34)
onde
ϕ = [ϕ1 ϕ2
1
e
ϕI ]
T
(II.35)
Distância máxima para a qual os sinais nos elementos do array ainda mantêm correlação entre si
[Papadias e Paulraj, 1997].
As técnicas de arrays de antenas que foram originalmente desenvolvidas para aplicações em radares
geralmente utilizam arrays confinados à distância coerente. No entanto, as técnicas que empregam diversidade
utilizam arrays onde os elementos encontram-se separados por distâncias maiores (geralmente muito maiores)
que a distância coerente pois para que haja diversidade de sinais é necessário que eles não mantenham correlação
entre si.
19
sinal
desejado
dsenϕd
ϕd
...
d
d
1
2
d
3
4
N
Figura II.4 - Representação parcial de um array linear onde percebe-se o atraso de fase
do sinal no elemento 3 em relação ao do elemento 4 devido à direção de chegada do sinal
desejado e ao espaçamento entre os elementos
e
[
s( k ) = s1 ( k ) s2 ( k )
f
sI ( k )
]
T
(II.36)
n(k) é um vetor de dimensão N representando o ruído térmico aditivo. A(ϕ ) ( N × I ) é
uma matriz cujas colunas são os vetores que representam a resposta do array a cada uma das I
direções de chegada dos sinais, ou seja
A(ϕ ) = [a(ϕ1 ) a(ϕ 2 )
g
a(ϕ I )]
(II.37)
onde
[
a(ϕ i ) = a1 (ϕ i ) ⋅ e j⋅ f1 (ϕi )
a 2 (ϕ i ) ⋅ e j⋅ f 2 (ϕi )
h
a N (ϕ i ) ⋅ e j⋅ f N (ϕi )
]
T
(II.38)
Os vetores a(ϕ i ), 1 ≤ i ≤ I , chamados de vetores de direcionamento ou de propagação
do array [Litva e Lo, 1996], são elementos de um conjunto denominado array manifold, que
chamaremos de
i
, composto pelos vetores de direcionamento associados a todos os valores
possíveis de ϕ i no intervalo
[− π ,π ] .
j
é determinado pela diretividade dos elementos do
20
array e por sua geometria e pode ser calculado a partir de calibrações.
Consideremos agora um array linear genérico de N elementos omnidirecionais, como
representado na Figura II.4, onde incidem um sinal desejado segundo um ângulo ϕ d e um
sinal interferente segundo um ângulo ϕ i , que não está sendo mostrado para não prejudicar a
clareza da Figura. Além disso há a presença de ruído aditivo. Neste caso s(k) possui dimensão
dois e o sinal de entrada do array (sinal captado por seus elementos) pode ser representado
como uma somatória de três componentes
x( k ) = x d ( k ) + x i ( k ) + x n ( k )
(II.39)
onde
x( k ) = [ x1 ( k )
x2 ( k )
x d ( k ) = [ x1d ( k )
k
x2d ( k )
x i ( k ) = [ x1i ( k )
x 2i ( k )
x n ( k ) = [ x1n ( k )
x2n ( k )
x N ( k )] é o sinal de entrada do array,
m
T
l
x Nd ( k )] é a contribuição devida ao sinal desejado,
T
x Ni ( k )] é a contribuição devida ao interferente e
n
T
x Nn ( k )] é a contribuição devida ao ruído.
T
Supondo que o sinal desejado seja uma portadora cuja amplitude não é distorcida pelo
array, os elementos do vetor x d ( k ) podem ser representados como
x1d ( k ) = Ad e j (ωd k + f1 (ϕd ) )
(II.40)
x Nd ( k ) = Ad e j (ωd k + f N (ϕd ) )
(II.41)
o
onde Ad é a amplitude do sinal desejado, ω d é a freqüência angular da portadora e f n (ϕ d ) é
dado por (II.33).
A partir de (II.39), (II.40) e (II.41) podemos expressar x d na seguinte forma
21
x d ( k ) = Aa (ϕ d )
(II.42)
A = Ad e j (ω d k )
(II.43)
onde
e o vetor a(ϕ d ) é dado por (II.38).
A partir de (II.2) e de (II.39) podemos representar a saída do array como
y( k ) = w T x d ( k ) + w T x i ( k ) + w T x n ( k )
(II.44)
Ou seja, podemos decompor também o sinal de saída em três componentes
y ( k ) = y d ( k ) + yi ( k ) + y n ( k )
(II.45)
II.6 Discussão
Neste capítulo apresentamos os princípios básicos da teoria de filtragem adaptaiva,
incluindo alguns dos algoritmos mais utilizados. Um modelo de sinais foi definido e será
utilizado nos próximos capítulos, dedicados à exposição das principais técnicas de arrays de
antenas conhecidas. O Capítulo III aborda as técnicas desenvolvidas inicialmente para serem
aplicadas em radares e sonares.
22
p0p0p0q
r
@:BCsEtu>Hv>=wxs
O italiano Guglielmo Marconi (1874 - 1937), além de pai do rádio, é considerado
também o mentor do radar. Foi em uma palestra por ele ministrada em Nova York em 1922
que se lançaram as primeiras idéias para sua posterior invenção [Romano e Brandão, 1997].
Desde as primeiras implementações, na década de 1940, os militares enxergavam no radar um
interessante instrumento de apoio à guerra, principalmente aérea, que começava a se
modernizar. Assim grandes investimentos foram feitos em pesquisas, na sua grande maioria
sigilosas, para promover seu aperfeiçoamento. Ao fim da Segunda Grande Guerra, quando o
conteúdo dessas pesquisas foi revelado à comunidade científica internacional, o radar possuía
uma tecnologia já bastante desenvolvida, utilizando arrays de antenas para cancelamento de
interferentes, o que propiciou o surgimento do primeiro array adaptativo já na década de 1950
(array de Bartlett), poucos anos depois do trabalho teórico de Wiener (1949).
Segundo William Gabriel [Gabriel, 1992], a primeira compilação das pesquisas desse
ramo foi publicada na edição especial da revista IEEE Transactions on Antennas and
Propagation de março de 1964 [IEEE, 1964]. Essas primeiras antenas eram baseadas em
esquemas de redes de Phase Locked Loops (PLLs) para se conseguir arrays de foco
automático. Doze anos depois, essa mesma revista publicou sua segunda edição especial sobre
o tema [IEEE, 1976]. A grande diferença foi a introdução da capacidade dos arrays de
cancelarem interferências adaptativamente, através da conformação dos seus padrões de
irradiação. Mais dez anos e a mesma Transaction publicou sua terceira edição especial em
março de 1986 [IEEE, 1986], incluindo a capacidade dos arrays de realizarem estimações
espectrais (de direção de chegada dos sinais) de alta resolução, descritas no Capítulo IV.
23
Iremos a seguir descrever os princípios de funcionamento de alguns desses arrays,
começando pelo array de Applebaum.
III.1 O Array de Applebaum
Desenvolvido por Paul Howells na década de 1950, foi posteriormente aperfeiçoado por
Howells e Sidney Applebaum e publicado na chamada literatura “aberta” (da sociedade civil)
somente em 1976 [Applebaum, 1976]. A Figura III.1 reproduz um esquema de como foi
concebido originalmente [Gabriel, 1992]. Um sinal interferente é captado por todos os
elementos do array auxiliar com igual amplitude e com fase que depende da sua direção de
chegada. A diferença entre o sinal captado pela antena principal e o sinal captado pelo array
auxiliar é realimentada no array auxiliar, onde é correlacionado com o interferente. O
resultado é utilizado para alterar a fase na saída de cada elemento e produzir assim um lóbulo
secundário direcionado ao interferente. A antena principal, geralmente uma única antena de
alto ganho, possui resposta direcionada ao sinal desejado. Subtraindo-se as duas respostas, um
nulo é criado na direção do interferente.
Apesar da Figura III.1 exprimir a concepção original do array de Applebaum, a
construção de uma estrutura como essa não é necessária para otimizar a função custo desejada
(maximização da SINR de saída), já que este é um problema que, com a evolução dos
computadores, pode ser resolvido por intermédio de um algoritmo adaptativo. Ou seja, a
complexidade do array da Figura III.1 pode ser transferida, por assim dizer, para o algoritmo,
simplificando a estrutura física do array, que agora pode ser tão simples quanto a da Figura
I.2.
24
array auxiliar de N - 1 elementos
antena principal
...
correlacionadores
∆
...
deslocador de
fase
misturadores
Σ
+
Σ
-
saída
Figura III.1 - Concepção original do array de Howells/Applebaum
O array de Applebaum utiliza como função custo a maximização da relação entre a
potência do sinal desejado e a potência do interferente somada à potência do ruído (SINR) na
saída do array. Utilizando (II.45) podemos descrever matematicamente as potências do sinal
desejado, do interferente e do ruído na saída do array, respectivamente, como
Pd =
[
[
]
2
1
1
2
E yd ( k ) = E w Hx d ( k )
2
2
[
]
[
[
]
[
]
]
Pi =
2
1
1
2
E yi ( k ) = E w Hxi ( k )
2
2
Pn =
2
1
1
2
E yn ( k ) = E w Hx n ( k )
2
2
(III.1)
(III.2)
]
(III.3)
A relação SINR pode então ser escrita a partir dessas equações como sendo
25
SINR =
Pd
Pi + Pn
(III.4)
Utilizando (II.42) e (III.1), podemos calcular a expressão da potência do sinal desejado
na saída do array, obtendo
[
]
2
1
E Aw Ha (ϕd )
2
2
1
2
= E A w Ha (ϕd )
2
Pd =
[ ]
(III.5)
onde a(ϕ d ) é o vetor de direcionamento do sinal desejado, dado em (II.38).
Considerando w(k) e x(k) vetores complexos, o denominador de (III.4) pode ser
calculado como
Pi + Pn =
=
=
=
=
{[
]}
] [
1
2
2
E w H ( k )x i ( k ) + E w H ( k )x n ( k )
2
1
E w H ( k )x *i ( k )x iT ( k ) w ( k ) + E w H ( k )x *n ( k )x Tn ( k ) w ( k )
2
1 H
w ( k ) E x i ( k )x iH ( k ) w ( k ) + w H ( k ) E x n ( k )x nH ( k ) w ( k )
2
1 H
w ( k )R ii w ( k ) + w H ( k )R xx w ( k )}
{
2
1 H
w ( k )R uu w ( k )
2
{[
{
]}
] [
[
]
[
]
}
(III.6)
onde
w H é o conjugado transposto de w,
R ii = E[x i ( k )x iH ( k )] é a matriz de autocorrelação da entrada devido ao interferente,
R nn = E[x n ( k )x nH ( k )] é a matriz de autocorrelação da entrada devido ao ruído e
R uu = R ii + R nn é a matriz de autocorrelação da entrada devido aos sinais indesejados
26
(interferente e ruído).
Para que pudéssemos representar a matriz R uu como a soma das matrizes R ii e R nn ,
consideramos que o ruído e o interferente são sinais descorrelacionados e de média nula.
Finalmente, substituindo (III.6) e (III.5) em (III.4), chegamos à expressão da função
custo do array de Applebaum
w H ( k )a (ϕ d )
[ ]w
SINR = E A
2
H
2
( k )R uu w ( k )
(III.7)
Pode-se demonstrar que o vetor de coeficientes ótimo que maximiza a expressão acima
é dado por (ver [Compton, 1988])
−1
w opt = µR uu
a (ϕ d )
(III.8)
−1
w opt = µR xx
a (ϕ d )
(III.9)
que é equivalente a
A equivalência entre (III.8) e (III.9) se deve a dois motivos. O primeiro deles é que
−1
−1
R uu
a (ϕ d ) é um múltiplo escalar de R xx
a (ϕ d ) , como demonstrado em [Compton, 1988, pág.
50]. Além disso, em sistemas de radares o sinal desejado é presente durante um tempo muito
pequeno em relação ao tempo total de varredura do radar, de tal forma que a matriz de
autocorrelação do sinal de entrada é praticamente igual à matriz de autocorrelação dos sinais
indesejados [Compton, 1988]. Ou seja, nesse caso, R xx ≈ R uu .
Trabalhando com sinais contínuos no tempo, Applebaum sugere o loop da Figura III.2
como meio para produzir o vetor ótimo de (III.9) [Applebaum, 1976]. A equação
característica do loop é dada por
27
x(t )
y (t )
transposto
w
µ
s
complexo
conjugado
+
−
a ∗ (ϕ d )
Figura III.2 - Loop proposto em [Applebaum, 1976]
dw ( t )
= µ[a ∗ (ϕ d ) − x ∗ (t ) y (t )]
dt
(III.10)
Substituindo y (t ) = x T (t ) w (t ) em (III.10) obtemos
dw ( t )
+ µx ∗ (t )x T (t ) w (t ) = µa ∗ (ϕ d )
dt
(III.11)
y
Fazendo a aproximação estocástica R xx = x ∗ (t )x T (t ) e substituindo-a em (III.11), vem
dw ( t )
+ µR xx w (t ) = µa ∗ (ϕd )
dt
(III.12)
onde µ é uma constante arbitrária.
A solução de regime permanente de (III.12) é dada por
−1 ∗
w (t ) = R xx
a (ϕd )
(III.13)
A expressão iterativa para atualização dos coeficientes do array pode ser deduzida
discretizando-se (III.12), ou seja, substituindo w(t) por w(k) e a derivada dw(t)/dt pela
28
diferença
dw (t ) w ( k + 1) − w ( k )
=
dt
T
(III.14)
onde T é o período de amostragem.
Realizando as substituições sugeridas, obtemos a seguinte expressão iterativa para o
array de Applebaum
w ( k + 1) + [ µR xx − I]w ( k ) = µa ∗ (ϕ d )
(III.15)
onde o produto µT foi substituído por uma nova constante µ , que nessa expressão é o passo
de adaptação.
A Figura III.3 mostra os padrões de irradiação após convergência dos coeficientes de um
array de Applebaum linear de três elementos separados por uma distância λ / 2 . A direção de
z
chegada do sinal desejado é 30 , o passo de adaptação é de um centésimo, a relação
sinal/ruído (SNR) de entrada é 10 dB e foram realizadas 1000 iterações. O padrão da Figura
III.3(a) foi obtido numa situação sem interferentes, ao passo que na Figura III.3(b) o ambiente
simulado continha um sinal interferente, de mesma potência que o sinal desejado (SIR = 0dB),
{
incidindo no array na direção 90 .
Como percebemos da Figura III.3, os padrões de irradiação são simétricos em relação ao
eixo (90°, 270°). Esta é uma característica inerente aos arrays lineares, não acontecendo, por
exemplo, em arrays circulares [Litva, 1997].
29
90
90
0.942
120
60
1.0122
120
60
0.80978
0.7065
0.60734
0.471
150
30
150
30
0.40489
0.2355
0.20245
180
0
330
210
240
300
180
0
330
210
240
300
270
270
(a)
}
(b)
|
Figura III.3 - Padrões de irradiação de um array de Applebaum. A direção do sinal desejado é 30 .
(a) sem interferentes e (b) com interferente em 90 .
O array de Applebaum é simples e não requer sinal de referência, o que exigiria um
conhecimento estatístico mínimo a respeito do sinal de entrada x(k) para gerá-lo. Também não
é necessário o conhecimento exato da matriz de autocorrelação R xx , que pode ser estimada
por uma aproximação estocástica.
Porém no array de Applebaum é necessário o conhecimento da direção de chegada do
sinal desejado para que se possa determinar o vetor de direcionamento a(ϕ d ) . Nos sistemas
que utilizam radares, para os quais o array foi originalmente concebido, esta é uma
complicação contornável uma vez que o sinal recebido é a reflexão de um sinal transmitido
anteriormente.
Uma opção para o array de Applebaum em que não é necessário conhecer a direção de
chegada do sinal desejado é o array com sinal piloto, publicado em [Widrow et. al., 1967] e
desenvolvido como uma aplicação para o algoritmo LMS, criado por Widrow e Hoff pouco
tempo antes.
30
III.2 O Array com Sinal Piloto
O array desenvolvido pela equipe de Widrow utiliza o mesmo algoritmo LMS
apresentado no capítulo II, cuja expressão iterativa de atualização dos coeficientes é dada em
(II.13). A estrutura do array com sinal piloto corresponde à configuração geral do filtro
adaptativo espacial mostrado na Figura II.1.
Podemos identificar a diferença prática entre o array de Applebaum e o array com sinal
piloto. No array de Applebaum necessitamos conhecer a direção de chegada do sinal
desejado, informação que não é necessária ao array com sinal piloto que, no entanto, necessita
de um sinal de referência (piloto) para “treinar” o array.
A Figura III.4 representa a evolução do padrão de irradiação durante o processo de
adaptação de um array LMS uniforme e linear de 2 elementos. O sinal desejado é
monocromático com potência σ d2 = 1 e possui direção de chegada (DOA - Direction of
~
Arrival) ϕ d = 30 . O sinal piloto é uma réplica do sinal desejado. Um interferente também
monocromático, de mesma freqüência que o sinal desejado e com potência 10 dB menor

incide no array na direção ϕ i = 90 . O passo de adaptação adotado foi de um centésimo e o
algoritmo demorou 5000 iterações para convergir.
A Figura III.4(a) representa o padrão de irradiação no início do processo de adaptação.
Na Figura III.4(b) estamos com 33% do processo concluído e a Figura III.4(c) representa o
padrão de irradiação na convergência do algoritmo. Percebemos que o interferente foi
cancelado sem que o array conhecesse sua direção de chegada.
31
90
90
0.019134
120
1.206
120
60
60
0.014351
0.0095671
150
0.60298
150
30
30
0.0047835
180
180
0
210
210
330
240
0
330
240
300
300
270
270
(a)
(b)
90
1.4054
120
60
0.70269
150
30
180
0
330
210
300
240
270
(c)
€

Figura III.4 - Processo de adaptação de um array linear de 2 elementos com sinal piloto.
O sinal desejado possui direção 30 e o interferente, 90 . (a) início do processo de adaptação;
(b) a 67% da convergência; (c) padrão final
Outros arrays, como aqueles que iremos mostrar nas próximas seções, possuem
performance melhor que a do array com sinal piloto ou mesmo são mais fáceis de
implementar, mas o array com sinal piloto foi importante para dar sustentação ao surgimento
de outras tecnologias. Sua principal desvantagem está na necessidade de geração de um sinal
piloto correlacionado com o sinal desejado, cujas propriedades estatísticas nem sempre são
conhecidas.
32
O array que Griffiths desenvolveu contorna este problema e possui solução que também
é a melhor estimação do sinal desejado no sentido de minimização do erro quadrático.
III.3 O Array de Griffiths
A idéia central dessa estrutura, proposta em [Griffiths, 1969] é eliminar o sinal piloto do
array de Widrow uma vez que se conhece (ou estima-se) a correlação cruzada entre o sinal na
entrada do array e o sinal desejado.
Griffiths partiu de um simples rearranjo na expressão do algoritmo LMS para derivar a
expressão do seu algoritmo. O algoritmo LMS é dado pela Equação (II.13), reproduzida aqui
para facilitar o raciocínio
w ( k + 1) = w ( k ) + 2 µe∗ ( k )x( k )
(III.16)
Expandindo nessa expressão o erro e(k) entre a saída e o sinal de referência, temos
w ( k + 1) = w ( k ) + 2 µ[d ( k ) − y ( k )] x( k )
∗
= w ( k ) + 2 µd ∗ ( k ) x ( k ) − 2 µy ∗ ( k ) x ( k )
(III.17)
Substituindo o valor instantâneo d*(k)x(k) pela correlação cruzada entre o sinal de
entrada e o sinal de referência, rdx = E[ d ∗ ( k )x( k )] , chegamos à expressão final do algoritmo
de Griffiths
w ( k + 1) = w ( k ) + 2 µrdx − 2 µy ∗ ( k )x( k )
(III.18)
Pode-se demonstrar (ver [Widrow e Stearns, 1985]) que o valor esperado do vetor de
coeficientes após a convergência do algoritmo é dado pela solução de Wiener, ou seja
33
lim E[ w ( k )] = R −xx1rdx
(III.19)
k →∞
A Fig. III.5 mostra um esquema para implementação do array. O conjunto de
atrasadores serve para posicionar o lóbulo principal na direção do sinal desejado. Portanto, à
semelhança do array de Applebaum, no array de Griffiths é necessário conhecer a direção de
chegada do sinal desejado, além da correlação cruzada entre o sinal de entrada e a referência.
∆
∆
x1(k)
w1
x2(k)
w2
Σ
y(k)
...
...
∆
xN(k)
wN
...
w(k +1) = w(k) + 2µrdx − 2µy(k)x(k)
Figura III.5 - O array de Griffiths
III.4 O Array de Frost
O array de Frost [Frost, 1972] foi a primeira implementação de um algoritmo adaptativo
com restrições. Partindo do princípio de minimização da potência (ou variância) do sinal de
saída, uma restrição é imposta para que seja mantida uma determinada resposta de amplitude
constante e fase linear na direção e na banda do sinal desejado. Não houvesse a restrição e o
array “desligaria” pela anulação dos seus coeficientes, já que desta forma a potência de saída
estaria minimizada. Com a restrição fica garantida a manutenção do sinal desejado na saída,
ao mesmo tempo em que os interferentes e ruídos são cancelados. O problema de
34
minimização restrita resolvido por Frost é denominado LCMV (de Linear Constrained
Minimum Variance).
A restrição imposta pelo algoritmo pode ser representada pela equação
CH w ( k ) = g
(III.20)
onde C é a matriz de restrições, que, para um array de N elementos onde há K restrições,
possui dimensão NxK. g (Kx1) é o vetor de resposta do array a cada restrição. C contém as
informações sobre freqüência e ângulo de chegada do sinal (sobre formação da matriz de
restrições, consultar [Resende, 1996]).
Como exemplo simples de projeto de restrição, podemos desejar que um array uniforme
e linear possua resposta unitária na direção de chegada do sinal desejado, ϕ d . A matriz de
restrições irá reduzir-se então a um vetor de direcionamento, ou seja
[
C = e j ⋅ f 1 (ϕ d )
e j ⋅ f 2 (ϕ d )
‚
e j ⋅ f N (ϕ d )
]
T
(III.21)
onde f n (ϕ d ) foi definido em (II.33). Nesse caso o vetor de resposta do array será um escalar
unitário, ou seja, g = 1.
Como dissemos, o array de Frost tem como intuito minimizar a potência de saída, que
pode ser escrita como
[
]
1
2
E y( k )
2
1
= E[ w H ( k )x( k )x H ( k ) w ( k )]
2
1
= w H (k)E[x( k )x H ( k )]w ( k )
2
1
= w H ( k )R xx w ( k )
2
P=
(III.22)
35
O objetivo do array de Frost é, dessa forma,
w
1 H
w ( k )R xx w ( k )
2
(III.23a)
sujeito a
CH w = g
(III.23b)
min P =
A partir de (III.23) utiliza-se o método dos multiplicadores de Lagrange (ver [Haykin,
1996]) para determinar a função custo ψ a ser minimizada, obtendo-se
ψ =
{
}
1 H
w ( k )R xx w ( k ) + Re λH ( CH w ( k ) − g)
2
(III.24)
onde λ é o vetor de multiplicadores de Lagrange.
Para encontrarmos o mínimo de ψ , calculamos seu gradiente e igualamos a zero,
obtendo a seguinte equação em w(k)
∇ w (ψ ) = R xx w ( k ) + CλH = 0
(III.25)
cuja solução é
−1
w opt = −R xx
CλH
(III.26)
Para eliminarmos o multiplicador de Lagrange da expressão do vetor de coeficientes
ótimo, substituimos (III.26) em (III.24) e obtemos
−1 H
CH w opt = −CH R xx
λ C=g
(III.27)
Isolando λ na equação acima obtemos
−1
λ = −( CH R xx
C) g
−1
(III.28)
36
Substituindo (III.28) em (III.26) obtemos a expresão final para o vetor de coeficientes
ótimo
−1
−1
w opt = R xx
C(CHR xx
C) g
−1
(III.29)
O algoritmo iterativo de atualização dos coeficientes utiliza o método da descida mais
íngrime, ou seja
w ( k + 1) = w ( k ) − µ∇ w (ψ )
(III.30)
= w ( k ) − µ[R xx w ( k ) + CλH ( k ) ]
Como a restrição deve ser sempre mantida, a seguinte equação deve ser verdadeira:
g = CH w ( k + 1)
(III.31)
= CH w ( k ) − µCH R xx w ( k ) − µCH CλH ( k )
Isolando λ ( k ) em (III.31), vem
λ ( k ) = ( µCHC) [CH w ( k ) − µCH R xx w ( k ) − g]
−1
(III.32)
Substituindo (III.32) em (III.30), obtemos a expressão final do algoritmo de Frost
[
]
w ( k + 1) = w ( k ) − µ I − C( CH C) CH R xx w ( k ) + C( CH C)
−1
−1
[g − C
H
w ( k )]
(III.33)
É importante salientar que há uma grande flexibilidade para o projeto do vetor de
restrições. Suponha como exemplo que se queira, além de uma determinada resposta do array
na direção do sinal desejado, cancelar um interferente que possui uma direção de chegada
conhecida. Uma restrição possível que atende essas condições pode ser escrita na forma
37
c T 
g
 T w(k ) =  
0
i 
(III.34)
onde i é o vetor contendo as informações sobre o interferente que se quer cancelar.
A Figura III.7(a) abaixo mostra o padrão de irradiação de um array de Frost de 2
elementos. A restrição imposta foi de que a resposta na direção de chegada do sinal desejado
ƒ
( ϕ d = 30 ) fosse unitária. Ou seja, g = 1. A SNR de entrada é de 10 dB.
A Figura III.7(b) mostra o padrão de irradiação do mesmo array, agora com um sinal
„
interferente na direção ϕ i = 120 e com potência 10 dB maior que a do desejado.
90
90
0.99971
120
60
1.5166
60
120
0.74979
1.0111
0.49986
150
30
150
30
0.50554
0.24993
180
0
210
180
330
210
300
240
0
330
240
300
270
270
(a)
(b)
†
…
Figura III.7 - Padrões de irradiação de um array de Frost com sinal desejado em 30 . Em (b) há um
interferente na direção 120 com potência 10dB maior.
O algoritmo de Frost, apesar de ter carga computacional maior que as dos outros
algoritmos até agora mencionados, possui flexibilidade para o projeto das restrições,
aumentando a variedade de aplicações em que pode ser utilizado.
Em 1982 Griffiths e Jim [Griffiths e Jim, 1982] propuseram uma alternativa ao array de
Frost de implementação mais simples que passou a ser chamada de GSC (generalized sidelobe
canceller). Este é o tema abordado na próxima seção.
38
III.5 O GSC
No GSC (Generalized Sidelobe Canceller) as restrições não são incorporadas à
adaptação do algoritmo, sendo realizadas por um filtro de coeficientes constantes. Aqui
apresentaremos apenas uma visão sistêmica do GSC. Seu desenvolvimento matemático
detalhado pode ser encontrado em [Resende, 1996].
A Figura III.8 traz um esquema do GSC. Como no array de Applebaum, os atrasadores
de direcionamento servem para posicionar o lóbulo principal do array na direção do sinal
desejado. O sinal processado pelo filtro de coeficientes constantes é a somatória das
componentes dos sinais na entrada do array que estão em fase com o sinal desejado. O filtro
impõe uma determinada resposta do array na direção do sinal desejado, ou seja, uma
restrição.
Os sinais nas entradas dos filtros transversais adaptativos são formados pelas diferenças
par a par das componentes dos sinais de entrada que estão em fase com o sinal desejado,
sendo, portanto, constituídos basicamente pelas componentes dos interferentes e ruídos. Estes,
após processados, são subtraídos do sinal que possui influência forte do sinal desejado (saída
do filtro fixo). O resultado é um erro que é minimizado no sentido LMS para corrigir os
valores dos coeficientes dos filtros adaptativos. Griffiths e Jim [Griffiths e Jim, 1982]
demonstram que a solução ótima do GSC é a mesma do array de Frost.
39
implementa a
restrição do
algoritmo
Σ
+
filtro do sinal
desejado (fixo)
Σ
y(k)
-
+
-
Σ
w1∗
+
...
-
Σ
w2∗
Σ
...
+
-
Σ
w∗N −1
e(k)
Figura III.8 - O array de Griffiths/Jim (GSC)
III.6 O Array de Resende (Algoritmo CFLS)
Resende, em 1996, propôs um algoritmo adaptativo recursivo de mínimos quadrados
rápido a ser aplicado em arrays onde a função custo apresenta restrições [Resende, 1996]. Foi
considerada sua aplicação para resolver tanto o problema de minimização da potência de saída
com restrições (o mesmo LCMV do algoritmo de Frost) quanto o de minimização do erro
quadrático entre a saída e um sinal de referência (critério de mínimos quadrados), acrescida de
restrições. Esta última formulação é chamada de LCID (de Linear Constrained Identifier).
A função custo do critério de mínimos quadrados minimiza o erro quadrático,
ponderado por um fator de esquecimento 0 < ϕ ≤ 1 [Haykin, 1996]. Para formularmos o
problema LCID acrescentamos as restrições, resultando em
40
k
min ψ = ∑ ϕ
w
i =1
k −i
k
e ( k ) = ∑ ϕ k −i [ d (i ) − w H x(i )]
2
2
(III.35a)
i =1
CH w = g
sujeito a
(III.35b)
A restrição representada por (III.35b) é da mesma forma da restrição do algoritmo de
Frost, representada por (III.20). ϕ é o fator de esquecimento como no algoritmo RLS, visto
anteriormente.
A solução ótima de (III.35) é obtida, à maneira do problema LCMV do algoritmo de
Frost, pelo método dos multiplicadores de Lagrange, resultando no seguinte vetor de
coeficientes
[
] [g − C
−1
−1
−1
w opt ( k ) = R xx
( k )rxd ( k ) + R xx
( k )C C H R xx
( k )C
−1
H
]
−1
R xx
( k )rxd ( k ) (III.36)
onde R xx ( k ) é dado pela Eq. II.14 e rxd ( k ) é dado pela Eq. II.15.
Como observado em [Resende, 1996], a solução ótima do problema de minimização
restrita é composta de duas componentes. A primeira é a solução ótima do critério de mínimos
quadrados, ou seja
w sr = R −1
xx rxd
(III.37)
A segunda é a correção da primeira no sentido de acompanhar as restrições do processo
[
] [g − C
−1
−1
w r = R xx
C C H R xx
C
−1
H
−1
R xx
rxd
]
(III.38)
w r , por sua vez, é composto de dois fatores. O primeiro é um vetor da mesma dimensão
de g representando o erro propriamente dito entre a solução sem restrições e a solução com
restrições, dado por
−1
e r = g − C H R xx
rxd = g − C H w sr
(III.39)
41
O segundo é um operador linear que tem como função mapear o erro para o espaço cuja
dimensão é a mesma do vetor w sr , representado pela matriz
[
]
−1
−1
Q = R xx
C C H R xx
C
−1
(III.40)
Uma primeira aproximação para um algoritmo adaptativo que busque resolver o
problema formulado em (III.35) pode ser escrita diretamente de (III.36), (III.37) e (III.40), ou
seja
[
w ( k + 1) = w sr ( k + 1) + Q( k + 1) g − C H w sr ( k + 1)
]
(III.41)
Para adaptar o conjunto de coeficientes w sr , Resende utiliza o algoritmo de mínimos
quadrados rápido (FLS - Fast Least Squares) [Haykin, 1996], obtendo a seguinte formulação
w sr ( k + 1) = w sr ( k ) + f ( k + 1) ⋅ esr∗ ( k + 1)
(III.42)
onde o erro esr(k+1) é definido por
esr ( k + 1) = d ∗ ( k + 1) − w srH ( k )x( k + 1)
(III.43)
e o ganho de adaptação f(k) por
f ( k + 1) =
−1
R xx
( k )x( k + 1)
−1
H
ϕ + x ( k + 1)R xx
( k )x( k + 1)
(III.44)
Para eliminarmos em (III.41) a dependência com a componente não restrita w sr ,
começamos substituindo (III.42) em (III.41) para obtermos
42
w ( k + 1) = w sr ( k ) + f ( k + 1)d ( k + 1) − f ( k + 1) w srH ( k )x( k + 1) +
− Q( k + 1)C H f ( k + 1)d ( k + 1) + Q( k + 1)C H f ( k + 1) w srH ( k )x( k + 1) + (III.45)
[
+ Q( k + 1) g − C H w sr ( k )
]
Em [Resende, 1996], demonstra-se que a seguinte igualdade é válida:
Q( k + 1) = Q( k ) − f ( k + 1)x H ( k + 1)Q( k ) + Q( k + 1)C H f ( k + 1)x T ( k + 1)Q( k ) (III.46)
Substituindo (III.46) no último termo de (III.45) e reagrupando alguns termos, temos
{
]}
[
w ( k + 1) = w sr ( k ) + Q( k ) g − C H w sr ( k ) + f ( k + 1)d ( k + 1) +
− Q( k + 1)C H f ( k + 1)d ( k + 1) +
{
[
]}
− f ( k + 1)x H ( k + 1) w sr ( k ) + Q( k ) g − C H w sr ( k ) +
{
[
+ Q( k + 1)C H f ( k + 1)x H ( k + 1) w sr ( k ) + Q( k ) g − C H w sr ( k )
(III.47)
]}
Observando que os termos entre chaves são iguais a w(k) (Eq. III.41), podemos
reescrever (III.45), reagrupando-lhe alguns termos, como
w ( k + 1) = w ( k ) + f ( k + 1)[ d ( k + 1) − x H ( k + 1) w ( k )] +
− Q( k + 1)CH f ( k + 1)[ d ( k + 1) − x H ( k + 1) w ( k )]
(III.48)
∗
= w ( k ) + f ( k + 1)e ( k + 1) − Q( k + 1)C f ( k + 1)e ( k + 1)
*
H
onde
e( k + 1) = d ∗ ( k + 1) − w H ( k )x( k + 1)
(III.49)
P( k + 1) = I − Q( k + 1)C H
(III.50)
Definindo a matriz
Podemos reescrever o algoritmo em (III.48) na forma sucinta
43
w ( k + 1) = w ( k ) + P( k + 1)f ( k + 1)e∗ ( k + 1)
(III.51)
O desenvolvimento realizado até aqui foi para o problema LCID. O problema LCMV,
de minimização restrita da potência de saída do array, pode ser representado como
min ψ =
w
k
∑ϕ
k −i
y (k ) =
2
i =1
sujeito a
∑ ϕ [w
k
i =1
k −i
H
x(i )]
2
CH w = g
(III.52a)
(III.52b)
A solução ótima de (III.52) é a mesma do algoritmo de Frost, dada por (III.29), que, ao
substituirmos a expressão da matriz Q dada em (III.40), é representada por
w opt = Q( k )g
(III.53)
Para procedermos ao desenvolvimento de um algoritmo iterativo, agimos como no caso
LCID e primeiramente escrevemos (III.53) na sua forma temporal
w ( k + 1) = Q ( k + 1)g
(III.54)
Substituimos então a expressão de Q(k+1) dada por (III.46) e da matriz P dada por
(III.50) em (III.54), resultando no seguinte algoritmo
w ( k + 1) = w ( k ) − P( k + 1)f ( k + 1) w H ( k )x( k + 1)
(III.55)
O algoritmo representado por (III.51) apresenta um problema de desvio das restrições
com o tempo, pois na recursão de w(k) não há menção ao vetor g, que funciona como um
corretor para esse desvio. E em ambos os algoritmos (III.51) e (III.55) há perda gradativa das
restrições na recursão da matriz Q(k) [Resende, 1996]. Portanto, os algoritmos não são
robustos, principalmente em se tratando de longas seqüências de dados.
Uma maneira de contornar o problema de desvio das restrições do caso LCID é
44
adicionar, em (III.51), um termo de correção, como foi feito em (III.39). O resultado é
w ( k + 1) = w ( k ) + P( k + 1)f ( k + 1)e∗ ( k + 1) + Q( k + 1)[g − CH w ( k )]
= w ( k ) − Q( k + 1)CH w ( k ) + P( k + 1)f ( k + 1)e∗ ( k + 1) + Q( k + 1)g
(III.56)
Rearranjando alguns termos e expandindo a matriz P, obtemos uma forma
computacionalmente mais econômica do algoritmo:
{
}
w ( k + 1) = w ( k ) + f ( k + 1)e∗ ( k + 1) + Q( k + 1) g − CH [ w ( k ) + f ( k + 1)e∗ ( k + 1)] (III.57)
Finalmente, para resolver o problema de perda gradativa das restrições na atualização da
matriz Q(k+1) para ambos os algoritmos, Resende sugere a adição de um termo de correção à
matriz, gerando a matriz corrigida Q cor ( k + 1) [Resende, 1996]:
Q cor ( k + 1) = Q( k + 1) + C[ CH C]
−1
[I − C
H
Q( k + 1)]
(III.58)
Os algoritmos desenvolvidos devem ser inicializados segundo o critério de mínimos
quadrados. A inicialização adotada por Resende consiste em igualar a zero todas as variáveis,
exceto a matriz de autocorrelação R xx , à qual é atribuído, na diagonal principal, um valor
inicial positivo E0 [Resende, 1996].
O algoritmo desenvolvido por Resende, denominado CFLS (de Constrained Fast Least
Squares), pode ser sumariado, em suas aplicações para os problemas CFLS e LCID num array
de banda estreita (somente um coeficiente por elemento), nos seguintes procedimentos:
Para o problema LCID (array com sinal piloto restrito)
• Inicialização
w ( 0) = Q ( 0)g , onde
[
]
−1
−1
Q(0) = R xx
(0)C CH R xx
(0)C
−1
e
45
−1
R xx
(0) = E0 I
• Adaptação
• Novos dados no instante k+1:
x(k+1) e d(k+1)
• Calcular o ganho de adaptação:
f ( k + 1) =
−1
R xx
( k )x( k + 1)
H
−1
ϕ + x ( k + 1)R xx
( k )x( k + 1)
• A inversa de R xx é calculada como no algoritmo RLS, ou seja
[
−1
−1
−1
R xx
( k + 1) = ϕ −1 R xx
( k ) − f ( k + 1)x T ( k + 1)R xx
(k )
]
• Atualizar a matriz Q(k):
Q(k + 1) = Q cor (k ) − f (k + 1)x H (k + 1)Q cor (k ) + Q cor (k + 1)C H f (k + 1)w srH (k )x(k + 1)Q cor (k )
Q cor ( k ) = Q( k ) + C[ CH C]
−1
[I − C
H
Q( k )]
• Calcular o sinal de erro:
e( k + 1) = d ∗ ( k + 1) − w H ( k )x( k + 1)
• Calcular o próximo vetor de coeficientes:
{
}
w ( k + 1) = w ( k ) + f ( k + 1)e∗ ( k + 1) + Q( k + 1) g − CH [ w ( k ) + f ( k + 1)e∗ ( k + 1)]
Para o problema LCMV
• Inicialização
w ( 0) = Q ( 0)g , onde
[
]
−1
−1
Q(0) = R xx
(0)C CH R xx
(0)C
−1
e
−1
R xx
(0) = E0 I
• Adaptação
•Novos dados no instante k+1:
x(k+1)
• Calcular o ganho de adaptação:
f ( k + 1) =
−1
R xx
( k )x( k + 1)
H
−1
ϕ + x ( k + 1)R xx
( k )x( k + 1)
46
• A inversa de R xx é calculada como no algoritmo RLS, ou seja
[
−1
−1
−1
R xx
( k + 1) = ϕ −1 R xx
( k ) − f ( k + 1)x T ( k + 1)R xx
(k )
]
• Atualizar a matriz Q(k):
Q(k + 1) = Q cor (k ) − f (k + 1)x H (k + 1)Q cor (k ) + Q cor (k + 1)C H f (k + 1)w srH (k )x(k + 1)Q cor (k )
Q cor ( k ) = Q( k ) + C[ CH C]
−1
[I − C
H
Q( k )]
• Calcular o próximo vetor de coeficientes:
w ( k + 1) = Q (k + 1)g
III.7 Arrays Parcialmente Adaptativos
Graus de Liberdade de um Array
O número de graus de liberdade de um array é igual ao número de coeficientes menos o
número de restrições do algoritmo (sobre restrição, consultar as seções III.4 e III.6). Por
exemplo, para um array de Frost com restrição dada por
cT w ( k ) = g
(III.59)
o número de graus de liberdade é N-1 (sendo N o número total de elementos do array), já que
existe uma única restrição. Já num array de Frost com restrição
c
g
 i  w( k ) =  0 
 
 
(III.60)
o número de graus de liberdade é N-2.
47
A quantidade de graus de liberdade de um array determina o número de nulos possíveis
no padrão de irradiação, e, por extensão, determina também o número de interferentes que
podem ser cancelados. Um array adaptativo de N graus de liberdade pode anular até N-1
interferentes [Widrow e Stearns, 1985].
Arrays Parcialmente Adaptativos
A quantidade de operações necessárias para realizar um passo de adaptação dos
coeficientes de um array depende do número de coeficientes N. Para um caso em que N é
grande pode haver prejuízo de performance ou mesmo inviabilização do array devido ao
excessivo tempo gasto na computação do algoritmo. Uma alternativa para resolver esse
problema sem que seja necessário diminuir o número de coeficientes é utilizar somente um
sub-conjunto deles no algoritmo adaptativo, ou seja utilizar um número de graus de liberdade
menor que o disponível no array.
Um array totalmente adaptativo utiliza todos os seus coeficientes no processo de
adaptação, enquanto que um array parcialmente adaptativo utiliza somente um sub-conjunto
deles. Um array parcialmente adaptativo consome menos recursos computacionais e tem
convergência mais rápida que um array totalmente adaptativo.
Podemos representar a diminuição do número de graus de liberdade pela introdução de
uma transformação linear no vetor de entrada do array:
x p ( k ) = T T x( k )
(III.61)
onde x p ( k ) é o novo vetor de entrada do array, que incorpora a redução do número de graus
de liberdade dada pela transformação linear T.
Para definição da matriz T utiliza-se comumente uma técnica denominada de técnica do
48
espaço de elementos, onde seleciona-se somente uma parte dos elementos do array para terem
seus coeficientes controlados pelo algoritmo adaptativo. O restante dos coeficientes
permanecem fixos. Neste caso T é uma matriz esparsa de L ≤ N colunas, sendo L o número
de elementos do array que se quer utilizar, cada uma contendo somente um elemento unitário
(relativo à posição, no array, do elemento que se quer utilizar), sendo que todos os outros são
iguais a zero.
Segue de (III.61) que a matriz de autocorrelação do vetor de entrada num array
parcialmente adaptativo é dada por
[
]
R pp = E x p x tp = T t R xx T
(III.62)
Utilizando no algoritmo adaptativo o vetor de entrada do array como dado pela
transformação (III.61), qualquer um dos algoritmos apresentados nas seções anteriores pode
ser utilizado.
III.8 Sumário
Neste capítulo apresentamos alguns dos principais algoritmos de arrays adaptativos já
desenvolvidos. Procuramos esclarecer não só seus princípios de funcionamento mas também
as diferenças que existem entre cada um. Com isso estaremos mais capacitados para
estabelecer o domínio possível de aplicação de cada array.
O próximo capítulo é sobre técnicas de estimação de direção de chegada de sinais. Estas
técnicas são úteis para viabilizar a aplicação dos algoritmos que necessitam conhecer as
direções de chegada dos sinais, como, por exemplo, os arrays de Frost, Applebaum e
Resende. Apesar de se tratar de um assunto intimamente relacionado ao deste capítulo,
optamos por escrevê-lo em um capítulo em separado pois achamos que essa atitude contribuiu
para uma maior clareza do texto, já que o Capítulo III por si só já é bastante extenso.
49
‡0ˆŠ‰
‹MŒAŽ’‘:“”•u–7—7˜uŽš™—“”:•u–7—
›œ
—ž3‘–3‘Ÿ–7— MŽš¡3‘ŽšŒ
Os arrays adaptativos cujos algoritmos requerem o conhecimento a priori da direção de
chegada do sinal desejado (por exemplo, os arrays de Applebaum, de Frost e de Resende) não
são de imediata implementação em ambientes de comunicações móveis. Isso se deve à
impossibilidade de se adquirir essa informação, já que os móveis possuem trajetórias
aleatórias nas células e o efeito de multipercurso gera cópias do sinal que chegam ao receptor
segundo direções diferentes da do sinal transmitido. Para viabilizar a aplicação desses
algoritmos em sistemas de comunicações móveis, alguns trabalhos, como [Klouche-Djedid e
Fujita, 1996] e [Anderson et. al., 1991], têm considerado o emprego de técnicas para
estimação das direções de chegada do sinal desejado.
As técnicas de estimação de direção de chegada de sinais fazem parte das soluções
dadas para problemas de estimação de parâmetros, há longo tempo estudados por matemáticos
e estatísticos [Krim e Viberg, 1996]. Essas técnicas tiveram no processamento espaçotemporal realizado com arrays de antenas uma base consistente para viabilizar suas
aplicações.
Os métodos de estimação de parâmetros utilizando arrays de antenas tiveram suas
primeiras aplicações na localização de fontes de sinal em radares e sonares utilizando técnicas
de arrays formadores de feixes. Esses métodos mostram-se limitados para aplicações que
exigem alta resolução de estimação, como em comunicações pessoais e comunicações via
50
satélite, uma vez que suas performances são diretamente dependentes do tamanho físico
(abertura) do array, o que acaba por restringir a resolução dos algoritmos. A introdução de
técnicas de estimação baseadas em subespaços proporcionou o surgimento de algoritmos de
alta resolução.
Neste Capítulo descreveremos resumidamente algumas das técnicas de estimação de
parâmetros. Iniciaremos pelas técnicas baseadas nos arrays formadores de feixes (já descritos
anteriormente no Capítulo III), passando posteriormente para as técnicas de decomposição em
subespaços. Esses dois conjuntos formam um superconjunto de algoritmos baseados em
espectros, onde estão contidos os algoritmos de menor custo computacional, entre eles o
popular MUSIC. Depois descreveremos alguns dos métodos paramétricos, que são, em geral,
computacionalmente muito complexos, mas apresentam melhor resolução e suas
performances são menos dependentes do número de amostras analisadas.
Antes da descrição dos algoritmos vamos dedicar algumas linhas à fatoração espectral
da matriz de autocorrelação do sinal de entrada do array, necessária ao desenvolvimento
matemático dos algoritmos.
IV.1 Fatoração Espectral de R xx
Segundo o modelo de sinais descrito no Capítulo II, o vetor dos sinais nas saídas dos
elementos do array é descrito como
x(k ) = A(ϕ ) ⋅ s(k ) + n(k )
(IV.1)
Nos algoritmos de estimação que iremos apresentar os sinais são considerados de faixa
estreita. A função de autocorrelação de x(k), considerando que o ruído é descorrelacionado do
sinal, é
51
[
]
[
]
[
R xx = E x( k )x H ( k ) = AE s( k )s H ( k ) A H + E n( k )n H ( k )
]
(IV.2)
onde o índice h indica conjugado transposto. A dependência de A com o vetor ϕ foi omitida
para maior clareza do texto. Se considerarmos o ruído como sendo branco e de potência σ 2 ,
temos que
[
]
E n( k ) n H ( k ) = σ 2 I
(IV.3)
A matriz de autocorrelação dos sinais incidentes no array é definida como
[
R ss ( k ) = E s( k )s H ( k )
]
(IV.4)
A decomposição de R xx em seus autovalores e autovetores leva à seguinte expressão
[Boldrini et. al., 1980]:
R xx = AR ss A H + σ 2 I = QΛQ H
(IV.5)
onde
Λ = diag{ λ1
λ2
¢
¢
λN } , λ1 ≥ λ2 ≥ ≥ λN
(IV.6)
é a matriz diagonal formada pelos N autovalores de R xx ordenados em forma decrescente e Q
é a matriz cujas colunas são os autovetores correspondentes aos autovalores em Λ . Pode-se
demonstrar [Roy e Kailath, 1989] que os autovetores de R xx correspondentes aos I maiores
autovalores, sendo I o número de sinais incidentes, estão contidos no subespaço vetorial
formado pelas colunas de A, ao qual daremos o nome de Subespaço de Sinais. Demonstra-se
também que os autovetores restantes são ortogonais ao Subespaço de Sinais e correspondem
aos N - I menores autovalores, todos iguais a σ 2 . Esses vetores estão contidos no subespaço
denominado de Subespaço de Ruído.
52
Podemos agora decompor a matriz R xx nas suas componentes de sinal e de ruído, da
seguinte maneira:
R xx = Q s Λ s Q Hs + Q n Λ n Q nH
(IV.7)
As colunas de Q s são os autovetores correspondentes aos I maiores autovalores de R xx
(elementos de Λ s ) pertencentes ao subespaço de sinais e as colunas de Q n são os autovetores
correspondentes aos N - I menores autovalores (todos iguais a σ 2 e dispostos na diagonal
principal de Λ n ) pertencentes ao subespaço de ruído.
É importante salientar que a matriz de autocorrelação R xx na maioria das vezes não é
conhecida a priori, devendo portanto ser estimada. Uma estimação freqüentemente utilizada é
a que realiza uma média temporal das M amostras do sinal x, como segue:
£
R xx =
1
M
M
∑ x( k )x
H
(k )
(IV.8)
k =1
A fatoração espectral de R xx nos fornece de imediato um método para conhecermos o
número de sinais incidentes, que é igual ao número N de elementos do array menos o número
de autovalores de R xx iguais a σ 2 . No entanto, quando a matriz de autocorrelação dos dados
de entrada é estimada, os autovalores do subespaço de ruído não são todos exatamente iguais,
possuindo um espalhamento em torno de uma média. Neste caso, deve-se lançar mão de
métodos estatísticos especiais [Roy e Kailath, 1989] para a estimação de I.
IV.2 Solução Geométrica
Quando da ausência de ruído, podemos solucionar o problema de estimação das direções
de chegada dos sinais geometricamente. Sabemos que neste caso particular todos os
53
autovetores de R xx pertencem ao subespaço de sinais e que, portanto, formam uma base para
ele. Sabemos também que o subespaço de sinais é formado por uma combinação linear dos
vetores das colunas de A, definida em (II.37). Sabemos, finalmente, que o array manifold,
conhecido de antemão, contém todos os vetores de direcionamento do array para qualquer
ângulo de chegada no intervalo [0,2π ) , ou seja, contém a matriz A.
Portanto, ao encontrarmos a intersecção do subespaço de sinais com o array manifold,
estaremos determinando o conjunto de vetores de A que formam uma base para o subespaço
de sinais, ou seja, as próprias colunas dessa matriz. Assumindo que conhecemos a função
f n (ϕ i ) (Equação II.33), ou seja, o mapeamento único entre as direções de chegada dos sinais
e as colunas de A, então os parâmetros desejados estarão automaticamente determinados (Fig.
IV.9).
No entanto, quando se considera a situação mais realista de um ambiente ruidoso,
devemos levar em conta os algoritmos existentes para estimação de parâmetros, cujos
principais e mais utilizados estão descritos na seção seguinte.
IV.3 Algoritmos Baseados em Espectros
Essa classe de algoritmos realiza a estimação dos parâmetros de interesse através da
análise de funções espectrais relativas às estatísticas dos sinais. Os algoritmos podem ser
divididos em métodos de subespaço e métodos de arrays formadores de feixes.
Métodos de Arrays Formadores de Feixes
Esses métodos utilizam os arrays apresentados no capítulo III e procuram por pontos de
máximo na curva da potência de saída do array pelo ângulo de chegada. Esta curva
54
subespaço de
sinais
q3
a (ϕ 1)
q1
a(ϕ 2)
q2
array manifold
Figura IV.9 - Solução geométrica para um array de três elementos
onde incidem dois sinais, sem ruído
corresponde, no domínio espacial, ao espectro de potência do sinal de entrada.
Podemos escrever a saída do array como sendo o vetor de entrada ponderado pelo vetor
de coeficientes:
y ( k ) = w H x( k )
(IV.9)
A potência de saída é dada por
1
Po =
M
1
=
M
M
∑ y( k )
2
k =1
(IV.10)
M
∑w
H
H
x( k ) x w
k =1
onde M é o número de amostras considerado.
Podemos substituir em (IV.10) a expressão da aproximação estocástica da matriz de
55
autocorrelação do vetor de entrada, dada em (IV.8), para obtermos uma expressão reduzida
para a potência de saída:
¤
Po = w H R xx w
(IV.73)
Veremos em seguida, a título de exemplo, um método de arrays formadores de feixes
que utiliza aquele que é considerado o primeiro array formador de feixes desenvolvido [Krim
e Viberg, 1996].
Estimação Utilizando o Array de Bartlett
O primeiro array formador de feixes foi proposto por Bartlett [Krim e Viberg, 1996]
nos anos 40. O array de Bartlett atua maximizando a potência do sinal de saída. Ele não foi
incluído como um dos integrantes dos arrays apresentados no Capítulo III devido à sua pouca
aplicabilidade em sistemas com presença de ruído e de interferentes, já que neles a potência
do sinal de saída de um array pouco informa a respeito da qualidade desse sinal. Fizemos sua
inclusão nesta seção, no entanto, apenas por motivos didáticos, devido à simplicidade de sua
solução.
Considerando a presença somente de um sinal com direção de chegada ϕ e de ruído
aditivo branco, a expressão do sinal nas saídas dos elementos (Eq. II.34) reduz-se a
x(k ) = a(ϕ ) s (k ) + n(k )
(IV.12)
Maximizar a potência de saída é o mesmo que otimizar a seguinte função objetivo:
[
max E y ( k )
w
2
] = max w E[x(k )x (k )]w
= max { w a (ϕ ) E[ s(k) ] + σ
H
H
w
H
w
2
2
2
w
2
}
(IV.13)
A solução do problema de otimização acima pode ser encontrada calculando-se o
gradiente da função objetivo e igualando-o a zero. Os coeficientes ótimos resultantes desta
56
operação são [Krim e Viberg, 1996]
w opt =
a (ϕ )
a H (ϕ )a (ϕ )
(IV.14)
Para conhecermos o espectro espacial de potência deste array, substituímos (IV.14) em
(IV.73), obtendo
Po =
¥
a H (ϕ )R xx a (ϕ )
a (ϕ )a (ϕ )
H
(IV.15)
A resolução (diferença mínima entre as direções de chegada de dois sinais de tal forma
que o método ainda consiga discriminá-los) do método de estimação utilizando arrays de
antenas é dependente de sua geometria. Para que o array consiga resolver dois sinais (os picos
correspondentes no espectro espacial são suficientemente afastados de maneira que se pode
discerni-los), a diferença, em graus elétricos, entre suas direções de chegada deve ser muito
maior que a largura de feixe do array, que, para uma geometria linear uniforme com
afastamento de λ / 2 entre os elementos, é de 2π / N [Krim e Viberg, 1996].
Métodos de Subespaço
Esses métodos, que fazem parte dos métodos de estimação de alta resolução, utilizam a
estrutura de autovalores e autovetores da matriz de autocorrelação do sinal de entrada para
realizar suas estimativas. O método mais utilizado é o MUSIC [Schmidt, 1986], que foi o
primeiro a despertar um real interesse para aplicações de métodos de estimação de parâmetros
em sistemas de tempo real.
57
MUSIC
Quando surgiu, num congresso militar do final da década de 1970, o MUSIC apareceu
como uma atraente inovação na medida em que apresentava a capacidade de lidar com
qualquer configuração de arrays. Antes dele, a escolha de um determinado método de
estimação definia certos parâmetros de calibração dos arrays, o que alterava seus projetos. A
economia representada pela eliminação desse trabalho talvez tenha sido o maior responsável
pela alta popularidade inicial do método [Krim e Viberg, 1996].
Como já mostramos neste capítulo, nos casos onde não existe ruído a solução para o
problema de estimação de DOA se dá através da intersecção do subespaço de sinais com o
array manifold (ver Figura IV.9). Quando o ruído é considerado, a solução são os elementos
de
¦
que estão mais próximos ao subespaço de sinais. Uma métrica para avaliação dessa
proximidade é, portanto, necessária.
§
A métrica utilizada por Scmidt foi a distância euclidiana quadrática entre o elemento de
na direção a ser estimada ϕ e o subespaço de sinais. Sabendo que o subespaço de ruído é
ortogonal ao subespaço de sinais e, conseqüentemente, aos elementos de
¨
, a seguinte
distância:
d E2 = a H (ϕ )Q n Q nH a (ϕ )
(IV.16)
deverá ser nula para os elementos a(ϕ ) que pertencem ao subespaço de sinais. Esses vetores
são a solução do algoritmo.
O espectro proposto por Schmidt (Eq. IV.17) é o inverso dessa distância, ponderada
pelo módulo quadrático do vetor de
©
na direção ϕ , de maneira que as soluções aparecem na
forma dos I maiores picos do espectro [Schmidt, 1986]:
58
Po =
a H (ϕ )a (ϕ )
d E2
(IV.17)
Podemos escrever o seguinte procedimento para o algoritmo MUSIC:
• Colher os dados e formar R̂ xx , a estimativa de R xx ;
• Calcular os autovalores e autovetores Λ n e Q n da fatoração espectral de R̂ xx ;
• Estimar o número I de sinais;
• Encontrar os I maiores picos de PM (ϕ ) .
Apesar de ser um método de alta resolução, o MUSIC é extremamente sensível à relação
sinal/ruído na entrada do array e ao número de amostras consideradas nos seus cálculos,
gerando estimativas polarizadas quando esses números não se apresentam favoráveis.
Root MUSIC
A geometria dos arrays lineares e uniformes permite a simplificação de alguns
algoritmos, como é o caso do MUSIC. No Root MUSIC definem-se polinômios em z de
maneira que a estimação das direções de chegada sejam realizadas através de suas raízes. Para
defini-los, aproveita-se a ortogonalidade existente entre o espaço de ruído e o de sinais e,
portanto, entre os autovetores daquele e a matriz de direcionamento, ou seja:
A h (ϕ i )Q n = 0,
ϕ i ∈ {ϕ 1 , ϕ 2 ,
ª
,ϕ I }
(IV.18)
Se recordarmos que um array linear uniforme possui f n (ϕ i ) como dado por (II.33), os
seguintes polinômios construídos a partir dos autovetores do espaço de sinais possuem I de
suas raízes sobre a circunferência de raio unitário, ou seja, em z i = e jϕi , i = 1,
[
Pi ( z ) = qˆ ih ⋅ 1 z
­
]
t
z N −1 ,
i = I + 1, I + 2,
¬
,N
«
,I
(IV.19)
59
onde q̂ i é o autovetor da matriz R̂ xx correspondente ao i-ésimo autovalor. Podemos também
representar simultaneamente todos os N - I polinômios através do vetor
[
ˆh⋅1 z
p( z ) = Q
n
®
z N −1
]
t
( N − I × 1)
(IV.20)
Define-se também [Rao e Hari, 1989] o polinômio
V ( z ) = p h ( z −1 ) ⋅ p( z )
(IV.21)
V(z) possui 2 × ( N − 1) raízes dispostas em pares de fases simétricas (complexas
conjugadas), sendo que as I raízes de interesse (e seus respectivos pares) estão localizadas
sobre a circunferência de raio unitário e as N - I restantes possuem módulo menor que um.
Portanto, as direções de chegada dos sinais são estimadas como as fases das I raízes de maior
módulo.
O Root MUSIC, além da maior simplicidade em relação ao MUSIC, possui melhor
performance do que este quando o número de amostras do sinal é pequeno [Krim e Viberg,
1996].
ESPRIT
Desenvolvido numa tese de doutorado da Universidade de Standford [Roy e Kailath,
1989], o ESPRIT adota uma geometria particular do array e explora esse recurso em favor de
uma maior simplicidade do algoritmo em relação ao MUSIC.
Sua geometria considera a existência de dois arrays “gêmeos” de forma que, par a par, os
elementos de cada um mantêm a mesma distância em relação aos elementos correspondentes
do outro. Podemos esclarecer essa restrição através de um exemplo com um array linear
uniforme de seis elementos, separados por uma distância d. Nesse caso, pode-se considerar
que os primeiros cinco elementos formam o primeiro sub-array e os últimos cinco, seu
gêmeo, de forma que o primeiro elemento do segundo sub-array é o segundo elemento do
60
primeiro sub- array
1
2
d
3
d
4
d
1
2
5
d
3
d
4
5
segundo sub- array
Figura IV.10 - Divisão de um array linear e uniforme de seis elementos, segundo o algoritmo ESPRIT
primeiro e assim sucessivamente (Figura IV.10). Se denominarmos de x n (k ) a k-ésima
amostra do sinal na saída do n-ésimo elemento do primeiro array e de y n (k ) a saída do nésimo elemento do segundo, podemos escrever,
I
x n (k ) = ∑ a n (ϕ i ) ⋅ s i (k ) + n xn (k )
(IV.22)
i =1
e
I
y n (k ) = ∑ a n (ϕ i ) ⋅ e
d
j 2π senϕ i
λ
i =1
⋅ s i (k ) + n yn (k )
(IV.23)
Ou, em notação matricial
x(k ) = As(k ) + n x (k )
(IV.24)
e
61
y (k ) = A s(k ) + n y (k )
(IV.25)
onde
 j 2π d senϕ1
= diag e λ
î
e
j 2π
d
senϕ 2
λ
¯
e
d
j 2π senϕ I
λ



(IV.26)
é a matriz diagonal contendo os deslocamentos de fase provocados pelos ângulos de chegada
dos I sinais no segundo array, em relação ao primeiro. O algoritmo resume-se num método
que procura estimar Φ a partir de relações existentes entre as decomposições em autovalores
das matrizes de autocorrelação dos sinais x e y, R xx e R yy .
Denotamos por Q xs e Q ys as matrizes cujas colunas são os autovetores correspondentes
aos I maiores autovalores das matrizes R xx e R yy , respectivamente. Já que os elementos
dessas duas matrizes formam dois conjuntos distintos de bases para o mesmo espaço (o
subespaço de sinais), podemos relacioná-las através de um operador linear não singular, na
forma
Q xs
= Q ys
Da mesma maneira, as colunas das matrizes A e A
(IV.27)
formam dois conjuntos de bases
para o subespaço de sinais e portanto podem também ser relacionadas a Q xs e Q ys através de
um operador linear [Godara, 1997]:
Q xs = A
(IV.28)
Q ys = AΦΘ
(IV.29)
Substituindo (IV.28) e (IV.29) em (IV.27) encontramos a relação fundamental do
62
algoritmo ESPRIT:
−1
Ou seja, os elementos de
=
(IV.30)
são os autovalores de
autovetores. O problema de estimar
e as colunas de
portanto é o mesmo que estimar
seus autovalores. A estimativa de
são seus
e decompô-la em
a partir da observação de x e de y pode ser realizada
através do método de mínimos quadrados totais [Roy e Kailath, 1989].
Sumariando o algoritmo ESPRIT, podemos escrever:
• Colher os dados e calcular R̂ xx e R̂ yy ;
• A partir dos I maiores autovalores de R̂ xx e R̂ yy , formar Q̂ xs e Q̂ ys ;
• Estimar
através do método de mínimos quadrados totais [Roy e Kailath, 1989];
• Calcular os ângulos de chegada, que são dados por:



 arg(λi ) 
ϕ i = sen −1 

 2π d 
î
λ 
onde λi é o i-ésimo autovalor de
i = 1,
°
,I
(IV.31)
.
IV.4 Algoritmos Paramétricos
Enquanto que nos algoritmos baseados em subespaços as estimações dos parâmetros de
interesse são feitas em seqüência, uma após a outra, nos algoritmos paramétricos eles são
estimados todos simultaneamente. Apesar do alto custo computacional que essa metodologia
requer, os algoritmos paramétricos possuem melhor resolução do que os baseados em
63
subespaços.
Descreveremos aqui somente o algoritmo de Máxima Verossimilhança, que é o mais
mencionado na literatura.
Algoritmo de Máxima Verossimilhança
A metodologia estatística presente no algoritmo de máxima verossimilhança foi
desenvolvida no início do século passado nos trabalhos de Gauss e de Legendre. Sua
aplicação na estimação de parâmetros em sistemas de comunicações tem sido estudada desde
a década de 1960 [Miller e Fuhrmann, 1990]. A idéia é calcular os parâmetros que
maximizam uma função (de verossimilhança) que é a densidade de probabilidade do vetor
observado x. Determinar esses parâmetros significa determinar as direções de chegada para as
quais a probabilidade de que os sinais incidentes produzam o vetor observado x é máxima.
Existem duas estratégias para o algoritmo de acordo com o modelo estatístico dos sinais
incidentes. No algoritmo dito determinístico, s(k) é determinístico mas desconhecido, sendo
portanto um dos parâmetros a serem estimados. Como n(k) é um processo gaussiano branco
de média nula, o vetor x temporalmente é um processo gaussiano branco e possui simetria
circular (suas partes real e imaginária são igualmente distribuídas e possuem simetria na
[
{
]}
[
{
]}
função de correlação cruzada, tal que E Re[x(k )] Im x t (k ) = -E Im[x(k )] Re x t (k ) ). Partindo
desse modelo de sinais, demonstra-se [Krim e Viberg, 1996] que a função de verossimilhança
pode ser representada por
(
)
M
(
L ϕ , s(k ), σ 2 = ∏ πσ 2
k =1
)
N
e
− x ( k ) − As ( k )
2
/σ 2
(IV.32)
Os três parâmetros a serem determinados ( ϕ , s(k ), σ 2 ) são aqueles que maximizam L.
Ao invés de L, adota-se a função -logL, e o problema de otimização é resolvido através da sua
minimização da função de verossimilhança, que, ao desprezar-se o termo independente
64
N log π , torna-se:
(
)
l ϕ , s(k ), σ 2 = N log σ 2 +
1
2
σ M
M
∑ x(k ) − As(k )
2
(IV.33)
k =1
A dedução da solução de (IV.33) encontra-se detalhada em [Wax, 1992] e aqui
apresentaremos somente os resultados. Com respeito a σ 2 e s(k), temos que:
σˆ 2 =
{[
(
1
Tr I − A A h A
N
)
−1
] }
ˆ
Ah R
xx
(IV.34)
e
(
sˆ (k ) = A h A
)
−1
A h x( k )
(IV.35)
A solução para o vetor de direções de chegada é encontrada substituindo-se (IV.34) e
(IV.35) em (IV.33) minimizada, resultando em
{
{[
] }}
−1
ϕˆ = arg mín Tr I − A(A h A ) A h Rˆ xx
ϕ
(IV.36)
IV.5 Discussão
Neste capítulo apresentamos os métodos de estimação de direção de chegada de sinais
mais utilizados. Sua utilidade, no contexto desta tese, é viabilizar a aplicação dos arrays
adaptativos que necessitam da informação de direção de chegada do sinal desejado. No
entanto, exatamente de que maneira esses métodos podem ser utilizados nos arrays em
ambientes de comunicações ainda é um assunto pouco explorado. O maior fator
desencorajador de pesquisas no assunto é a alta complexidade computacional desses métodos.
65
No capítulo seguinte apresentaremos as técnicas de diversidade, que formam o outro
ramo de evolução dos métodos de processamento espacial.
66
ˆŠ‰
±²‘C•E˜³Ž ´:—™ŒŽ–3‘:–7—
Concomitantemente ao desenvolvimento de técnicas para aprimoramento da recepção de
sinais em radares, um outro grupo concentrava esforços no sentido de melhorar a qualidade
dos sinais em transmissões via rádio, deteriorados pelo desvanecimento.
V.1 Desvanecimento
Desvanecimento é uma flutuação do nível do sinal que pode ser modelada como um
ruído multiplicativo [Yacoub, 1993]. Há dois tipos básicos: o desvanecimento lento, também
chamado de sombreamento, e o desvanecimento rápido.
O desvanecimento rápido corresponde às rápidas flutuações do sinal em torno da sua
média. É causado pela multipropagação do sinal devido às várias reflexões e refrações
sofridas pelos espalhadores ao longo do percurso [Paulraj e Papadias, 1997]. Se assumirmos
um número muito grande de espalhadores e que as fases das diversas componentes de
multipercurso chegam ao receptor com distribuição equiprovável no intervalo [0,2π ) , então o
sinal recebido terá distribuição de Rayleigh, dada por
67
 x − x 2 / 2σ 2
x≥0
 e
p( x ) = σ 2
î 0
x<0
(V.1)
onde x é a variável aleatória, µ é sua média e σ o desvio padrão.
O sombreamento provoca flutuações no nível médio do sinal. É causado por grandes
obstáculos, tais como prédios, montanhas e morros e pode provocar a perda completa do sinal,
às vezes por longos períodos de tempo, conforme as dimensões dos obstáculos. O
sombreamento é a média local do sinal em desvanecimento rápido. Experimentalmente
demonstra-se que se um sinal em desvanecimento rápido possui distribuição de Rayleigh, a
média local de sua potência possui distribuição do tipo log-normal [Paulraj e Papadias, 1997],
dada por
( log x − µ )
 1
−
2

e 2σ
p( x ) =  xσ π

î 0
2
x>0
(V.2)
x≤0
O único método efetivo de combate ao sombreamento é evitar a obstrução do sinal, o
que pode ser conseguido com a utilização de técnicas de diversidade espacial “macroscópica”
[Yacoub, 1993], como aquela que provê o posicionamento estratégico de mais de uma estação
base em torno da célula que contém o obstáculo, de tal forma que, a qualquer instante, haja
um caminho livre entre o móvel e uma das estações (fig V.1).
Para o combate ao desvanecimento rápido são utilizadas técnicas de diversidade
“microscópica”, como aquelas que veremos nas seções seguintes.
68
V.2 Diversidade
Antes mesmo do final da década de 1920 já se sabia que o fenômeno de desvanecimento
é um dos maiores responsáveis pela degradação da qualidade dos sinais de rádio [Romano e
Brandão, 1997]. Nessa época já se pensavam em esquemas que utilizavam mais de uma
antena para combinar em fase os sinais na recepção como forma de contornar o problema.
Sabia-se que se essas antenas fossem posicionadas com uma separação mínima entre elas,
cujo valor era obtido empiricamente, os sinais captados eram descorrelacionados ao ponto de
garantir uma pequena probabilidade de ocorrência de desvanecimento em todos eles ao
mesmo tempo. Os experimentos realizados pela Marconi Company em conjunto com a BBC
inglesa no começo dos anos 1930 utilizaram essa técnica, que é uma forma simples de
diversidade, hoje conhecida como combinação com ganhos iguais (equal gain combining).
Diversidade, como definido em [Baghdady, 1961], “é uma técnica que utiliza duas ou
mais cópias do sinal transmitido com vários graus de degradação para atingir, por meio de um
esquema de seleção ou de combinação, um grau de performance de recuperação da mensagem
consistentemente maior que aquele que seria alcançado utilizando-se qualquer uma das cópias
separadamente”.
Os esquemas de diversidade mais utilizados podem ser classificados, de acordo com a
propriedade do sinal a ser explorada, em:
a) diversidade no tempo: transmitem-se cópias do mesmo sinal em tempos diferentes
(ex. os códigos de repetição utilizados em modems). Se o tempo de separação entre duas
cópias consecutivas for bem planejado, há pequena probabilidade de ocorrência de
desvanecimento nas duas ao mesmo tempo;
b) diversidade em freqüência: transmite-se o sinal em mais de uma portadora diferente,
explorando a propriedade de dependência com a freqüência do desvanecimento (ex. os
sistemas que utilizam a técnica de salto em freqüência);
69
Figura V.1 - Diversidade macroscópica
c) diversidade de polarização: as três componentes de polarização do sinal
experimentam diferentes caminhos de propagação, diminuindo a chance de ocorrência de
desvanecimento em todas elas ao mesmo tempo. Na recepção são utilizadas antenas diferentes
para captar separadamente as componentes de polarização;
d) diversidade no espaço: utiliza um array de antenas para recepção de cópias
descorrelacionadas do mesmo sinal. É o método mais clássico.
Nas próximas seções trataremos das técnicas mais usuais para prover diversidade
espacial, da mais simples (diversidade por seleção) à mais sofisticada (diversidade por
combinação ótima) e mostraremos que o caminho percorrido pela evolução dessas técnicas
levou ao seu encontro com a tecnologia de antenas adaptativas desenvolvida pelos
pesquisadores do ramo detecção, quando percebeu-se a aplicabilidade de ambas em sistemas
de comunicações móveis.
70
V.3 Esquemas de Diversidade
Curiosamente, a propriedade dos meios dispersivos de criar cópias descorrelacionadas
de um sinal devido ao multipercurso, a mesma propriedade causadora do desvanecimento, é a
que viabiliza a existência de técnicas de diversidade no espaço.
São basicamente cinco as técnicas de diversidade espacial, divididas em dois grupos:
diversidade por seleção e diversidade por combinação.
Diversidade por Seleção
Na diversidade por seleção somente o sinal de um dos elementos do array de antenas é
utilizado por vez, de acordo com algum critério pré-estabelecido. As duas técnicas
pertencentes a esse grupo são denominadas seleção pura e seleção por limiar.
Na seleção pura o elemento do array escolhido é aquele que possui, a cada instante, o
melhor sinal de acordo com algum critério, que pode ser a relação sinal/ruído ou mesmo a
potência total do sinal. É necessária, para isso, a presença de um sistema que continuamente
monitore os sinais nas saídas dos elementos (Fig. V.2).
Podemos citar como desvantagens desse método a necessidade de um receptor em cada
elemento e a alta taxa de monitoramento. A técnica de seleção por limiar é uma alternativa
que contorna esses problemas. Os sinais dos elementos são monitorados sequencialmente até
que seja encontrado aquele que possui potência, ou relação sinal/ruído, maior do que um certo
limiar. Este elemento então é selecionado até que a potência do sinal não caia para um valor
menor que o limiar, quando o processo de busca reinicia (Fig. V.3). A escolha do valor do
limiar é portanto fator determinante da performance do método.
71
...
...
Seleção
do
Melhor
Sinal
Melhor Sinal
Seletor
Amostragem/
Comparação
Figura V.2 - Seleção pura
...
Seletor
Sinal acima do limiar
Limiar
de Referência
Amostragem/
Comparação
Figura V.3 - Seleção por limiar
72
Diversidade por Combinação
Nesse método o sinal de saída do array é uma combinação linear dos sinais em cada
elemento. Ou seja, se chamarmos de wi o coeficiente complexo e de xi (k ) o sinal de saída do
i-ésimo elemento num instante k qualquer, num array de N elementos, a saída pode ser
descrita como
y( k ) =
N −1
∑ w x (k )
i
i
(V.3)
i =0
São três as técnicas de diversidade por combinação, chamadas de combinação com
ganhos iguais, combinação por razão máxima e combinação ótima.
Na diversidade de combinação com ganhos iguais os sinais dos N elementos são
somados com ganhos iguais para todos. Ou seja wi = cte .
A combinação com ganhos iguais foi a primeira técnica de diversidade espacial a ser
utilizada. Apesar de, à primeira vista, as técnicas de seleção parecerem mais simples, o
chaveamento de sinais em rádio freqüência só foi possível com o advento da tecnologia de
semicondutores, enquanto que na combinação por ganhos iguais as defasagens necessárias dos
sinais podem ser feitas por meio de indutores, já disponíveis na época das primeiras
implementações.
Uma técnica mais apurada para a melhoria de qualidade do sinal corrompido pelo
desvanecimento é a combinação por razão máxima. Nela os sinais de cada elemento têm
peso proporcional à sua própria relação sinal/ruído e podem ser estimados através de
algoritmos adaptativos. Ou seja, os coeficientes de cada elemento são
73
wi = α
Pi ,d
σ i2, n
(V.4)
onde Pi ,d é a potência do sinal desejado e σ i2,n é a potência do ruído no i-ésimo elemento. α
é uma constante de proporcionalidade.
A próxima seção é dedicada à técnica de diversidade por combinação ótima.
V.4 O Vértice do “Y”: Combinação Ótima
Quando a técnica de combinação tem como objetivo a maximização da SINR na saída
do array, ela é chamada de combinação ótima. Podemos dizer que a combinação ótima é o
ponto de encontro entre o ramo de pesquisas em arrays de antenas adaptativas para radares e o
ramo de pesquisas em diversidade de sinais de rádio, pois é realizada por meio dos algoritmos
adaptativos que descrevemos no capítulo III [Winters, 1984].
De acordo com [Vaughan, 1988], em [Bogachev e Kiselev, 1980] publicou-se a primeira
discussão sobre combinação ótima com o intuito de combater o fenômeno do desvanecimento.
Nesse trabalho são apresentadas curvas para probabilidade da SNR em ambientes onde o
desvanecimento possui distribuição do tipo Rayleigh.
Um outro trabalho também de importância histórica e que apresenta resultados
comparativos interessantes
entre as técnicas de combinação por razão máxima e a de
combinação ótima em ambiente de desvanecimento Rayleigh é o que foi publicado por Jack
Winters em [Winters, 1984]. Talvez o primeiro a considerar a aplicação de combinação ótima
em sistemas de comunicações móveis celulares, o trabalho de Winters destaca-se também por
considerar a presença de interferência co-canal na recepção do sinal, além do desvanecimento.
Através dessas considerações, chega-se à conclusão de que a diferença de performance entre a
combinação ótima e a combinação por razão máxima se faz mais perceber quando
74
consideramos a presença de interferentes correlacionados nos elementos do array, situação
que pode ser comum em ambientes de comunicações móveis celulares. Nessa situação há
ganhos de performance em relação à combinação por razão máxima, medidos através das
estatísticas da SINR e da taxa de erro de bits (em inglês, BER – Bit Error Rate), mesmo nas
situações em que o número de interferentes supera o número de elementos do array.
Na próxima seção mostraremos alguns resultados comparativos de performance entre as
técnicas de diversidade espacial apresentadas neste trabalho e verificaremos que a combinação
ótima possui os melhores números, nas condições acima mencionadas. A dedução desses
resultados pode ser encontrada com detalhes em [Brandão, 1995] e em [Winters, 1984].
V.5 Comparação entre os Métodos
Em seu trabalho [Brandão, 1995], André Brandão realiza o cálculo dos ganhos de
potência proporcionados pelos métodos de seleção pura, combinação com ganhos iguais e
combinação por razão máxima. Assumiu-se que o desvanecimento é plano, ou seja, age
igualmente em todas as freqüências, e que segue uma distribuição de Rayleigh. Não foi
considerada a presença de sinais interferentes.
Para a seleção pura, a seguinte SNR média normalizada na saída do array foi obtida:
N
1
i =1 i
SNR sel = ∑
(V.5)
onde N é o número de elementos do array. Verifica-se, a partir dessa equação, que para essa
técnica de seleção existe uma saturação no ganho da SNR obtido com o aumento do número
de antenas, como pode ser observado na Figura V.4. Por exemplo, num array de três antenas
mais de 50% do ganho de SNR total é atingido.
75
35
30
25
20
ganho de SNR (%)
15
10
5
0
2
3
4
5
6
7
8
9
10
Figura V.4 - Ganho na SNR (%) em relação ao número de antenas
na seleção pura
Na combinação com ganhos iguais a SNR média na saída do array é dada por
SNRganhos iguais = 1 +
π
( N − 1)
4
(V.6)
e, na combinação por razão máxima, por
SNRrazao maxima = N
(V.7)
Nos dois casos a SNR média de saída é proporcional ao número de elementos do array.
A partir de (V.5), (V.6) e (V.7), Brandão monta a seguinte tabela comparativa dos
ganhos de SNR obtidos em relação à situação de uma única antena, para cada uma das três
técnicas:
76
núm. de
seleção por limiar
comb. com ganhos
comb. por razão
elementos
(dB)
iguais (dB)
máxima (dB)
2
1,76
2,62
3,01
3
2,63
4,10
4,77
4
3,19
5,26
6,02
6
3,99
6,93
7,78
8
4,34
8,13
9,03
Tabela V.1 - Ganho na SNR (dB) em relação ao número de antenas
em três técnicas de diversidade
A Tabela V.1 confirma a conclusão obtida a partir da análise da Figura V.4 de que a
técnica de seleção pura apresenta resultados satisfatórios apenas quando é pequeno o número
de elementos do array, situação, aliás, em que sua performance é comparável às das outras
técnicas. No entanto, se quisermos maiores ganhos de SNR, devemos partir para outras
técnicas de diversidade com um maior número de elementos.
Combinação por Razão Máxima X Combinação Ótima
Num ambiente onde os interferentes não são correlacionados entre um elemento e outro
do array, a combinação por razão máxima produz a melhor SNR de saída, constituindo-se,
segundo esse critério, na técnica ótima para esse caso [Jakes, 1974]. O ganho de performance
introduzido pela combinação ótima, portanto, dá-se em ambientes onde os interferentes estão
presentes em todos os elementos.
Winters, em seu trabalho [Winters, 1984], faz uma análise da performance de um array
LMS num sistema de comunicações móveis com interferentes comuns a todos os elementos,
onde o desvanecimento, independente entre os elementos do array, segue uma distribuição
Rayleigh. A modulação utilizada é a PSK. Interessante é notarmos que a distância entre
elementos considerada nesse trabalho é muito maior que a distância coerente do array. Ou
77
seja, o autor propõe um esquema de diversidade que utiliza um algoritmo de array adaptativo.
Apresentaremos aqui somente os resultados finais, cujas deduções encontram-se no referido
trabalho.
Para os casos onde existem mais de um interferente, foram feitas simulações da taxa de
erro de bits em função da SINR média de entrada. Definindo-se o ganho de performance como
sendo a diferença, em dB, entre a SINR média de entrada necessária para se alcançar uma
determinada taxa de erro de bits com combinação ótima e a SINR necessária para se atingir a
mesma taxa utilizando-se combinação por razão máxima, verifica-se que há um ganho de
performance praticamente constante (0,6 dB aproximadamente para INR de entrada igual a 3
dB para todos os interferentes) a cada incremento unitário do número de elementos do array.
Há ganho de performance mesmo nos casos em que o número de interferentes é muito maior
que o número de elementos, o que é um resultado surpreendente se considerarmos que,
teoricamente, um array adaptativo de N elementos sem restrição pode anular até N-1
interferentes (ver [Widrow e Stearns, 1985]).
V.6 Esquemas de Diversidade e Arrays
Adaptativos
Os esquemas de diversidade, ao lidarem com sinais descorrelacionados em cada um dos
elementos do array, diferem dos métodos de arrays de antenas voltados para aplicações em
radares (que, por simplicidade, passamos a chamar apenas de arrays adaptativos). Como as
fases dos sinais em cada elemento também são descorrelacionadas entre si, não é possível
estabelecer a priori qualquer tipo de relação geométrica entre os sinais, como foi feito na
Figura II.4 e equacionado em (II.33). Dessa maneira também é impossível num esquema de
diversidade, ao contrário dos métodos de arrays adaptativos, realizar-se o controle sobre o
padrão de irradiação do array, que, inclusive, nesse caso, é uma entidade que não tem sentido.
78
É importante salientar que o processamento puramente espacial realizado por meio de
arrays adaptativos é insensível à dimensão temporal dos sinais, sendo portanto ineficaz para
combater desvanecimentos. No entanto, é eficaz no combate ao ruído de multipercurso, ou
seja, aquele provocado pela somatória das cópias de multipercurso dos sinais, originadas por
espalhadores posicionados ao longo do caminho por eles percorrido. As cópias de
multipercurso chegam ao array segundo direções distintas, o que possibilita a ação dos
algoritmos adaptativos em cancelá-las.
Vemos portanto que são duas formas distintas de antenas “inteligentes”, com origens
distintas, mas que em sistemas de comunicações móveis tiveram um ambiente comum de
aplicação. O maior legado do supracitado trabalho de Winters, para nós que procuramos
estabelecer relações de semelhança na aplicação das técnicas desenvolvidas pelos dois ramos
de pesquisas tratados neste texto, é ter mostrado que para implementar um esquema de
diversidade do tipo combinação ótima pode-se utilizar um array adaptativo do tipo LMS, o
mesmo apresentado no capítulo III, entre outras “várias técnicas de arrays adaptativos que
podem ser utilizadas em rádio móvel” [Winters, 1984, pág. 536]. O array de antenas assim
idealizado aproveitaria as vantagens dos dois esquemas, ou seja, estaria apto a combater
desvanecimentos do sinal ao mesmo tempo em que realizaria o cancelamento de interferentes.
Dessa forma, esse trabalho nos auxilia a termos uma visão unificada dos dois ramos de
pesquisas e por isso consideramos que ele se encontra no ponto de encontro dos dois, no
vértice do nosso “Y”.
79
ˆŠ‡0‰
µ¶¶·¸¹–7—7ºF¡3—¡3‘Œ—
›
•7’»¡7Žš¼‘“½7—Œ¾À¿3´:—ŽšŒ
Com o aumento vertiginoso da demanda por telefones móveis que vem ocorrendo
ultimamente torna-se necessário o desenvolvimento de novas tecnologias que permitam a
expansão da capacidade dos atuais sistemas, principalmente nos grandes centros urbanos,
onde o problema é mais crítico. Além disso, há a necessidade de melhoria na qualidade dos
sinais recebidos. Na qualidade e principalmente na confiabilidade destes, ou seja, na
probabilidade de que os sinais desejados possuam qualidade aceitável durante a maior parte
do tempo.
É
basicamente
para
esses
dois
problemas
(capacidade
dos
sistemas
e
qualidade/confiabilidade dos sinais) que os arrays de antenas têm sido vistos como
promissoras soluções. Outras técnicas têm sido utilizadas, como as microcélulas, que
proporcionam aumento na concentração de usuários pela diminuição do tamanho das células,
ou a setorização, que é a divisão da célula em setores que utilizam o mesmo conjunto de
freqüências [Yacoub, 1993]. Mas o emprego de arrays de antenas abre um horizonte de
possibilidades muito mais amplo para o uso eficiente do espectro de rádio por viabilizar a
implementação de conceitos como a alocação dinâmica de células. Além disso, os arrays de
antenas não trazem as desvantagens operacionais que técnicas como as de microcélulas
trazem, como o aumento da complexidade do hand-off, o aumento do número de ERBs
(Estações Rádio-Base) requeridas e a sofisticação do planejamento das posições destas nas
células.
80
Historicamente podemos citar como pioneiros os trabalhos de Bogachev e Kiselev
[Bogachev e Kiselev, 1980], que consideraram a aplicação de arrays de antenas para
eliminação do ruído de multipercurso, o já citado trabalho de Winters [Winters, 1984], onde
há uma análise comparativa de performance entre as técnicas de antenas adaptativas com sinal
piloto e de combinação por razão máxima na redução do desvanecimento, quando considerase a existência de interferentes, e o trabalho de Vaughan [Vaughan, 1988], onde há uma
análise (rara, aliás) da utilização de antenas adaptativas dentro das unidades móveis.
Este capítulo tem o propósito de apresentar uma visão geral de como as técnicas de
arrays de antenas têm sido pesquisadas para uso em ambientes de comunicações móveis, na
solução de dois problemas básicos: redução da interferência co-canal, com conseqüente
aumento de capacidade dos sistemas e combate ao ruído de multipercurso. O capítulo inicia
com alguns resultados significativos sobre diminuição de interferência co-canal publicados na
literatura especializada. Em seqüência serão apresentados nossos resultados de simulações das
performances de alguns dos principais algoritmos de arrays adaptativos que estão descritos ao
longo desta tese, vale dizer, o LMS, o algoritmo de Applebaum, o algoritmo de Frost, o
algoritmo de Resende e o algoritmo cego CMA, para combater interferência co-canal e ruído
de multipercurso.
VI.1 Redução de Interferência Co-canal
A propriedade de filtragem espacial dos arrays de antenas pode ser utilizada para
reduzir o nível de interferência co-canal (ICC) e, conseqüentemente, aumentar o número de
usuários que simultaneamente comunicam-se dentro de uma mesma célula. Idealmente
podemos pensar que esse objetivo pode ser alcançado utilizando-se um array instalado numa
ERB que possua habilidade de posicionar, tanto para recepção quanto para transmissão de
sinais, um lóbulo estreito na direção de cada usuário móvel ativo (Fig. VI.1) e persegui-lo ao
longo do tempo com esse lóbulo de acordo com seu movimento na célula. Nesse esquema o
81
acesso de cada móvel ao sistema de comunicações dá-se de acordo com sua posição azimutal
na célula,
Figura VI.1 - ERB utilizando um array de antenas que posiciona um lóbulo para cada usuário
tendo sido por isso chamado de SDMA (de Space Division Multiple Access, ou acesso
múltiplo por divisão espacial).
Como primeira aproximação para o ganho de capacidade proporcionado pelo uso de
arrays de antenas, podemos inferir que, se um array com N elementos sem restrição pode
anular até N-1 interferentes (ver capítulo III), então pode-se aumentar em até N-1 vezes o
número de usuários numa célula para que a performance de quando do uso de uma única
antena omnidirecional ainda se mantenha.
Se quisermos refinar o cálculo do ganho de capacidade devemos utilizar alguma das
métricas existentes para avaliação de performance. Uma delas, que em inglês chama-se outage
probability, é a probabilidade do sinal desejado encontrar-se abaixo de um limite mínimo préestabelecido devido à interferência provocada por um co-canal. Ou seja, é a probabilidade de
se estar na condição de interferência e, por esse motivo, iremos chamá-la de probabilidade de
interferência. Esse limite pode ser expresso por uma comparação entre os envelopes do sinal
desejado e do interferente.
82
Consideraremos por ora, à maneira do que é feito em [Swales et. al., 1990], somente o
canal celular direto e uma única célula co-canal (Fig.VI.2), de maneira que o receptor em
questão é o do móvel, o sinal desejado é proveniente da ERB da célula desejada e o sinal
interferente, da ERB da célula co-canal. Apesar de estarmos considerando apenas o canal
direto, assumimos que os mesmos lóbulos calculados e posicionados na recepção são
utilizados na transmissão dos sinais.
Nessas condições há interferência quando o envelope do sinal desejado, medido no
móvel receptor, é menor que o envelope do sinal interferente, ponderado por uma margem de
proteção, ou seja
v d ≤ αvi
(VI.1)
onde v d é o envelope do sinal desejado e vi é o envelope do interferente. α é a margem de
proteção, cujo valor depende da modulação utilizada. Testes subjetivos têm mostrado que, por
exemplo, para uma transmissão em FM de 25 kHz em ambiente móvel celular urbano,
α =18dB permite boa qualidade de voz [Swales et al., 1990].
Se considerarmos somente as perdas devido ao percurso de propagação, podemos
considerar que a média na área de recepção da potência de um sinal é inversamente
proporcional à distância da ERB ao móvel, elevada a uma potência que, comumente, é
adotada como sendo quatro [Yacoub, 1993]. Portanto, se considerarmos que as ERBs
transmitem com a mesma potência e que as constantes de propagação do meio são iguais para
ambos os percursos dos sinais desejado e interferente, os envelopes, em Volts, do sinal
desejado e do sinal interferente no móvel poderão ser expressos, respectivamente, por
vd =
k
d d2
(VI.2)
vi =
k
d i2
(VI.3)
e
83
ERB
co-canal
di
dd
ERB
desejada
Figura VI.2 - Sistema com uma única célula co-canal
onde d d e d i são as distâncias das ERBs desejada e interferente ao móvel e k é uma constante
de proporcionalidade. Substituindo (VI.2) e (VI.3) em (VI.1) obtemos o lugar geométrico dos
pontos onde existe interferência:
di ≤ α dd
(VI.4)
A Figura VI.3 representa as duas regiões definidas por (VI.4).
Para calcularmos a probabilidade de interferência, consideramos que o tráfego oferecido
é de a Erlangs e que a probabilidade de bloqueio em cada célula é B. Com isso, o tráfego
escoado ou o número de canais ativos por célula é a (1 − B ) . Define-se como fator de carga do
sistema ou eficiência de uso de canal a razão entre o número de canais ativos e o número total
de canais disponíveis por célula, ou seja
84
ERB
co-canal
di
Região de
interferência
dd
Região de não
interferência
di = α d d
ERB desejada
Figura VI.3 - Regiões de interferência para o caso de
uma célula co-canal, sem desvanecimento
ξ=
a (1 − B)
C
(VI.5)
onde C é o número total de canais em cada célula. Supondo-se que o móvel esteja localizado
na região de interferência e que a ele já esteja alocado um determinado canal, a probabilidade
de interferência será a probabilidade de que a ERB da célula co-canal esteja utilizando um
outro canal alocado na mesma freqüência. Portanto, para o caso em que se utiliza uma única
antena omnidirecional na ERB e existe somente uma célula co-canal, a probabilidade de
interferência será
Promni {vd ≤ αvi } =
# de canais ativos Cξ
=
=ξ
# total de canais
C
(VI.6)
Para calcularmos a probabilidade de interferência quando do uso de um array formador
de feixes, consideramos que a distribuição de usuários na célula é uniforme e que toda ERB,
posicionada no centro da célula, é capaz de gerar n feixes que podem ser apontados para
qualquer um dos móveis da célula, resultando numa relação de número de canais por feixe
85
igual a Cξ / n . Considerando que o móvel esteja na região de interferência e que ele é coberto
por ao menos um feixe proveniente da ERB co-canal, a probabilidade de interferência será a
probabilidade de que um dos canais desse feixe seja o mesmo canal já alocado para o móvel
pela célula à qual pertence, que, considerando distribuição equiprovável de canais por feixe,
será
Prarray {vd ≤ αvi } =
# de canais ativos por feixe Cξ / n ξ
=
=
# total de canais
C
n
(VI.7)
Ou seja, a probabilidade de interferência, se comparada à situação em que se utiliza
apenas uma antena omnidirecional, é n vezes menor, o que é coerente com a primeira
aproximação que fizemos. Além disso, vemos que a probabilidade de interferência é tanto
menor quanto menor for o fator de carga, o que é previsível se lembrarmos que o fator de
carga representa a porcentagem de canais que estão ativos na célula. Se esse número é grande,
também o é a chance de termos um interferente co-canal.
Porém a análise realizada acima é simplista na medida em que considera a existência de
apenas uma célula co-canal e despreza a ação do desvanecimento. Em [Swales et. al., 1990]
há uma análise mais completa, considerando a ação do desvanecimento e a existência de seis
células co-canal ativas (que estejam utilizando ao menos um canal de mesma freqüência que o
canal utilizado pelo móvel desejado) ao redor da célula desejada, representando uma
configuração típica de cluster de sete células (Fig. VI.4). Nesse caso, a probabilidade de
interferência será a probabilidade do sinal desejado, em desvanecimento, encontrar-se abaixo
do sinal interferente (Equação (VI.1)) e de existir seis células co-canal ativas. Ou seja,
Pr{vd ≤ αvi } =
∑ Pr{v
6
u =1
d
≤ αvi u} ⋅ Pr{ u}
(VI.8)
Pr{ vd ≤ αvi u} é a probabilidade de interferência do sinal desejado em desvanecimento,
dado que existem u células co-canal ativas. Ela é dada por uma longa expressão, constante em
[Swales et. al., 1990], que depende da relação SIR na entrada do array. Pr{u} é a
probabilidade de haver u células co-canal ativas que, se os canais são independentes e
86
igualmente distribuídos, é uma distribuição binomial dada por
 6 u
6− u
Pr{ u} =   pomni
1 − pomni )
(
 u
(VI.9)
onde pomni é a probabilidade de haver uma única célula co-canal ativa:
pomni =
# de canais ativos a (1 − B )
=
=ξ
# total de canais
C
(VI.10)
onde ξ é o fator de carga, definido em (VI.5). Substituindo (VI.10) em (VI.9) e o resultado
em (VI.8), encontramos a probabilidade de interferência para o caso de seis células co-canal
na presença de desvanecimento utilizando uma única antena omnidirecional na ERB:
Pr{ vd ≤ αvi } =
6
∑ Pr{ v
d
u =1
 6
6−u
≤ αvi u} ⋅   ξ u (1 − ξ )
 u
(VI.11)
Com o uso de um array formador de feixes, a probabilidade de haver uma célula cocanal ativa, dado que, a cada instante, existem n feixes formados em cada célula, é a
probabilidade de que o co-canal interferente esteja no feixe que está sendo apontado para o
móvel desejado, ou seja,
padap =
# de canais ativos por feixe a(1 − B) / n ξ
=
=
# total de canais
C
n
(VI.12)
Se substituirmos (VI.12) em (VI.9) e o resultado em (VI.8), encontramos a
probabilidade de interferência para o caso de antenas adaptativas, que é
 6  ξ   ξ 
Pr{ vd ≤ αvi ; n} = ∑ Pr{ vd ≤ αvi u} ⋅      1 − 
 u  n   n 
u =1
6
u
6−u
(VI.13)
Utilizando (VI.13) pode-se demonstrar [Swales et. al., 1990] que a SIR de entrada (ou
87
seja, 20log( vd / αvi ) ) num array capaz de gerar dois feixes (n = 2), se quisermos manter a
probabilidade de interferência em 10-2, é cerca de 5 dB menor do que se utilizássemos uma
antena omnidirecional (n = 1) e cerca de 9 dB menor se o array for capaz de gerar 4 feixes (n
= 4). De outro modo, se fixarmos a SIR de entrada em 20 dB, a probabilidade de interferência,
que para o caso de antena omnidirecional é de 0,3, para um array capaz de formar 4 feixes
passa a ser de 0,05, ou seja, uma ordem de grandeza menor. Em ambos os casos o fator de
carga é 0,7.
Figura VI.4 - Cluster de sete células. Há seis células co-canal ao redor da célula desejada.
Redução de ICC em sistemas GSM
Uma outra métrica, geralmente utilizada para medir a performance dos arrays de
antenas em sistemas específicos, definidos por normas técnicas, é a taxa de bits errados
(BER). Em [Wells, 1996] foi proposto um esquema para utilização de um array adaptativo no
sistema GSM, cuja performance é avaliada medindo-se a BER de saída. O esquema pode ser
resumido pelo procedimento abaixo (a Figura IV.5 esquematiza um sistema que permite sua
realização):
(a) Calcula-se um vetor de coeficientes inicial utilizando-se somente a fração do
quadro de bits GSM relativa à seqüência de treinamento;
88
(b) Utiliza-se esse vetor para obter a saída do array para o quadro inteiro;
(c) Um equalizador de Viterbi é utilizado para detectar os símbolos a partir da saída
calculada no item anterior;
(d) A seqüência estimada é então utilizada como novo sinal de referência e um novo
vetor de coeficientes é calculado;
(e) Volta ao item (c) até convergir.
Não há considerações a respeito do algoritmo adaptativo a ser utilizado para os cálculos
dos coeficientes, apenas considera-se que a solução ótima de Wiener é alcançada. O esquema
é semelhante ao algoritmo clássico de decisão direta [Haykin, 1996], exceto pelo cálculo
inicial do vetor de coeficientes e pelo fato dos novos vetores serem calculados a partir da
informação contida em todo o quadro, e não símbolo a símbolo.
Simulações realizadas com o esquema proposto consideraram a presença de quatro
interferentes co-canal em células vizinhas com a mesma potência do sinal desejado e
utilizaram um modelo de propagação denominado TU-50 (modela um ambiente tipicamente
urbano, estando o móvel à velocidade de 50km/h) [Failli, 1989]. Através de gráficos de BER
x E b / N 0 para um array de oito antenas, constatou-se que o esquema proposto possui
performance somente de 3 a 4 dB inferior a um sistema em que fosse possível conhecer
antecipadamente o conteúdo de todo o quadro de símbolos, situação que pode ser vista como
ideal, e 3 dB superior ao esquema clássico que utiliza somente a seqüência de treinamento,
sem fazer uso do equalizador de Viterbi.
w1
w2
Σ
...
wN
equalizador de
Viterbi
controle das
iterações
cálculo do vetor de
coeficientes
seqüência de
treinamento
Figura VI.5 - Array de antenas para GSM
89
Redução de ICC em sistemas CDMA
Partiremos do resultado obtido em [Pursley, 1977], que conclui uma expressão
aproximada para o cálculo da BER em um canal reverso CDMA assíncrono com adição de
ruído gaussiano branco, operando com controle de potência perfeito, sem interferência de
móveis em células adjacentes, utilizando uma antena omnidirecional na recepção. O número
de usuários por célula é consideravelmente grande de forma que a somatória de seus sinais
toma a forma de um ruído gaussiano branco. Dessa maneira, a BER é calculada como
 3S 

BER omni ≈ Q
 I − 1
(VI.14)
onde S é o ganho de processamento, I é o número de sinais incidentes na ERB e Q(X) é a
probabilidade de x > X quando x é uma variável aleatória gaussiana de média nula e variância
unitária.
Para avaliarmos o efeito provocado pela introdução de arrays de antenas em sistemas
CDMA consideraremos um array de N elementos capaz de posicionar, através da
conformação do seu padrão de irradiação H (ϕ ) , um lóbulo principal na direção do sinal
desejado, sem preocupação com que técnica utilizar para atingir esse objetivo. Se assumirmos
que existem I sinais incidentes, sendo que um deles é o desejado, e que a potência de chegada
na estação base de cada um deles é Pm , a potência total dos interferentes na saída do array
será dada por
 I −1

Pi = Pm ⋅ E ∑ H (ϕ j ) 
 j =1

(VI.15)
onde ϕ j é a direção de chegada do j-ésimo sinal interferente.
90
Assumindo que os móveis estão distribuídos de maneira uniforme e independente na
célula, podemos reescrever (VI.15) como [Liberti e Rappaport, 1994]
2π
I −1
Pi = Pm
H (ϕ ) dϕ
2π ∫0
(VI.16)
Define-se diretividade de uma antena, ou de um array de antenas, como [Krauss, 1950]
D=
2π
(VI.17)
2π
∫ H (ϕ )dϕ
0
Substituindo (VI.17) em (VI.16) temos a expressão para a potência dos interferentes na
saída do array:
Pi = Pm
I −1
D
(VI.18)
Em [Liberti e Rappaport, 1994] assume-se que M interferentes, cada um com potência
P/M, provocam o mesmo efeito na BER média de saída que um único interferente com
potência P. Assim, a expressão (VI.14) é aproximada para
(
BER ≈ Q
3S ⋅ SIR
)
(VI.19)
onde SIR é a relação sinal/interferentes de saída.
Utilizando (VI.18) e considerando que a potência do sinal desejado é Pm na saída do
array, temos que:
SIR =
Pm
=
Pi
Pm
D
=
I −1 I −1
Pm
D
(VI.20)
91
Substituindo (VI.20) em (VI.19) encontramos a expressão final para a BER quando
utilizamos um array de antenas:
 3DS 

BER array ≈ Q
 I − 1
(VI.21)
Para ilustrar a diferença causada na BER média pela introdução de um array de antenas,
imaginemos um sistema CDMA com fator de espalhamento espectral (ganho de
processamento) S = 256, e que no array incidem I = 200 sinais. Calculando a BER para o caso
de antena omnidirecional (Eq. VI.14), teremos BER omni = 2,5 ⋅ 10 −2 . Se considerarmos agora
um array de antenas com um lóbulo secundário 75% menor que o principal e com largura do
Á
lóbulo principal de 60 , sua diretividade será de cerca de 2,67 [Liberti e Rappaport, 1994],
resultando, portanto, numa BER array = 8,2 ⋅ 10−4 (Eq. VI.21), ou seja, numa redução de duas
ordens de grandeza.
Enxergando essa diferença de um outro modo, podemos calcular o número de sinais
incidentes para o qual, utilizando-se o array de antenas com o padrão especificado acima,
obtemos a mesma BER de quando usamos uma antena omnidirecional. O resultado é que, se
para o caso omnidirecional o número de sinais incidentes para o qual BER omni = 2,5 ⋅ 10 −2 é
I omni = 200 , utilizando o array com o padrão especificado acima obtemos a mesma BER
média com um número 2,56 vezes maior de incidentes, ou seja I adap = 512 . Se assumirmos
que para ambos os casos, com antena omnidirecional e com array de antenas, o número de
espalhadores de multipercurso nas células permaneceu constante, o ganho de capacidade do
sistema também é de 2,56.
A análise acima desconsidera o efeito causado por interferentes localizados em células
adjacentes. Em [Liberti e Rappaport, 1994] há a dedução da expressão da BER média na saída
do array quando existem oito células co-canal em torno da célula central, cada uma contendo
I sinais incidentes com distribuição uniforme. Assume-se também perfeito controle de
potência e perda de percurso exponencial do sinal, com expoente igual a quatro. Nessas
condições, a BER média tem expressão:
92

3DS 

BER adap,8 ≈ Q
 I (1 + 8α ) 
(VI.22)
onde α é uma constante que depende do expoente n da perda de percurso. Tipicamente, para
n = 4, α = 0,05513 [Liberti e Rappaport, 1994].
Repetindo os cálculos já realizados para o caso em que se desconsideram as
interferências de células vizinhas, para S = 256, I = 200 e D = 2,67, teremos
BER array = 4,4 ⋅ 10−3 . E se o número de sinais incidentes para o qual BER omni = 2,5 ⋅ 10 −2 é
I omni = 200 , utilizando-se o array especificado, a capacidade aumenta para I adap = 355, ou
seja, um ganho de 1,775. Esses resultados encontram-se sumariados na Tabela VI.1.
omnidirecional
BER @ I = 200
I @ BER = 2,5 ⋅ 10 −2
array sem células
array com oito células
interferentes (D = 2,67)
interferentes (D = 2,67)
2,5 ⋅ 10 −2
8,2 ⋅ 10 −4
4,4 ⋅ 10 −3
200
512
355
Tabela VI.1 - Aumento de performance de um sistema CDMA com array de antenas (S = 256)
VI.2 Resultados de Simulações
Para avaliarmos os desempenhos dos arrays adaptativos no cancelamento de
interferentes co-canal e redução do ruído de multipercurso, desenvolvemos um ambiente de
simulação seguindo o mesmo modelo de propagação em multipercurso adotado em [KloucheDjedid e Fujita, 1996]. Segundo o modelo, cada móvel é circundado por um anel de
espalhadores igualmente espaçados, fazendo com que o array receba, para cada móvel, um
sinal de linha de visada e suas cópias de multipercurso espalhadas dentro de um ângulo ϕ esp
93
(Figura VI.6). O número de espalhadores determina o número de cópias de multipercurso. A
direção de chegada da k-ésima cópia do i-ésimo sinal incidente no array pode ser calculada
pela relação
1
 2π 
ϕ i , k = ϕ i + ϕ esp sen 
 k 
2
(VI.23)
ϕesp
ϕi
...
1
N
Figura VI.6 - Modelo de multipercurso
A modulação que utilizamos é a 4-PSK, sendo que os símbolos transmitidos pertencem
ao alfabeto
{
2 e jπ / 4
2e j 3π / 4
2e j 5π / 4
}
2e j 7π / 4 . As cópias de multipercurso sofrem
atrasos temporais de números inteiros de intervalos de símbolo, equiprovavelmente
distribuídos entre 0 e 10 intervalos de símbolo.
Nas nossas simulações o canal não provoca nenhuma alteração nos envelopes dos sinais,
que não sofrem, portanto, desvanecimento. Todas as cópias de multipercurso possuem a
mesma potência do sinal de linha de visada ao qual estão associadas. Para o algoritmo CMA,
a potência dos raios de multipercurso associados ao sinal desejado sofrem uma redução de
amplitude pela metade, para que se evitasse que o algoritmo convergisse para uma delas, já
que é o único que não possui sinal de referência e nem informação de direção de chegada do
sinal desejado.
94
O sistema desenvolvido permite facilidade para alteração dos seguintes parâmetros:
•
número de elementos do array;
•
algoritmo a ser executado;
•
número de iterações;
•
número de interferentes;
•
número de raios de multipercurso para cada sinal incidente;
•
ângulo ϕ esp de espalhamento de multipercurso;
•
potência de cada interferente;
•
direção de chegada (DOA) de cada interferente;
•
direção de chegada (DOA) do sinal desejado;
•
relação SNR de entrada;
•
distância entre os elementos do array.
Nosso estudo comparativo baseou-se na análise das seguintes medidas:
•
Módulo do erro: o erro é a diferença entre o sinal desejado na entrada do array e o
sinal de saída. Sua evolução ao longo das iterações nos permite avaliar a velocidade
de convergência do array e o valor de regime do erro (após a convergência do
algoritmo) permite avaliar o grau de imunidade ao ruído e de cancelamento de
interferentes;
•
Constelação de saída & constelação de entrada: a comparação entre a constelação na
entrada do array (corrompida pelos interferentes, raios de multipercurso, atraso de
multipercurso e ruído) e a constelação de saída permite avaliar a performance dos
algoritmos em termos de número de símbolos errados;
•
ganho de SINR: compararemos também a relação
Pot { sinal}
Pot{ ruido} + Pot { interferentes}
(SINR) de entrada com a SINR de saída, calculando o ganho de SINR. Esta medida
nos permite avaliar o grau de imunidade a ruído e de cancelamento de interferentes
95
do algoritmo.
•
Porcentagem de símbolos errados: apesar de ter sido calculada para um número
muito pequeno de ensaios e de iterações por ensaio para ser considerada uma medida
da taxa de erro de símbolos de cada algoritmo, ela nos ajuda a avaliar o desempenho
dos algoritmos especificamente nas situações simuladas.
•
Padrão de irradiação: o padrão de irradiação é o análogo espacial do espectro
freqüencial de um filtro temporal. Ele nos dá idéia da capacidade do array em
cancelar interferentes e privilegiar o sinal desejado.
Os resultados, a menos da constelação de saída, são obtidos através da média aritmética
de oito ensaios, cada um com o número de iterações especificado. A constelação apresentada
representa o melhor ensaio, dentre os oito, em termos de número de símbolos errados.
Primeira Simulação
Na nossa primeira simulação definimos os seguintes parâmetros:
DOA do sinal desejado -90°
SIR 10 dB
número de interferentes 1
DOA do interferente 30°
número de raios de multipercurso 2
ângulo de espalhamento ϕ esp
50°
SNR de entrada 25 dB
número de iterações 7000
número de elementos 15
distância entre os elementos 0,5 λ
96
Na Figura VI.7 encontram-se os gráficos de evolução do erro ao longo das iterações de
cada um dos cinco algoritmos avaliados.
A Figura VI.8 mostra a constelação de entrada (em verde, ou cinza claro em cópias
preto & branco) e a constelação de saída (em azul, ou cinza escuro em cópias preto & branco)
do array num mesmo gráfico. Os círculos vermelhos representam os pontos da constelação 4PSK utilizada.
A Figura VI.9 mostra os padrões de irradiação dos cinco algoritmos testados.
O ganho de SINR (SINR de saída - SINR de entrada) e a porcentagem média de
símbolos errados foram:
algoritmo
ganho de
% de símbolos
SINR (dB)
errados
LMS
43,4
0
Applebaum
12,0
7,4
CMA
37,8
0
Frost
9,1
41,5
CFLS
18,5
11,0
O fator de passo ( µ ) para os algoritmos LMS e Applebaum foi de 5 ⋅ 10 −3 , para o
algoritmo CMA, 5 ⋅ 10 −4 , e para o algoritmo de Frost, 5 ⋅ 10 −6 . Para o algoritmo CFLS, o fator
de esquecimento foi ϕ = 1 e a energia inicial do erro de predição, necessária para o cálculo do
valor inicial da matriz de autocorrelação do sinal de entrada, foi E 0 = 0,1 .
97
Erro
Erro
1.5
1
1
ampl.do erro
módulo do erro
1.5
0.5
0.5
0
0
0
1000
2000
3000
4000
iterações
5000
6000
7000
0
1000
2000
3000
4000
iterações
(a)
5000
6000
7000
6000
7000
(b)
Erro
Erro
1.5
1.5
1
módulo do erro
módulo do erro
1
0.5
0
1000
2000
3000
4000
iterações
5000
6000
0
7000
0
1000
2000
3000
4000
iterações
(c)
5000
(d)
Erro
1.5
1
módulo do erro
0
0.5
0.5
0
0
1000
2000
3000
4000
iterações
5000
6000
7000
(e)
Figura VI.7 - Módulo do erro. (a) LMS; (b) Applebaum; (c) CMA; (d) Frost; (e) CFLS
98
(a)
(b)
(c)
(d)
(e)
Figura VI.8 - Constelações de saída. (a) LMS; (b) Applebaum; (c) CMA; (d) Frost; (e) CFLS
99
90
90
1.0552
60
120
0.59226
120
60
0.84415
0.47381
0.63311
0.35535
150
30
150
30
0.42207
0.2369
0.21104
0.11845
180
0
210
180
330
240
0
210
300
330
240
300
270
270
(a)
90
(b)
90
0.73036
120
1.0352
120
60
60
0.82812
0.48691
0.62109
150
150
30
30
0.41406
0.24345
0.20703
180
180
0
210
0
210
330
240
300
240
330
300
270
270
(c)
(d)
90
1.0289
120
60
0.82314
0.61735
150
30
0.41157
0.20578
180
0
210
330
240
300
270
(e)
Figura VI.9 - Padrões de irradiação. (a) LMS; (b) Applebaum; (c) CMA; (d) Frost; (e) CFLS
100
Segunda Simulação
O ambiente simulado aqui é mais árduo que o da primeira simulação. O ângulo de
espalhamento de multipercurso ϕ esp foi reduzido de 50° para 20°. Também a potência do
interferente foi elevada de -10 dB para -3 dB e o número de elementos, reduzido de 15 para
12. Os parâmetros de simulação são, então:
DOA do sinal desejado -90°
SIR 3 dB
número de interferentes 1
DOA do interferente 30°
número de raios de multipercurso 2
ângulo de espalhamento ϕ esp
20°
SNR de entrada 25 dB
número de iterações 7000
número de elementos 12
distância entre os elementos 0,5 λ
Na Figura VI.10 encontram-se os gráficos de evolução do erro ao longo das iterações de
cada um dos cinco algoritmos avaliados.
A Figura VI.11 mostra a constelação de entrada (em verde, ou cinza claro em cópias
preto & branco) e a constelação de saída (em azul, ou cinza escuro em cópias preto & branco)
do array num mesmo gráfico. Os círculos vermelhos representam os pontos da constelação 4PSK utilizada.
A Figura VI.12 mostra os padrões de irradiação dos cinco algoritmos testados.
O ganho de SINR e o número de símbolos errados médio foram:
101
algoritmo
ganho de
% de símbolos
SINR (dB)
errados
LMS
30,3
0
Applebaum
15,0
4,8
CMA
14,5
2,3
Frost
7,7
40,8
CFLS
21,0
10,1
O fator de passo ( µ ) para os algoritmos LMS e Applebaum foi de 5 ⋅ 10 −3 , para o
algoritmo CMA, 5 ⋅ 10 −4 , e para o algoritmo de Frost, 5 ⋅ 10 −6 . Para o algoritmo CFLS, o fator
de esquecimento foi ϕ = 1 e a energia inicial do erro de predição, necessária para o cálculo do
valor inicial da matriz de autocorrelação do sinal de entrada, foi E 0 = 0,1 .
102
Erro
4
3.5
3.5
3
3
2.5
2.5
módulo do erro
módulo do erro
Erro
4
2
1.5
2
1.5
1
1
0.5
0.5
0
0
1000
2000
3000
4000
iterações
5000
6000
0
7000
0
1000
2000
3000
4000
iterações
(a)
6000
7000
(b)
Erro
Erro
4
3.5
3.5
3
3
2.5
2.5
módulo do erro
4
2
1.5
2
1.5
1
1
0.5
0.5
0
0
0
1000
2000
3000
4000
iterações
5000
6000
7000
0
1000
2000
3000
4000
iterações
(c)
5000
6000
7000
(d)
Erro
4
3.5
3
módulo do erro
módulo do erro
5000
2.5
2
1.5
1
0.5
0
0
1000
2000
3000
4000
iterações
5000
6000
7000
(e)
Figura VI.10 - Módulo do erro. (a) LMS; (b) Applebaum; (c) CMA; (d) Frost; (e) CFLS
103
(a)
(b)
(c)
(d)
(e)
Figura VI.11 - Constelações de saída. (a) LMS; (b) Applebaum; (c) CMA; (d) Frost; (e) CFLS
104
90
90
4.6606
60
120
2.9023
120
60
2.3218
3.4955
1.7414
2.3303
150
30
150
30
1.1609
1.1652
0.58045
180
0
210
180
330
240
0
210
300
330
240
300
270
270
(a)
90
(b)
90
0.87435
120
60
1.1131
120
60
0.89051
0.65576
0.66788
0.43717
150
30
150
30
0.44525
0.21859
0.22263
180
0
210
180
330
0
210
300
240
330
240
300
270
270
(c)
(d)
90
5.4773
120
60
4.3818
3.2864
150
30
2.1909
1.0955
180
0
210
330
240
300
270
(e)
Figura VI.12 - Padrões de irradiação. (a) LMS; (b) Applebaum; (c) CMA; (d) Frost; (e) CFLS
105
Discussão
Dos algoritmos analisados o LMS foi o que manteve a melhor performance em todos os
quesitos avaliados, nas duas simulações. No entanto o LMS treinado constantemente por uma
réplica do sinal desejado, como foi feito, não deve ser avaliado como um algoritmo passível
de implementação. Sua presença nas simulações portanto possui finalidade apenas de
comparação da performance dos outros algoritmos com a performance de um algoritmo
atuando em situação extremamente favorável.
Mesmo assim nota-se que a performance do CMA na primeira simulação é muito
próxima da performance do LMS, apesar de termos que descontar a diferença na SINR de
entrada para os dois sinais: enquanto que para o LMS a SINR de entrada foi -9,5 dB, para o
CMA foi de -6,0 dB.
Como não há nenhum compromisso, na formulação do array de Applebaum, de garantir
um determinado ganho na direção do sinal desejado, percebemos que a constelação de saída
possui potência diferente da constelação de entrada, o que não acontece com o LMS, que atua
no sentido de recuperar o sinal desejado na saída, com o CMA, que tenta recuperar o módulo
da constelação transmitida, com o array de Frost, que imprime ganho unitário na direção do
sinal desejado ou com o array de Resende, que também possui essa mesma restrição.
É interessante notar também que o array de Applebaum manteve uma certa constância
de performance nas duas simulações, fato também observado no array de Resende, com
índices de SINR de saída melhores. Na comparação dos dois algoritmos com restrição
notamos uma clara superioridade do array de Resende sobre o array de Frost, em todos os
quesitos. O array de Frost, inclusive, não conseguiu convergir em nenhuma das duas
simulações.
O último capítulo desta tese é dedicado às conclusões do trabalho e perspectivas para
trabalhos futuros, que poderão inclusive conter uma ampliação da análise dos algoritmos
realizadas aqui.
106
ˆŠ‡0‡0‰
›
•7¡7ÂÃAÄ:ŒÅ7—Œ
A análise discriminatória que realizamos, separando o ramo detecção do ramo
diversidade, não foi encontrada por nós na literatura prévia. Julgamo-la importante pois com
ela estabelecemos com clareza as distinções e as fronteiras existentes entre os arrays
adaptativos e os esquemas de diversidade.
Os arrays adaptativos, apesar de eficientes na detecção de sinais desejados e
cancelamento de interferentes, não são viáveis para combate ao desvanecimento, já que os
sinais em seus elementos possuem alta correlação, o que permite que se deduzam relações
determinísticas entre a fase de um sinal num determinado elemento e a fase desse mesmo sinal
num outro elemento qualquer. Já os esquemas de diversidade são eficientes no combate ao
desvanecimento por imporem um afastamento entre seus elementos muito maior que a
distância coerente do array.
Interessante é observarmos que até recentemente as evoluções dos dois ramos eram
estancadas, não havendo interação entre eles. A partir do momento em que a viabilidade de
utilização dos algoritmos adaptativos espaciais em esquemas de diversidade foi comprovada,
abriu-se um campo muito grande de investigação de uma nova solução que possui a
habilidade de cancelamento de interferentes em conjunto com a de combate ao
desvanecimento. Vimos que essa alternativa foi sugerida no âmbito de aplicações de arrays de
antenas em comunicações móveis, que tem sido o grande incentivador de pesquisas em
aplicações de processamento espacial.
107
No entanto algumas lacunas ainda devem ser preenchidas para que seja possível uma
implementação abrangente dos arrays de antenas em comunicações móveis. Uma das maiores
é o desenvolvimento de métodos eficientes de estimação de direção chegada dos sinais
desejados, uma vez que os métodos atualmente existentes ainda são computacionalmente
muito custosos para uso em sistemas de comunicações móveis, onde a mobilidade dos
usuários pode ser grande e a quantidade de sinais também. Sabemos que existem sistemas
comerciais que implementam arrays de antenas em estações rádio base para o WLL (Wireless
Local Loop). Mas no WLL a mobilidade dos usuários é pequena e por isso mesmo não é
difícil conhecer de antemão suas localizações na célula. O grande desafio portanto é extender
ao máximo a aplicação dos arrays, inclusive em ambientes com alta mobilidade de usuários.
Além disso há que se verificar com mais refino o emprego de algoritmos de arrays
adaptativos em esquemas de diversidade. Talvez seja necessário um maior rigor matemático
no modelamento dessa situação, já que estamos falando em conciliar esquemas que em
essência são muito diferentes. Por exemplo, deve-se saber modelar com mais exatidão o que
acontece quando tentamos implementar um algoritmo adaptativo, que originalmente agrega
em seu equacionamento a resposta complexa do array a diferentes direções de chegada dos
sinais, num esquema de diversidade, onde a direção de chegada é uma variável sem sentido, já
que não há nenhuma relação que se possa estabelecer a priori entre a fase do sinal em um
elemento e a fase do sinal num elemento adjacente.
108
ˆŠ‡0‡0‡0‰
Ɲ—HÇ —™È¡7Ž ‘:Œ
Anderson, S., Millnert, M., Viberg, M. e Wahlberg, B., “An Adaptive Array for Mobile
Communication Systems”, IEEE Trans. on Vehicular Tech., vol. 40, nº1, Fev. 1991
Applebaum, S., “Adaptive Arrays”, IEEE Trans. on Antennas and Propag., AP-24, nº 5, Set.
1976
Baghdady, E. J., ed., Lectures on Communication System Theory, McGraw-Hill, 1961
Balaban, P. e Salz, J., “Dual Diversity Combining and Equalization in Digital Cellular
Mobile Radio”, IEEE Trans. on Vehic Tech., vol. 40, nº2, maio/1991
Bigler, L., Lin, H. P., Jeng, S. S. e Xu, G., “Experimental DOA and Spatial Signature
Measurements at 900 MHz for Smart Antenna Systems”, Proc. of the 45th IEEE Vehic. Tech.
Conf., 1995
Bogachev, V. M. e Kiselev, I. G., “Optimum Combining of Signals in Space-Diversity
Reception”, Telecommun. Radio Eng., vol. 34/35, nº10, 1980
Boldrini, J. L., Costa, S. R., Figueiredo, V. L. e Weltzer, H. G., Álgebra Linear, Harper &
Row, 1980
109
Brandão, A. L., Quality-Based Algorithms for Diversity and Equalization in Personal
Communications, Tese de Doutorado, Department of Electronic and Electrical Eng., The
University of Leeds, England, 1995
Brandão, J. C. e Quinaud, E. F., “Fundamentos de Antenas Adaptativas e Aplicação à
Comunicação Móvel Celular”, relatório CETUC PASR 08/96, PUC-RJ, 1996
Cadzow, J. A., “A High Resolution Direction of Arrival Algorithm for Narrow-Band
Coherent and Incoherent Sources”, IEEE Trans. on Acoustics, Speech and Signal Proc., vol.
36, nº7, jul./1988
Chiba, I., Chujo, W. e Fujise, M., “Beam-Space CMA Adaptive Array Antennas”,
Electronics and Comm. in Japan, Part I, vol. 78, nº2, 1995
Compton, Jr, R. T., Adaptive Antennas: Concepts and Performance, Prentice Hall,
Englewood Cliffs, NJ, 1988
Compton, Jr., R. T., “An Adaptive Array in a Spread Spectrum System”, Proc. of the IEEE,
vol. 66, Mar. 1978
Diniz, P. S. R., Adaptive Filtering: Algorithms and Practical Implementation, Kluwer
Academic Pub., 1997
Eng, T. e Kong, N., “Comparison of Diversity Combining Techniques for Raylegh-Fading
Channels”, IEEE Trans. on Communications, vol. 44, nº9, set./1996
Failli, M., Digital Land Mobile Radio Communications, COST 207. Commission of the
European Communities, 1989
Frost III, O. L., “An Algorithm for Linearly Constrained Adaptive Array Processing”, Proc.
of the IEEE, vol. 60, Ago. 1972
110
Gabriel, W. F., “Adaptive Arrays - An Introduction”, Proc. of the IEEE, vol. 64 Fev. 1976
Gabriel, W. F., “Adaptive Processing Array Systems”, Proc. of the IEEE, vol. 80 nº 1, Jan.
1992
Godara, L., C., “Applications of Antenna Arrays to Mobile Communications, Part I:
Performance Improvement, Feasibility and System Considerations”, Proc. of the IEEE, vol.
85, nº 7, Jul. 1997 (a)
Godara, L., C., “Applications of Antenna Arrays to Mobile Communications, Part II:
Beamforming and DOA Considerations”, Proc. of the IEEE, vol. 85, nº 8, Ago. 1997 (b)
Golub, G. H. e Van Loan, C. F., Matrix Computations, The Johns Hopkis University Press,
1989
Griffiths, L. J., “A Simple Adaptive Algorithm for Real-Time Processing in Antenna Arrays”
Proc. of the IEEE, vol. 57, Out. 1969
Griffiths, L. J. e Jim, C. W., “An Alternative Approach to Linearly Constrained Adaptive
Beamforming” IEEE Trans. on Antennas and Prop., vol. AP-30, Jan. 1982
Hansen, P. M. e Loughlin, J. P., “Adaptive Array for Elimination of Multipath Interference
at HF”, IEEE Trans. on Antennas and Propag., AP-29, nº 6, Nov. 1981
Haykin, S., ed., Array Signal Processing, Prentice-Hall, N.J., 1984
Haykin, S., Adaptive Filter Theory, Prentice-Hall, N.J., 1996
IEEE Trans. on Antennas Propag., Edição Especial em Antenas Adaptativas e Ativas, vol.
12, Mar. 1964
IEEE Trans. on Antennas Propag., Edição Especial em Antenas Adaptativas, vol. 24, Mar.
111
1976
IEEE Trans. on Antennas Propag., Edição Especial em Sistemas de Processamento
Adaptativo em Antenas, vol. 34, Mar. 1986
Ishii, N. e Kohno, R., “Spatial and Temporal Equalization Based on an Adaptive Tapped
Delay Line Array Antenna”, IEICE Trans. Comm., vol. E78-B, nº8, ago./1995
Jakes, W. C., Jr., Microwave Mobile Communications, John Wiley & Sons, 1974
Klouche-Djedid, A. E Fujita, M., “Adaptive Array Sensor Processing Applications for
Mobile Telephone Communications”, IEEE Trans. on Vehicular Tech., vol. 45, nº 3, Ago.
1996
Krauss, J. D., Antennas, McGraw-Hill, New York, 1950
Krim, H. e Viberg, M., “Two Decades of Array Signal Processing Research: The
Parametric Approach”, IEEE Signal Proc. Mag., vol. 13, nº 4, Jul. 1996
Kucar, A., “Mobile Radio: An Overview”, IEEE Comm. Mag., Nov. 1991
Liberti, J. C. Jr., e Rappaport, T. S., “Analytical Results for Capacity Improvements in
CDMA”, IEEE Trans. on Vehicular Tech., vol. 43 nº3, ago./1994
Litva, J. e Lo, T. K. Y., Digital Beamforming in Wireless Communications, Artech House,
1996
Liu, H. e Xu, G., “Smart Antennas in Wireless Systems: Uplink Multiuser Blind Channel and
Sequence Detection”, IEEE Trans. on Comm., vol. 45, nº2, fev./1997
Liu, H. e Zoltowski, M. D., “Blind Equalization in Antenna Array CDMA Systems”, IEEE
Trans. on Signal Proc., vol. 45, nº1, jan./1997
112
Madhow, U., “Blind Adaptive Interference Suppression for the Near-Far Resistant
Acquisition and Demodulation of Direct-Sequence CDMA Signals”, IEEE Trans. on Signal
Proc., vol. 45, nº1, jan./1997
Mayrargue, S., “A Blind Spatio-Temporal Equalizer for a Radio-Mobile Channel Using the
Constant Modulus Algorithm (CMA)”, Proc. of the International Conf. on Acoustics, Speech
and Signal Proc. (ICASSP), Adelaide, Austrália, 1994
Miller, M. e Fuhrmann, D., “Maximum Likelihood Narrow-Band Direction Finding and the
EM Algorithm”, IEEE Trans. on Acoustics, Speech and Signal Proc., vol. 38, nº9, Set./1990
Misaizu, K., Matsuoka, T., Ohnishi, H., Kohno, R. e Imai, H., “Adaptive Equalization
with Dual Diversity Combining”, IEICE Trans. Comm., vol. E76-B, nº2, fev./1993
Mizuno, M. e Ohgane, T., “Application of Adaptive Array Antennas to Radio
Communications”, Electronics and Comm. in Japan, part 1, vol. 77, nº 2, Fev. 1994
Naguib, A. F., Paulraj, A. e Kailath, T., “Capacity Improvement with Base-Station Antenna
Arrays in Cellular CDMA”, IEEE Trans. on Vehic. Tech., vol. 43, nº3, ago./1994
Naguib, A. F. e Paulraj, A., “Performance Enhancement and Trade-Offs of Smart Antennas
in CDMA Cellular Networks”, Proc. of the 45th IEEE Vehic. Tech. Conf., 1995
Ogawa, Y., Ohmiya, M. e Itoh, K., “An LMS Adaptive Array for Multipath Fading
Reduction”, IEEE Trans. on Aerospace and Electronic Systems, vol. AES-23, nº 1, Jan. 1987
Ohgane, T., “Characteristics of CMA Adaptive Array for Selective Fading Compensation in
Digital Land Mobile Radio Communications”, Electr. and Comm. in Japan, Part I, vol. 74,
nº9, 1991
Ohgane, T., Shimura, T., Matsuzawa, N. e Sazaoka, H., “An Implementation of a CMA
113
Adaptive Array for High Speed GMSK Transmission im Mobile Communications”, IEEE
Trans. on Vehicular Tech., vol. 42, 1993
Passerini, C., Missiroli, M., Riva, G. e Frullone, M., “Adaptive Antenna Arrays for
Reducing the Delay Spread in Indoor Radio Channels”, Electronics Letters, vol. 32, nº4,
fev./1996
Paulraj, A. J. e Papadias, C. B., “Space-Time Processing for Wireless Communications:
Improving Capacity, Coverage and Quality in Wireless Networks by Exploiting the Spatial
Dimension”, IEEE Signal Proc. Mag., vol. 14, Nov. 1997
Petrus, P e Reed, J. H., “Cochannel Interference Rejection for AMPS Signals Using Spectral
Correlation Properties and an Adaptive Array”, Proc. of the 45th IEEE Vehic. Tech. Conf.,
1995
Pursley, M. B., “Performance Evaluation for Phased-Coded Spread Spectrum MultilpleAccess Communications with Random Signature Sequences”, IEEE Trans. on Comm., vol.
25, ago./1977
Rao, B. D., “Performance Analysis of Root-MUSIC”, IEEE Trans. on Acoustics, Speech and
Signal Proc., vol. 37, nº12, Dez./1989
Reddi, S. S., “Multiple Source Location - a Digital Approach”, IEEE Trans. on Aerospace
and Elect. Systems, vol. AES-15, nº1, jan./1979
Resende, L.S., Algoritmos Recursivos de Mínimos Quadrados para Processamento
Espacial/Temporal com Restrições Lineares : Aplicação em Antenas Adaptativas , Tese de
Doutorado FEEC-UNICAMP, Dez. 1996.
Riba, J., Goldberg, J. e Vàzquez, G., “Robust Beamforming for Interference Rejection in
Mobile Communications”, IEEE Trans. on Signal Proc., vol. 45, nº1, jan./1997
114
Robertson, W. e Phillips, W., “A System of Systolic Modules for the MUSIC Algorithm”,
IEEE Trans. on Signal Proc., vol. 39, nº11, nov./1991
Romano, J. M. T. e Brandão, A L., Processamento Digial de Sinais para Comunicações
Móveis, Curso de Pós-Graduação, FEEC UNICAMP, 1997
Roy, R. e Kailath, T., “ESPRIT - Estimation of Signal Parameters Via Rotational Invariance
Techniques”, IEEE Trans. on Acoustics, Speech and Signal Proc., vol. 37, nº7, Jul./1989
Schmidt, R. O. e Franks, R. E., “Multiple Source DF Signal Processing: An Experimental
System”, IEEE Trans. on Antennas and Propag., vol. AP-34, nº3, mar./1986a
Schmidt, R. O., “Multiple Emitter Location and Signal Parameter Estimation”, IEEE Trans.
on Antennas and Prop., vol. AP-34, nº3, mar./1986b
Stoica, P. e Nehorai, A., “MUSIC, Maximum Likelihood and Cramer-Rao Bound”, IEEE
Trans. on Acoustics, Speech and Signal Proc., vol. 37, nº5, maio/1989
Takao, K., “Overview of the Theory of Adaptive Antennas”, Electronics and Comm. in Japan,
part 1, vol. 76, nº 7, Jul. 1993
Thompson, J. S., Grant, P. M., e Mulgrew, B., “Smart Antenna Arrays for CDMA
Systems”, IEEE Personal Communications, out./1996
Treichler, J. R. e Agee, B. G., “A New Approach to Mulipath Correction of Constant
Modulus Signals”, IEEE Trans. on Ac., Speech and Sig. Proc., vol. 31, nº 2, abr./1983
Tsoulos, G. V., Beach, M. A. e Swales, S. C., “Adaptive Antennas for Third Generation DSCDMA Cellular Systems”, Proc. of the 45th IEEE Vehic. Tech. Conf., 1995
Van Veen, B. D. e Buckley, K. M., “Beamforming: a Versatile Approach to Spatial
Filtering”, IEEE Acoust., Speech, Signal Processing Mag., Abril 1988
115
Vaughan, R. G., “On Optimum Combining at the Mobile”, IEEE Trans. on Vehicular
Technology, vol. 37, nº4, nov./1988
Wang, Y. e Cruz, J. R., “Adaptive Antenna Arrays for the Reverse Link of CDMA Cellular
Communications Systems”, Electronics Letters, vol. 30, nº13, jun./1994
Wax, M., “Dedection and Localization of Multiple Sources in Noise with Unknown
Covariance”, IEEE Trans. on Acoustics, Speech and Signal Proc., vol. 40, nº1, Jan./1992
Wells, M. C., “Increasing the Capacity of GSM Cellular Radio Using Adaptive Antennas”,
IEE Proc.-Communications, vol. 143, nº5, out/1996
Widrow, B. et al., “Adaptive Antenna Systems”, Proc. of the IEEE, vol. 55, nº12, Dez. 1967
Widrow, B. e Stearns, S. D., Adaptive Signal Processing, Prentice Hall, Englewood Cliffs,
NJ, 1985
Winters, J. H., “Optimum Combining in Digital Mobile Radio with Cochannel Interference”,
IEEE Journal on Selected Areas in Comm., Julho 1984
Winters, J. H., “Signal Acquisition and Tracking with Adaptive Arrays in the Digital Mobile
Radio System IS-54 with Flat Fading”, IEEE Trans. on Vehic. Tech., vol. 42, nº4, nov./1993
Winters, J. H., Salz, J. e Gitlin, R. D., “The Impact of Antenna Diversity on the Capacity of
Wireless
Communication
Systems”,
IEEE
Trans.
on
Comm.,
vol.42,
nº2/3/4,
fev./mar./abr./1994
Yacoub, M. D., Foundations of Mobile Radio Engineering, CRC Press, Boca Raton, 1993
116