II.6 Discussão - DECOM
Transcrição
II.6 Discussão - DECOM
UNIVERSIDADE ESTADUAL DE CAMPINAS FACULDADE DE ENGENHARIA ELÉTRICA E DE COMPUTAÇÃO DEPARTAMENTO DE COMUNICAÇÕES !"!$# %'&( Autor Alexandre Freire da Silva Osorio Orientador prof. Dr. João Marcos Travassos Romano Co-Orientador Dr. André Louzada Brandão Banca Examinadora: prof. Dr. João Marcos Travassos Romano (UNICAMP) prof. Dr. Leonardo Silva Resende (UFSC) prof. Dr. Michel Daoud Yacoub (UNICAMP) prof. Dr. Amauri Lopes - suplente (UNICAMP) Tese apresentada à Faculdade de Engenharia Elétrica e de Computação da Universidade Estadual de Campinas como parte dos requisitos exigidos para a obtenção do título de Mestre em Engenharia Elétrica. Campinas, Julho de 1998 FICHA CATALOGRÁFICA ELABORADA PELA BIBLIOTECA DA ÁREA DE ENGENHARIA - BAE - UNICAMP Os5a Osorio, Alexandre Freire da Silva Antenas adaptativas; conceitos e aplicações em comunicações móveis / Alexandre Freire da Silva Osorio.—Campinas, SP: [s.n.], 1998. Orientador: João Marcos Travassos Romano. Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Elétrica e de Computação. 1. Antenas ajustáveis. 2. Processamento de sinal adaptativo. 3. Sistemas de comunicação móvel.. I.Romano, João Marcos Travassos. II. Universidade Estadual de Campinas. Faculdade de Engenharia Elétrica e de Computação. III. Título. Aos meus pais, Jurandyr e Cleusa, e ao meu irmão, Marcelo, que me dão todo o apoio de que preciso, sempre com muito amor. À Fátima, anjinho que é a luz da minha vida. )* !$ Ao prof. João Marcos, pela orientação, honestidade e aplicação. Ao Dr. André Brandão, meu co-orientador, pelas enriquecedoras discussões. Aos ilustres membros da banca examinadora, pelas valorosas críticas e sugestões. A Rodrigo Cavalcante, aluno de doutorado, pelo companheirismo na árdua tarefa de montagem do Laboratório de Processamento de Sinais para Comunicações Móveis, ainda em fase de construção, e pelas valorosas ajudas com a sua larga experiência acadêmica e de simulações. Aos estagiários de iniciação científica Romis Ribeiro e Maurício Sol, pela inestimável ajuda na codificação das centenas de linhas necesárias para a construção do nosso ambiente de simulação. Sem eles, certamente o trabalho teria transcorrido de forma bem mais lenta. Ao engenheiro Castelo Branco, do CPqD da Telebrás, pela excelente oportunidade que está me proporcionando de aplicar os resultados obtidos neste trabalho através de convênio firmado entre a Unicamp e a Telebrás. Ao CNPq, pelo financiamento deste trabalho de mestrado. À Fátima, que, apesar das muitas horas em que, por conta deste trabalho de tese, deixamos de realizar aquilo que mais prezamos que é estarmos juntos, manteve todo o seu puro amor por mim. Aos funcionários e funcionárias do Decom, Lúcia, Mário, Celi, Márcia e Lena, pela dedicação e carinho. A todos os meus grandes amigos e amigas, Nelson, Alê, Bia, Cadão, Massa, Paulinha, Jorge, Zezinho, Ivan, Paula, Fred e mais tantos outros com quem estive muito ligado durante a execução deste trabalho. Com eles meu prazer em viver é certamente muito maior. +(* In many times space signal processing techniques solve problems that time processing techniques are not allowed to do. As important examples of these problems we may mention co-channel interference canceling and fading counteractions, when the durations of the fadings are larger than the total delay of the time filter. Both problems are very relevant in mobile communications systems. In this thesis we describe the main space processing techniques, commonly called adaptive antennas techniques. By means of a bibliographic survey, we identify two branches in which the development of these techniques has occurred. The detection branch consists of techniques developed initially for use in radars and sonars while the diversity branch includes space diversity techniques, developed initially as fading counteractions techniques. We join both branches when we verify that it’s possible to realize diversity using detection branch techniques. In this thesis we show that this was verificated in a work that exploited the application of space processing in mobile communications systems. In order to demonstrate the possibility of application of the space filters in typical mobile communications environments we present some results published in the specialized literature. Our own simulations results comparing the performances of the adaptive space algorithms in nulling multipath components and co-channel interference are presented too. ,(#!$ As técnicas de processamento espacial de sinais viabilizam a solução de problemas muitas vezes impossíveis de serem resolvidos por processamento temporal. Como exemplos significativos desses problemas podemos citar o cancelamento de interferência co-canal e o combate ao desvanecimento quando este possui duração maior que o atraso total do filtro temporal, problemas estes muito relevantes em sistemas de comunicações móveis. Nesta tese descrevemos as principais técnicas de processamento espacial, comumente conhecidas como técnicas de antenas adaptativas. Através de levantamento e análise bibliográfica, identificamos que o desenvolvimento dessas técnicas aconteceu segundo dois ramos distintos. O ramo detecção é formado pelas técnicas desenvolvidas para aplicação inicialmente em radares e sonares, enquanto que o ramo diversidade inclui as técnicas de diversidade espacial de sinais, desenvolvidas inicialmente com a finalidade de combater desvanecimentos em sinais de rádio. No momento em que vislumbra-se a possibilidade de realizar diversidade utilizando técnicas desenvolvidas no ramo deteção, faz-se a junção dos dois ramos. Nesta tese mostramos que essa possibilidade foi verificada em um trabalho que explora a aplicação de processamento espacial em sistemas de comunicações móveis. Procuramos demonstrar a viabilidade de aplicação dos filtros espaciais em ambientes típicos de comunicações móveis. Para isso, utilizamos resultados publicados na literatura e resultados próprios de simulações que comparam a performance dos algoritmos espaciais adaptativos no combate ao ruído de multipercurso e à interferência co-canal. - INTRODUÇÃO I.1 ORGANIZAÇÃO DA TESE PROCESSAMENTO ADAPTATIVO ESPACIAL 1 4 6 II.1 INTRODUÇÃO 6 II.2 EQUAÇÃO DE WIENER-HOPF 7 II.3 ALGORITMOS ITERATIVOS 10 LMS 10 RLS 13 CMA 14 II.4 PROCESSAMENTO ESPACIAL COM ARRAYS DE ANTENAS 17 II.5 MODELO DE SINAIS 18 II.6 DISCUSSÃO 22 III. RAMO DETECÇÃO 23 III.1 O ARRAY DE APPLEBAUM 24 III.2 O ARRAY COM SINAL PILOTO 31 III.3 O ARRAY DE GRIFFITHS 33 i III.4 O ARRAY DE FROST 34 III.5 O GSC 39 III.6 O ARRAY DE RESENDE (ALGORITMO CFLS) 40 III.7 ARRAYS PARCIALMENTE ADAPTATIVOS 47 GRAUS DE LIBERDADE DE UM ARRAY 47 ARRAYS PARCIALMENTE ADAPTATIVOS 48 III.8 SUMÁRIO 49 IV. ESTIMAÇÃO DE DIREÇÃO DE CHEGADA DE SINAIS IV.1 FATORAÇÃO ESPECTRAL DE R xx 50 51 IV.2 SOLUÇÃO GEOMÉTRICA 53 IV.3 ALGORITMOS BASEADOS EM ESPECTROS 54 MÉTODOS DE ARRAYS FORMADORES DE FEIXES ESTIMAÇÃO UTILIZANDO O ARRAY DE BARTLETT MÉTODOS DE SUBESPAÇO 54 56 57 MUSIC 58 ROOT MUSIC 59 ESPRIT 60 IV.4 ALGORITMOS PARAMÉTRICOS ALGORITMO DE MÁXIMA VEROSSIMILHANÇA IV.5 DISCUSSÃO 63 64 65 V. RAMO DIVERSIDADE 67 V.1 DESVANECIMENTO 67 V.2 DIVERSIDADE 69 V.3 ESQUEMAS DE DIVERSIDADE 71 ii DIVERSIDADE POR SELEÇÃO 71 DIVERSIDADE POR COMBINAÇÃO 73 V.4 O VÉRTICE DO “Y”: COMBINAÇÃO ÓTIMA 74 V.5 COMPARAÇÃO ENTRE OS MÉTODOS 75 COMBINAÇÃO POR RAZÃO MÁXIMA X COMBINAÇÃO ÓTIMA V.6 ESQUEMAS DE DIVERSIDADE E ARRAYS ADAPTATIVOS ARRAYS DE ANTENAS EM COMUNICAÇÕES MÓVEIS VI.1 REDUÇÃO DE INTERFERÊNCIA CO-CANAL 77 78 80 81 REDUÇÃO DE ICC EM SISTEMAS GSM 88 REDUÇÃO DE ICC EM SISTEMAS CDMA 90 VI.2 RESULTADOS DE SIMULAÇÕES 93 PRIMEIRA SIMULAÇÃO 96 SEGUNDA SIMULAÇÃO 101 DISCUSSÃO 106 VII. CONCLUSÕES 107 VIII. REFERÊNCIAS 109 iii .0/ .132457638:9;5 Classicamente as técnicas de processamento adaptativo são empregadas em filtros temporais transversais, como o da Figura I.1. Neles a saída é a soma de N amostras temporais do sinal de entrada, ponderadas pelos N coeficientes do filtro. Os coeficientes são variados segundo algum algoritmo para satisfazer o critério de otimização da função custo utilizada. sensor atrasadores x(k) x(k-1) T x(k-2) T x(k-N+1) ... T coeficientes do filtro w1∗ w2∗ w3∗ ... w ∗N Σ y(k) Figura I.1 - Filtro adaptativo temporal Neste trabalho estaremos tratando de filtragem adaptativa espacial. Assim, ao invés do filtro processar amostras atrasadas de um sinal de entrada, como no caso do filtro temporal, ele processa amostras espaciais de uma frente de onda captada por um conjunto (array) de antenas (Fig. I.2). A característica de interesse do sinal processado é sua direção de chegada 1 ao array, que perfaz o mesmo papel da freqüência num filtro temporal. O análogo espacial do espectro de freqüências de um filtro temporal é o padrão de irradiação, que reflete a sensibilidade do array em relação à direção de chegada dos sinais captados1. O processamento realizado por meio de arrays de antenas possui aplicações em diferentes sistemas como radares, sonares, sistemas sismológicos e de comunicações. Nossa principal motivação em tratar desse assunto, que vem sendo pesquisado desde a década de 1950, é que só recentemente as pesquisas têm se voltado para aplicações em comunicações móveis, com obtenção de bons resultados e prognósticos promissores. elementos do array coeficientes do filtro interferente x1(k) x2(k) ϕi w2∗ Σ y(k) ... ... ϕd w1∗ xN(k) sinal desejado w ∗N ... algoritmo adaptativo critério de otimização Figura I.2 - Filtro adaptativo espacial linear genérico Os sinais de rádio em comunicações móveis sofrem desvanecimento devido ao fato de sua propagação dar-se em múltiplos percursos [Yacoub, 1993]. Para contornar esse problema, técnicas de equalização temporal têm sido utilizadas, mas que não são eficientes quando a duração do desvanecimento é maior que o atraso total do equalizador. Os esquemas de diversidade em arrays de antenas são insensíveis à duração do desvanecimento pois baseiamse no fato de que, para antenas suficientemente espaçadas, os sinais em cada uma delas são descorrelacionados entre si, diminuindo assim a probabilidade de ocorrência de 1 O padrão de irradiação de um array é obtido medindo-se a potência de saída em resposta a um sinal monocromático de amplitude unitária que incide segundo várias direções, no intervalo [0,2π ) . 2 desvanecimento em todas elas ao mesmo tempo. Um outro fenômeno que degrada a qualidade de recepção é a interferência causada por sinais que ocupam a mesma faixa de freqüências do sinal desejado. Arrays de antenas provêm um meio efetivo para redução da interferência co-canal por serem insensíveis à banda de freqüências ocupada pelos sinais processados. Nosso intuito nesta tese é apresentar as principais técnicas de processamento espacial existentes e uma visão geral do estado da arte para aplicações em comunicações móveis. Para isso realizamos um extenso levantamento bilbiográfico do tema e constatamos que sua evolução aconteceu em dois ramos de pesquisas que, apesar de estarem preocupados em resolver problemas distintos, encontraram em comunicações móveis um ambiente comum de aplicação. O primeiro ramo, que denominamos ramo detecção, esteve historicamente associado a pesquisas de arrays de antenas em radares e sonares, procurando desenvolver métodos efetivos de detecção de sinais desejados e cancelamento de interferentes. As técnicas utilizadas envolvem arrays de antenas empregando algoritmos adaptativos e o quadro de pesquisadores inclui, entre outros, um dos criadores do algoritmo LMS (B. Widrow) e do algoritmo LMS com restrições (O. Frost), bastante utilizados também em filtros temporais. Basicamente o que caracteriza uma técnica como pertencente a esse ramo é o fato de os elementos do array (as antenas) estarem espaçados por uma distância máxima, dita distância coerente do array, que garante a correlação entre os sinais por eles captados. Após expormos os principais algoritmos do ramo detecção, apresentamos as técnicas mais utilizadas de estimação de direção de chegada de sinais, necessárias para a implementação de algoritmos que necessitam dessa informação em suas formulações. No segundo ramo de pesquisas, denominado ramo diversidade, a preocupação inicial era de combater o desvanecimento dos sinais de rádio. Para isso são empregados métodos de diversidade espacial, cujo princípio é obter sinais descorrelacionados na recepção e, por combinação de todos eles ou por seleção do que possui melhor qualidade, produzir um sinal 3 de saída melhor segundo um certo critério, que pode ser, por exemplo, a relação sinal/ruído (SNR) ou a relação sinal/ruído+interferentes (SINR). A separação das técnicas que empregam arrays de antenas em técnicas de arrays adaptativos (primeiro ramo de pesquisas) e técnicas de diversidade espacial (segundo ramo) não é usual na literatura. No entanto, acreditamos que ela seja necessária para que se forme um juízo a respeito da aplicabilidade dos métodos desenvolvidos em ambos os ramos, pois são baseados em fundamentos muito diferentes, apesar de servirem como solução para problemas semelhantes. I.1 Organização da Tese O Capítulo II apresenta os conceitos básicos da teoria de filtragem adaptativa e alguns dos principais algoritmos que têm sido utilizados em arrays de antenas: LMS, RLS e CMA. No final do Capítulo há um modelamento dos sinais utilizados nos arrays de antenas que será utilizado ao longo de todo o texto. O Capítulo III trata dos principais algoritmos desenvolvidos a princípio para aplicações em radares e sonares, que chamaremos apenas de algoritmos de arrays adaptativos. Em seguida, no Capítulo IV, são descritos os principais métodos de estimação de direções de chegada de sinais, utilizados na aplicação de alguns dos algoritmos de arrays adaptativos em sistemas de comunicações. Apesar da completa associação existente entre os assuntos tratados nesses dois capítulos, optamos por isolar os algoritmos de arrays adaptativos em um capítulo próprio pela relevância que o assunto possui no âmbito deste trabalho de tese e também por considerarmos que essa atitude beneficiou a clareza e a fluência do texto, dada a grande extensão do Capítulo III. No Capítulo V descreveremos os esquemas de diversidade espacial desenvolvidos para combate ao desvanecimento de sinais de rádio. O capítulo termina com uma comparação de 4 performance entre os métodos apresentados, publicada na literatura especializada. Uma visão geral da aplicabilidade de arrays de antenas em comunicações móveis é apresentada no Capítulo VI. É abordada sua utilidade no combate à interferência co-canal, através de resultados obtidos na literatura, e na diminuição da interferência de multipercurso, onde se faz um estudo comparativo, através de resultados de simulações, entre as performances dos algoritmos mais significativos apresentados durante a tese. O Capítulo VII tece conclusões a respeito desta tese, abrindo perspectivas para trabalhos futuros. 5 .0.0/ 457=>??A@:BC>1325EDF63@GH2 @I2J K5 < LM?GA@:=J @:N Iniciaremos este capítulo revisando alguns dos princípios da teoria de processamento adaptativo, estabelecendo assim uma base teórica para que posteriormente possamos focalizar a atenção no processamento realizado por meio de arrays de antenas. II.1 Introdução Um filtro adaptativo espacial linear genérico pode ser esquematizado como na Figura [ I.2. As seqüências x1 ( k ) x2 (k ) O ] x N ( k ) são as amostras espaciais da entrada externa e y(k) é a saída do filtro. O algoritmo adaptativo busca otimizar uma determinada função custo, alterando automaticamente, para isso, os coeficientes do filtro a cada iteração. De acordo com a abordagem feita em [Diniz, 1997], para que um filtro adaptativo seja completamente especificado, é necessário definir: 1) a aplicação, que define também os tipos dos sinais a serem tratados. Entre elas, podemos citar cancelamento de eco acústico, equalização de canais, predição de sinais, 6 controle adaptativo, cancelamento de interferências, etc.; 2) a estrutura do filtro, quer seja de resposta finita (FIR) ou infinita (IIR) e 3) o algoritmo adaptativo (LMS, RLS, CMA, etc.). Os algoritmos adaptativos, por sua vez, são compostos basicamente por três itens: 1) a função custo; 2) o método de otimização dessa função, que pode ser o método de Newton, o método da descida mais íngreme (steepest descent), ou algum dos métodos quasiNewton [Diniz, 1997]; 3) a definição do sinal de erro. A equação de Wiener-Hopf, cuja dedução veremos resumidamente a seguir, está na base de toda a teoria de filtragem adaptativa. II.2 Equação de Wiener-Hopf A Figura II.1 representa a estrutura de um filtro adaptativo espacial linear de N coeficientes. A k-ésima amostra do sinal de saída, y(k), é a soma das k-ésimas amostras dos sinais nas saídas dos elementos do array [ coeficientes do filtro w1 ( k ) w2 ( k ) Q [ x ( k ) x ( k ) P x ( k )] ponderadas pelos w ( k )] . O índice k denota a dependência das 1 2 N N amostras com o tempo. d(k) é o sinal de referência e e(k) é o erro entre a saída e o sinal de referência. 7 x1(k) w1∗ x2(k) w2∗ xN (k) ... y(k) Σ ... ... w∗N e(k) algoritmo adaptativo - + Σ d (k) Figura II.1 - Filtro adaptativo espacial linear de N coeficientes Se considerarmos o filtro num instante k qualquer, sua saída será dada por N ∑ w x (k ) ∗ i i (II.1) y ( k ) = w H x( k ) (II.2) y( k ) = i =1 Ou, em notação matricial onde x( k ) = [ x1 ( k ) x2 ( k ) R x N ( k )] e w( k ) = [ w1 T w2 S wN ] . T Podemos escolher a função custo do filtro como sendo o erro quadrático médio (em inglês, MSE - Mean Square Error) entre a saída y(k) e o sinal de referência d(k). Ou seja 8 [ ] = E{[ d ( k ) − y ( k )] [ d ( k ) − y ( k )]} = E{[d ( k ) − w x( k )] [d ( k ) − w x( k )]} = E[ d ( k ) − d ( k ) w x( k ) − d ( k ) w x ( k ) + w x ( k )x ( k ) w ] = E[ d ( k ) ] − w E[d ( k )x( k )] − w E[d ( k )x ( k )] + w E[x( k )x ( k )]w = E[ d ( k ) ] − w E[d ( k )x( k )] − E[d ( k )x( k )] w + w E[x( k )x ( k )]w ψ = E e( k ) 2 ∗ 2 H ∗ ∗ H 2 H ∗ 2 H ∗ H ∗ T T ∗ T ∗ T T H ∗ ∗ H H (II.3) ∗ H Assim [ ψ = E d (k ) 2 ]− w H rdx − rdxH w + w H R xx w (II.4) onde, d ∗(k)x1 ( k ) ∗ d (k)x 2 ( k ) ∗ rdx = E[ d ( k )x( k )] = E ∗ d (k)x N ( k ) T (II.5) e R xx = E[x( k )x H ( k )] x1 ( k ) x1∗ ( k ) x 2 ( k ) x1∗ ( k ) =E ∗ x N ( k ) x1 ( k ) V U UV x1 ( k ) x 2∗ ( k ) x 2 ( k ) x 2∗ ( k ) V x N ( k ) x 2∗ ( k ) U x1 ( k ) x ∗N ( k ) x 2 ( k ) x ∗N ( k ) ∗ x N ( k ) x N ( k ) V (II.6) R xx é a matriz de auto-correlação do vetor de entrada e rdx é o vetor de correlação cruzada entre o sinal de referência e o vetor de entrada. Para minimizar a função custo, calculamos inicialmente seu vetor gradiente [Haykin, 1996]: 9 ∇ w (ψ ) = ∂ψ = 2(R xx w − rdx ) ∂w (II.7) O vetor w opt que anula o gradiente em (II.7) e que portanto contém as coordenadas cartesianas do ponto de mínimo da função custo MSE é dado pela seguinte expressão w opt = R −1 xx rdx (II.8) A Equação (II.8) é chamada de Equação de Wiener-Hopf e está na base de toda a teoria de processamento adaptativo. II.3 Algoritmos Iterativos O algoritmo LMS é simples e robusto e, principalmente por causa disso, o mais utilizado até hoje. Apresentamos também nesta seção o algoritmo RLS como uma alternativa de convergência mais rápida, porém com maior custo computacional. Finalmente, para os casos onde não se dispõe de informação suficiente sobre o sinal desejado para a geração do sinal de referência apresentamos um algoritmo “cego” conhecido como CMA (de Constant Modulus Algorithm), de aplicação recente em arrays para comunicações móveis. LMS O algoritmo LMS (de Least Mean Square), idealizado por Widrow e Hoff em 1959, utiliza uma aproximação estocástica para o cálculo do gradiente da função custo MSE. O método de minimização da função custo, conhecido como steepest descent (literalmente, 10 descida mais íngreme), realiza a busca pelo ponto mínimo da função percorrendo, a cada atualização do vetor de coeficientes, a função custo no sentido oposto ao do seu vetor gradiente que, como se sabe, aponta no sentido do máximo crescimento da curva. Dessa forma podemos representar a expressão iterariva para atualização do vetor de coeficientes como W w ( k + 1) = w ( k ) − µ∇ w (ψ ) (II.9) onde µ é o passo de adaptação, que regula a velocidade de convergência e a estabilidade do algoritmo e ψ é a função MSE, definida em (II.3) e repetida aqui por conveniência. [ ψ = E e( k ) 2 ] (II.10) e(k) é o erro entre o sinal de referência e a saída do filtro, dado por e( k ) = d ( k ) − w H x ( k ) (II.11) A partir de (II.10) e (II.11) podemos calcular a aproximação estocástica do gradiente da função custo X ∂ ( e ∗ ( k ) e( k ) ) ∇ w (ψ ) = ∂w ∂e( k ) = 2e∗ ( k ) ∂w ∗ = −2e ( k )x( k ) (II.12) Substituindo (II.12) em (II.9) obtemos a expressão final de adaptação dos coeficientes w ( k + 1) = w ( k ) + 2 µe∗ ( k )x( k ) (II.13) A Figura II.2 mostra o caminho de convergência de um filtro espacial linear LMS sobre as curvas de nível de uma função MSE. No experimento realizado a entrada é um sinal monocromático de amplitude unitária e o sinal de referência é o próprio sinal de entrada. A 11 relação SNR na entrada é 10 dB. O filtro possui dois coeficientes reais, o passo de adaptação é igual a um centésimo e foram necessárias 1000 iterações para que o algoritmo convergisse. A solução ótima de Wiener para esse caso com a matriz R xx e o vetor rdx estimados é [ ] [ ] T w opt = 0,819 − 0,003 . O algoritmo convergiu em torno dos valores estimados Y T w opt = 0,847 − 0,017 . A Figura II.3 mostra a função custo MSE. 0.6 0.4 w2 0.2 0 -0.2 -0.4 -0.6 0 0.2 0.4 0.6 0.8 1 1.2 w1 Figura II.2 - Convergência do algoritmo LMS em um filtro de dois coeficientes reais Figura II.3 - Função custo MSE do exemplo acima 12 Pela observação de (II.13) entendemos porque o LMS é ainda hoje o algoritmo utilizado pela maioria das aplicações. Sua expressão é elegante e extremamente simples, restringe-se a uma soma e dois produtos e não necessita de cálculos de médias ou de quadrados. Entretanto sua velocidade de convergência, para entradas correlacionadas, é baixa se comparada a de outros algoritmos como o RLS, que veremos a seguir. RLS Uma maneira de aumentar a velocidade de convergência do algoritmo adaptativo é calcular diretamente o vetor de coeficientes pela equação de Wiener (II.8). O algoritmo RLS (de Recursive Least Squares) realiza a busca iterativa pelo vetor de coeficientes ótimo diretamente através da equação de Wiener utilizando aproximações estocásticas das matrizes R xx e rdx , que são atualizadas recursivamente a cada iteração, da seguinte maneira: k R xx ( k ) = ∑ ϕ k −i x(i )x H (i ) (II.14) i =1 k k i =1 i =1 R xx ( k ) = ∑ ϕ k −1x(i )x H (i ) rxd ( k ) = ∑ ϕ k −i x(i )d ∗ (i ) (II.15) A aproximação estocástica do vetor de pesos ótimo é, então Z [ \ −1 w opt ( k ) = R xx ( k )rdx ( k ) (II.16) O fator 0 < ϕ ≤ 1 é chamado fator de esquecimento e tem por função fazer com que valores passados dos sinais tenham pesos menores do que os valores mais recentes no cálculo dos atuais conteúdos das matrizes. Podemos rearranjar (II.14) e (II.15) para obtermos uma regra recursiva para os cálculos das matrizes 13 ] ^ R xx ( k ) = ϕR xx ( k − 1) + x( k )x H ( k ) (II.17) _ (II.18) ` rdx ( k ) = ϕrdx ( k − 1) + d ∗ ( k )x( k ) Para calcularmos a inversa de (II.17), utilizamos o lema da inversão de matrizes [Diniz, 1997] para obtermos −1 R −xx1 ( k − 1)x( k )x H ( k )R −xx1 ( k − 1)x( k − 1) R ( k ) = ϕ R xx ( k − 1) − ϕ + x H ( k )R −xx1 ( k − 1)x( k ) −1 xx −1 (II.19) Substituindo (II.19) e (II.18) em (II.16) e rearranjando os termos, obtemos a expressão final do algoritmo RLS ϕ −1R −xx1 ( k − 1)x( k ) w( k ) = w ( k − 1) + [ d ∗ ( k ) − w H ( k − 1)x( k )] 1 + ϕ −1x H ( k )R −xx1 ( k − 1)x( k ) (II.20) Pode-se demonstrar [Diniz, 1997] que o algoritmo RLS minimiza uma função custo que é uma aproximação estocástica e recursiva da função MSE, na forma a ψ = k ∑ϕ k −i e(i ) 2 (II.21) i =1 onde o erro e(k) é dado por (II.11). CMA Existe uma classe de algoritmos que não necessitam de sinal de referência, e que por isso mesmo são chamados de cegos. Entre eles, o denominado CMA (de Constant Modulus Algorithm) é de nosso particular interesse pois existem estudos, como em [Mayrargue, 1994], [Ohgane, 1991], [Chiba et. al., 1995] ou [Ohgane et. al., 1993], que comprovam sua eficiência 14 em arrays de antenas para comunicações móveis. O CMA otimiza a saída do array em sistemas que empregam modulações onde os módulos dos sinais são constantes (e.g. FM, PSK, GMSK, etc.). A função custo do algoritmo pode ser representada por ψ pq [ ] [ ] E ak 1 p = E y ( k ) − 4 E ak î pq q (II.22) p onde a k é um símbolo do alfabeto do sinal desejado e p e q são números inteiros quaisquer. Minimizar ψ pq significa minimizar o erro entre o módulo do sinal de saída e o módulo do sinal desejado. O algoritmo adaptativo desenvolvido em [Treichler e Agee, 1983] considera p = q = 2 e uma modulação onde a k = 1 . Para atingir o mínimo da curva de ψ 22 , utiliza o mesmo método steepest descent aplicado no LMS. Portanto as expressões dinâmicas dos dois algoritmos são idênticas (repetida aqui por conveniência): b ( ) w ( k + 1) = w ( k ) − µ∇ w ψ pq (II.23) A estimação (valores instantâneos no lugar das médias temporais) do gradiente de ψ 22 com relação a w pode ser calculada a partir de (II.22): c ∇ w (ψ 22 ) = ]d [ [ 1 2 y ( k ) − 1 ⋅ ∇ w w H ( k ) x( k ) x H ( k ) w ( k ) 2 [ ] = [ y ( k ) − 1] ⋅ y ( k )x( k ) ] = y ( k ) − 1 ⋅ x( k ) x H ( k ) w ( k ) 2 (II.24) 2 Substituindo (II.24) em (II.23) temos a expressão final do algoritmo CMA. 15 {[ ] } w (k + 1) = w (k ) − µ y (k ) − 1 ⋅ y (k )x(k ) 2 (II.25) Se definirmos o “erro” do algoritmo como sendo a expressão [ 2 ] e∗ ( k ) = y ( k ) − 1 ⋅ y ( k ) (II.26) ao substituí-lo em (II.25) obtemos uma expressão equivalente à do LMS (Eq. II.13) w ( k + 1) = w ( k ) − µe∗ ( k )x( k ) (II.27) O algoritmo foi desenvolvido como uma solução para corrigir a modulação AM incidental provocada pelo desvanecimento em sinais de rádio. Seus autores demonstram que se o filtro conseguir eliminar a modulação AM, necessariamente o desvanecimento causado pelo multipercurso estará sendo corrigido. Demonstra-se também que os coeficientes ótimos do CMA convergem para a solução de Wiener se o erro e o sinal de saída forem estatisticamente independentes, da forma como segue. Se supusermos que a saída pode ser representada como y ( k ) = e( k ) + y 0 ( k ) (II.28) onde y 0 (k ) é um sinal de módulo unitário e e(k) possui módulo muito menor que um, então demonstra-se [Treichler e Agee, 1983] que a função custo pode ser escrita como ψ 22 = { } { } 1 1 2 2 E e( k ) + E e( k ) cos( 2φ ) 2 2 (II.29) onde φ é o ângulo existente entre os complexos y 0 (k ) e e(k). Se esses dois processos forem estatisticamente independentes entre si, o segundo termo de (II.29) é zero e então: 16 ψ 22 = { 1 2 E e( k ) 2 } (II.30) Ou seja, ψ 22 reduz-se à função MSE na iminência da convergência do algoritmo CMA (o módulo de e(k) é muito menor que um) e, portanto, sua minimização leva à solução de Wiener. II.4 Processamento Espacial com Arrays de Antenas Podemos dizer que a evolução histórica das pesquisas sobre arrays de antenas ocorreu em dois ramos distintos, na forma de um “Y”. No primeiro ramo o objetivo principal é cancelar interferentes em sinais de radares e sonares. A ação do desvanecimento nesses sistemas é pequena, já que nas comunicações por radar sempre há uma linha de visada entre a antena e o objeto desejado, onde o sinal desejado é forte. No segundo ramo do “Y” encontram-se os pesquisadores interessados na melhoria da qualidade dos sinais de rádio, corrompidos por desvanecimento. Foi na década de 1920 que se descobriu que a propagação em multipercurso provoca um tipo de ruído (em inglês, fading) que desvanece o sinal de rádio [Romano e Brandão, 1997]. A partir daí e com a crescente popularização do rádio, intensificaram-se as buscas de soluções para esse problema. É até de certo modo intuitivo pensar em uma solução onde se tenha a liberdade de escolher, entre dois ou mais sinais disponíveis, aquele que é menos afetado pelo desvanecimento, ou numa outra em que se possa de alguma forma combinar esses sinais para que o sinal resultante seja o mais próximo possível do sinal ótimo segundo um critério pré-determinado. As soluções propostas por esse ramo de pesquisas utilizaram esse tipo de técnica, denominada diversidade, tanto em nível temporal, como espacial ou freqüencial [Brandão, 1995]. A evolução das técnicas de diversidade espacial levou esse último ramo a encontrar-se 17 com o primeiro, formando o ramo inferior do “Y”. O interesse despertado por institutos de pesquisa e empresas do setor em utilizar os resultados dessas pesquisas para resolver problemas em sistemas móveis celulares foi o elemento atrativo entre ambos. A partir de então os arrays de antenas têm sido vistos como boa alternativa para solução de alguns dos problemas mais críticos presentes nesses sistemas, como combate ao desvanecimento e à interferência co-canal, com conseqüente aumento de capacidade (número de usuários por célula). Antes de descrevermos as técnicas desenvolvidas em ambos os ramos, apresentaremos um modelo de sinais, utilizado ao longo de todo o texto. II.5 Modelo de Sinais A Figura I.2 representa um array de antenas linear e uniforme (os elementos estão dispostos em linha reta e equidistantes) de N elementos captando dois sinais provenientes de fontes pontuais distintas. O meio é considerado isotrópico e não dispersivo, de forma que as ondas propagam-se em linhas retas. Considera-se também que as fontes de sinais estão localizadas longe o bastante de maneira que a radiação incidente no array é uma soma de ondas planas. No referencial espacial onde o array se encontra, a elevação (coordenada no eixo ‘z’) é desprezada, de tal forma que a direção de chegada dos sinais reduz-se a uma variável unidimensional ϕ [− π , π ] . Podemos representar a k-ésima amostra do i-ésimo sinal incidente no array em notação complexa como si ( k ) = c( k ) ⋅ e j ( ωk +φ ( k ) ) (II.31) onde c(k) e φ ( k ) são, respectivamente, o módulo e a fase do sinal e ω é a freqüência angular da portadora. 18 Para o caso de arrays onde a separação entre os elementos é menor do que a distância coerente do array1, podemos descrever o sinal na saída do n-ésimo elemento, considerandose I sinais incidentes, cada um com direção de chegada ϕ i , 1 ≤ i ≤ I , como I x n (k ) = ∑ a n (ϕ i ) ⋅ si (k )e j ( f n (ϕi ) ) (II.32) i =1 onde a n (ϕ i ) é a resposta complexa do n-ésimo elemento do array na direção ϕ i e f n (ϕ i ) é uma função dependente da geometria do array que explicita a fase acrescida ao sinal no nésimo elemento, em relação à fase do sinal no elemento de referência (geralmente o primeiro), pelo fato dele incidir na direção ϕ i . Por exemplo, para um array linear uniforme (Fig. II.4) f n (ϕ i ) = −2πn d senϕ i λ (II.33) onde d é a distância entre elementos e λ é o comprimento de onda na freqüência ω . Podemos reescrever (II.32) em notação matricial para podermos considerar conjuntamente todos os N elementos e todos os I sinais incidentes, na seguinte forma x( k ) = A (ϕ )s( k ) + n( k ) (II.34) onde ϕ = [ϕ1 ϕ2 1 e ϕI ] T (II.35) Distância máxima para a qual os sinais nos elementos do array ainda mantêm correlação entre si [Papadias e Paulraj, 1997]. As técnicas de arrays de antenas que foram originalmente desenvolvidas para aplicações em radares geralmente utilizam arrays confinados à distância coerente. No entanto, as técnicas que empregam diversidade utilizam arrays onde os elementos encontram-se separados por distâncias maiores (geralmente muito maiores) que a distância coerente pois para que haja diversidade de sinais é necessário que eles não mantenham correlação entre si. 19 sinal desejado dsenϕd ϕd ... d d 1 2 d 3 4 N Figura II.4 - Representação parcial de um array linear onde percebe-se o atraso de fase do sinal no elemento 3 em relação ao do elemento 4 devido à direção de chegada do sinal desejado e ao espaçamento entre os elementos e [ s( k ) = s1 ( k ) s2 ( k ) f sI ( k ) ] T (II.36) n(k) é um vetor de dimensão N representando o ruído térmico aditivo. A(ϕ ) ( N × I ) é uma matriz cujas colunas são os vetores que representam a resposta do array a cada uma das I direções de chegada dos sinais, ou seja A(ϕ ) = [a(ϕ1 ) a(ϕ 2 ) g a(ϕ I )] (II.37) onde [ a(ϕ i ) = a1 (ϕ i ) ⋅ e j⋅ f1 (ϕi ) a 2 (ϕ i ) ⋅ e j⋅ f 2 (ϕi ) h a N (ϕ i ) ⋅ e j⋅ f N (ϕi ) ] T (II.38) Os vetores a(ϕ i ), 1 ≤ i ≤ I , chamados de vetores de direcionamento ou de propagação do array [Litva e Lo, 1996], são elementos de um conjunto denominado array manifold, que chamaremos de i , composto pelos vetores de direcionamento associados a todos os valores possíveis de ϕ i no intervalo [− π ,π ] . j é determinado pela diretividade dos elementos do 20 array e por sua geometria e pode ser calculado a partir de calibrações. Consideremos agora um array linear genérico de N elementos omnidirecionais, como representado na Figura II.4, onde incidem um sinal desejado segundo um ângulo ϕ d e um sinal interferente segundo um ângulo ϕ i , que não está sendo mostrado para não prejudicar a clareza da Figura. Além disso há a presença de ruído aditivo. Neste caso s(k) possui dimensão dois e o sinal de entrada do array (sinal captado por seus elementos) pode ser representado como uma somatória de três componentes x( k ) = x d ( k ) + x i ( k ) + x n ( k ) (II.39) onde x( k ) = [ x1 ( k ) x2 ( k ) x d ( k ) = [ x1d ( k ) k x2d ( k ) x i ( k ) = [ x1i ( k ) x 2i ( k ) x n ( k ) = [ x1n ( k ) x2n ( k ) x N ( k )] é o sinal de entrada do array, m T l x Nd ( k )] é a contribuição devida ao sinal desejado, T x Ni ( k )] é a contribuição devida ao interferente e n T x Nn ( k )] é a contribuição devida ao ruído. T Supondo que o sinal desejado seja uma portadora cuja amplitude não é distorcida pelo array, os elementos do vetor x d ( k ) podem ser representados como x1d ( k ) = Ad e j (ωd k + f1 (ϕd ) ) (II.40) x Nd ( k ) = Ad e j (ωd k + f N (ϕd ) ) (II.41) o onde Ad é a amplitude do sinal desejado, ω d é a freqüência angular da portadora e f n (ϕ d ) é dado por (II.33). A partir de (II.39), (II.40) e (II.41) podemos expressar x d na seguinte forma 21 x d ( k ) = Aa (ϕ d ) (II.42) A = Ad e j (ω d k ) (II.43) onde e o vetor a(ϕ d ) é dado por (II.38). A partir de (II.2) e de (II.39) podemos representar a saída do array como y( k ) = w T x d ( k ) + w T x i ( k ) + w T x n ( k ) (II.44) Ou seja, podemos decompor também o sinal de saída em três componentes y ( k ) = y d ( k ) + yi ( k ) + y n ( k ) (II.45) II.6 Discussão Neste capítulo apresentamos os princípios básicos da teoria de filtragem adaptaiva, incluindo alguns dos algoritmos mais utilizados. Um modelo de sinais foi definido e será utilizado nos próximos capítulos, dedicados à exposição das principais técnicas de arrays de antenas conhecidas. O Capítulo III aborda as técnicas desenvolvidas inicialmente para serem aplicadas em radares e sonares. 22 p0p0p0q r @:BCsEtu>Hv>=wxs O italiano Guglielmo Marconi (1874 - 1937), além de pai do rádio, é considerado também o mentor do radar. Foi em uma palestra por ele ministrada em Nova York em 1922 que se lançaram as primeiras idéias para sua posterior invenção [Romano e Brandão, 1997]. Desde as primeiras implementações, na década de 1940, os militares enxergavam no radar um interessante instrumento de apoio à guerra, principalmente aérea, que começava a se modernizar. Assim grandes investimentos foram feitos em pesquisas, na sua grande maioria sigilosas, para promover seu aperfeiçoamento. Ao fim da Segunda Grande Guerra, quando o conteúdo dessas pesquisas foi revelado à comunidade científica internacional, o radar possuía uma tecnologia já bastante desenvolvida, utilizando arrays de antenas para cancelamento de interferentes, o que propiciou o surgimento do primeiro array adaptativo já na década de 1950 (array de Bartlett), poucos anos depois do trabalho teórico de Wiener (1949). Segundo William Gabriel [Gabriel, 1992], a primeira compilação das pesquisas desse ramo foi publicada na edição especial da revista IEEE Transactions on Antennas and Propagation de março de 1964 [IEEE, 1964]. Essas primeiras antenas eram baseadas em esquemas de redes de Phase Locked Loops (PLLs) para se conseguir arrays de foco automático. Doze anos depois, essa mesma revista publicou sua segunda edição especial sobre o tema [IEEE, 1976]. A grande diferença foi a introdução da capacidade dos arrays de cancelarem interferências adaptativamente, através da conformação dos seus padrões de irradiação. Mais dez anos e a mesma Transaction publicou sua terceira edição especial em março de 1986 [IEEE, 1986], incluindo a capacidade dos arrays de realizarem estimações espectrais (de direção de chegada dos sinais) de alta resolução, descritas no Capítulo IV. 23 Iremos a seguir descrever os princípios de funcionamento de alguns desses arrays, começando pelo array de Applebaum. III.1 O Array de Applebaum Desenvolvido por Paul Howells na década de 1950, foi posteriormente aperfeiçoado por Howells e Sidney Applebaum e publicado na chamada literatura “aberta” (da sociedade civil) somente em 1976 [Applebaum, 1976]. A Figura III.1 reproduz um esquema de como foi concebido originalmente [Gabriel, 1992]. Um sinal interferente é captado por todos os elementos do array auxiliar com igual amplitude e com fase que depende da sua direção de chegada. A diferença entre o sinal captado pela antena principal e o sinal captado pelo array auxiliar é realimentada no array auxiliar, onde é correlacionado com o interferente. O resultado é utilizado para alterar a fase na saída de cada elemento e produzir assim um lóbulo secundário direcionado ao interferente. A antena principal, geralmente uma única antena de alto ganho, possui resposta direcionada ao sinal desejado. Subtraindo-se as duas respostas, um nulo é criado na direção do interferente. Apesar da Figura III.1 exprimir a concepção original do array de Applebaum, a construção de uma estrutura como essa não é necessária para otimizar a função custo desejada (maximização da SINR de saída), já que este é um problema que, com a evolução dos computadores, pode ser resolvido por intermédio de um algoritmo adaptativo. Ou seja, a complexidade do array da Figura III.1 pode ser transferida, por assim dizer, para o algoritmo, simplificando a estrutura física do array, que agora pode ser tão simples quanto a da Figura I.2. 24 array auxiliar de N - 1 elementos antena principal ... correlacionadores ∆ ... deslocador de fase misturadores Σ + Σ - saída Figura III.1 - Concepção original do array de Howells/Applebaum O array de Applebaum utiliza como função custo a maximização da relação entre a potência do sinal desejado e a potência do interferente somada à potência do ruído (SINR) na saída do array. Utilizando (II.45) podemos descrever matematicamente as potências do sinal desejado, do interferente e do ruído na saída do array, respectivamente, como Pd = [ [ ] 2 1 1 2 E yd ( k ) = E w Hx d ( k ) 2 2 [ ] [ [ ] [ ] ] Pi = 2 1 1 2 E yi ( k ) = E w Hxi ( k ) 2 2 Pn = 2 1 1 2 E yn ( k ) = E w Hx n ( k ) 2 2 (III.1) (III.2) ] (III.3) A relação SINR pode então ser escrita a partir dessas equações como sendo 25 SINR = Pd Pi + Pn (III.4) Utilizando (II.42) e (III.1), podemos calcular a expressão da potência do sinal desejado na saída do array, obtendo [ ] 2 1 E Aw Ha (ϕd ) 2 2 1 2 = E A w Ha (ϕd ) 2 Pd = [ ] (III.5) onde a(ϕ d ) é o vetor de direcionamento do sinal desejado, dado em (II.38). Considerando w(k) e x(k) vetores complexos, o denominador de (III.4) pode ser calculado como Pi + Pn = = = = = {[ ]} ] [ 1 2 2 E w H ( k )x i ( k ) + E w H ( k )x n ( k ) 2 1 E w H ( k )x *i ( k )x iT ( k ) w ( k ) + E w H ( k )x *n ( k )x Tn ( k ) w ( k ) 2 1 H w ( k ) E x i ( k )x iH ( k ) w ( k ) + w H ( k ) E x n ( k )x nH ( k ) w ( k ) 2 1 H w ( k )R ii w ( k ) + w H ( k )R xx w ( k )} { 2 1 H w ( k )R uu w ( k ) 2 {[ { ]} ] [ [ ] [ ] } (III.6) onde w H é o conjugado transposto de w, R ii = E[x i ( k )x iH ( k )] é a matriz de autocorrelação da entrada devido ao interferente, R nn = E[x n ( k )x nH ( k )] é a matriz de autocorrelação da entrada devido ao ruído e R uu = R ii + R nn é a matriz de autocorrelação da entrada devido aos sinais indesejados 26 (interferente e ruído). Para que pudéssemos representar a matriz R uu como a soma das matrizes R ii e R nn , consideramos que o ruído e o interferente são sinais descorrelacionados e de média nula. Finalmente, substituindo (III.6) e (III.5) em (III.4), chegamos à expressão da função custo do array de Applebaum w H ( k )a (ϕ d ) [ ]w SINR = E A 2 H 2 ( k )R uu w ( k ) (III.7) Pode-se demonstrar que o vetor de coeficientes ótimo que maximiza a expressão acima é dado por (ver [Compton, 1988]) −1 w opt = µR uu a (ϕ d ) (III.8) −1 w opt = µR xx a (ϕ d ) (III.9) que é equivalente a A equivalência entre (III.8) e (III.9) se deve a dois motivos. O primeiro deles é que −1 −1 R uu a (ϕ d ) é um múltiplo escalar de R xx a (ϕ d ) , como demonstrado em [Compton, 1988, pág. 50]. Além disso, em sistemas de radares o sinal desejado é presente durante um tempo muito pequeno em relação ao tempo total de varredura do radar, de tal forma que a matriz de autocorrelação do sinal de entrada é praticamente igual à matriz de autocorrelação dos sinais indesejados [Compton, 1988]. Ou seja, nesse caso, R xx ≈ R uu . Trabalhando com sinais contínuos no tempo, Applebaum sugere o loop da Figura III.2 como meio para produzir o vetor ótimo de (III.9) [Applebaum, 1976]. A equação característica do loop é dada por 27 x(t ) y (t ) transposto w µ s complexo conjugado + − a ∗ (ϕ d ) Figura III.2 - Loop proposto em [Applebaum, 1976] dw ( t ) = µ[a ∗ (ϕ d ) − x ∗ (t ) y (t )] dt (III.10) Substituindo y (t ) = x T (t ) w (t ) em (III.10) obtemos dw ( t ) + µx ∗ (t )x T (t ) w (t ) = µa ∗ (ϕ d ) dt (III.11) y Fazendo a aproximação estocástica R xx = x ∗ (t )x T (t ) e substituindo-a em (III.11), vem dw ( t ) + µR xx w (t ) = µa ∗ (ϕd ) dt (III.12) onde µ é uma constante arbitrária. A solução de regime permanente de (III.12) é dada por −1 ∗ w (t ) = R xx a (ϕd ) (III.13) A expressão iterativa para atualização dos coeficientes do array pode ser deduzida discretizando-se (III.12), ou seja, substituindo w(t) por w(k) e a derivada dw(t)/dt pela 28 diferença dw (t ) w ( k + 1) − w ( k ) = dt T (III.14) onde T é o período de amostragem. Realizando as substituições sugeridas, obtemos a seguinte expressão iterativa para o array de Applebaum w ( k + 1) + [ µR xx − I]w ( k ) = µa ∗ (ϕ d ) (III.15) onde o produto µT foi substituído por uma nova constante µ , que nessa expressão é o passo de adaptação. A Figura III.3 mostra os padrões de irradiação após convergência dos coeficientes de um array de Applebaum linear de três elementos separados por uma distância λ / 2 . A direção de z chegada do sinal desejado é 30 , o passo de adaptação é de um centésimo, a relação sinal/ruído (SNR) de entrada é 10 dB e foram realizadas 1000 iterações. O padrão da Figura III.3(a) foi obtido numa situação sem interferentes, ao passo que na Figura III.3(b) o ambiente simulado continha um sinal interferente, de mesma potência que o sinal desejado (SIR = 0dB), { incidindo no array na direção 90 . Como percebemos da Figura III.3, os padrões de irradiação são simétricos em relação ao eixo (90°, 270°). Esta é uma característica inerente aos arrays lineares, não acontecendo, por exemplo, em arrays circulares [Litva, 1997]. 29 90 90 0.942 120 60 1.0122 120 60 0.80978 0.7065 0.60734 0.471 150 30 150 30 0.40489 0.2355 0.20245 180 0 330 210 240 300 180 0 330 210 240 300 270 270 (a) } (b) | Figura III.3 - Padrões de irradiação de um array de Applebaum. A direção do sinal desejado é 30 . (a) sem interferentes e (b) com interferente em 90 . O array de Applebaum é simples e não requer sinal de referência, o que exigiria um conhecimento estatístico mínimo a respeito do sinal de entrada x(k) para gerá-lo. Também não é necessário o conhecimento exato da matriz de autocorrelação R xx , que pode ser estimada por uma aproximação estocástica. Porém no array de Applebaum é necessário o conhecimento da direção de chegada do sinal desejado para que se possa determinar o vetor de direcionamento a(ϕ d ) . Nos sistemas que utilizam radares, para os quais o array foi originalmente concebido, esta é uma complicação contornável uma vez que o sinal recebido é a reflexão de um sinal transmitido anteriormente. Uma opção para o array de Applebaum em que não é necessário conhecer a direção de chegada do sinal desejado é o array com sinal piloto, publicado em [Widrow et. al., 1967] e desenvolvido como uma aplicação para o algoritmo LMS, criado por Widrow e Hoff pouco tempo antes. 30 III.2 O Array com Sinal Piloto O array desenvolvido pela equipe de Widrow utiliza o mesmo algoritmo LMS apresentado no capítulo II, cuja expressão iterativa de atualização dos coeficientes é dada em (II.13). A estrutura do array com sinal piloto corresponde à configuração geral do filtro adaptativo espacial mostrado na Figura II.1. Podemos identificar a diferença prática entre o array de Applebaum e o array com sinal piloto. No array de Applebaum necessitamos conhecer a direção de chegada do sinal desejado, informação que não é necessária ao array com sinal piloto que, no entanto, necessita de um sinal de referência (piloto) para “treinar” o array. A Figura III.4 representa a evolução do padrão de irradiação durante o processo de adaptação de um array LMS uniforme e linear de 2 elementos. O sinal desejado é monocromático com potência σ d2 = 1 e possui direção de chegada (DOA - Direction of ~ Arrival) ϕ d = 30 . O sinal piloto é uma réplica do sinal desejado. Um interferente também monocromático, de mesma freqüência que o sinal desejado e com potência 10 dB menor incide no array na direção ϕ i = 90 . O passo de adaptação adotado foi de um centésimo e o algoritmo demorou 5000 iterações para convergir. A Figura III.4(a) representa o padrão de irradiação no início do processo de adaptação. Na Figura III.4(b) estamos com 33% do processo concluído e a Figura III.4(c) representa o padrão de irradiação na convergência do algoritmo. Percebemos que o interferente foi cancelado sem que o array conhecesse sua direção de chegada. 31 90 90 0.019134 120 1.206 120 60 60 0.014351 0.0095671 150 0.60298 150 30 30 0.0047835 180 180 0 210 210 330 240 0 330 240 300 300 270 270 (a) (b) 90 1.4054 120 60 0.70269 150 30 180 0 330 210 300 240 270 (c) Figura III.4 - Processo de adaptação de um array linear de 2 elementos com sinal piloto. O sinal desejado possui direção 30 e o interferente, 90 . (a) início do processo de adaptação; (b) a 67% da convergência; (c) padrão final Outros arrays, como aqueles que iremos mostrar nas próximas seções, possuem performance melhor que a do array com sinal piloto ou mesmo são mais fáceis de implementar, mas o array com sinal piloto foi importante para dar sustentação ao surgimento de outras tecnologias. Sua principal desvantagem está na necessidade de geração de um sinal piloto correlacionado com o sinal desejado, cujas propriedades estatísticas nem sempre são conhecidas. 32 O array que Griffiths desenvolveu contorna este problema e possui solução que também é a melhor estimação do sinal desejado no sentido de minimização do erro quadrático. III.3 O Array de Griffiths A idéia central dessa estrutura, proposta em [Griffiths, 1969] é eliminar o sinal piloto do array de Widrow uma vez que se conhece (ou estima-se) a correlação cruzada entre o sinal na entrada do array e o sinal desejado. Griffiths partiu de um simples rearranjo na expressão do algoritmo LMS para derivar a expressão do seu algoritmo. O algoritmo LMS é dado pela Equação (II.13), reproduzida aqui para facilitar o raciocínio w ( k + 1) = w ( k ) + 2 µe∗ ( k )x( k ) (III.16) Expandindo nessa expressão o erro e(k) entre a saída e o sinal de referência, temos w ( k + 1) = w ( k ) + 2 µ[d ( k ) − y ( k )] x( k ) ∗ = w ( k ) + 2 µd ∗ ( k ) x ( k ) − 2 µy ∗ ( k ) x ( k ) (III.17) Substituindo o valor instantâneo d*(k)x(k) pela correlação cruzada entre o sinal de entrada e o sinal de referência, rdx = E[ d ∗ ( k )x( k )] , chegamos à expressão final do algoritmo de Griffiths w ( k + 1) = w ( k ) + 2 µrdx − 2 µy ∗ ( k )x( k ) (III.18) Pode-se demonstrar (ver [Widrow e Stearns, 1985]) que o valor esperado do vetor de coeficientes após a convergência do algoritmo é dado pela solução de Wiener, ou seja 33 lim E[ w ( k )] = R −xx1rdx (III.19) k →∞ A Fig. III.5 mostra um esquema para implementação do array. O conjunto de atrasadores serve para posicionar o lóbulo principal na direção do sinal desejado. Portanto, à semelhança do array de Applebaum, no array de Griffiths é necessário conhecer a direção de chegada do sinal desejado, além da correlação cruzada entre o sinal de entrada e a referência. ∆ ∆ x1(k) w1 x2(k) w2 Σ y(k) ... ... ∆ xN(k) wN ... w(k +1) = w(k) + 2µrdx − 2µy(k)x(k) Figura III.5 - O array de Griffiths III.4 O Array de Frost O array de Frost [Frost, 1972] foi a primeira implementação de um algoritmo adaptativo com restrições. Partindo do princípio de minimização da potência (ou variância) do sinal de saída, uma restrição é imposta para que seja mantida uma determinada resposta de amplitude constante e fase linear na direção e na banda do sinal desejado. Não houvesse a restrição e o array “desligaria” pela anulação dos seus coeficientes, já que desta forma a potência de saída estaria minimizada. Com a restrição fica garantida a manutenção do sinal desejado na saída, ao mesmo tempo em que os interferentes e ruídos são cancelados. O problema de 34 minimização restrita resolvido por Frost é denominado LCMV (de Linear Constrained Minimum Variance). A restrição imposta pelo algoritmo pode ser representada pela equação CH w ( k ) = g (III.20) onde C é a matriz de restrições, que, para um array de N elementos onde há K restrições, possui dimensão NxK. g (Kx1) é o vetor de resposta do array a cada restrição. C contém as informações sobre freqüência e ângulo de chegada do sinal (sobre formação da matriz de restrições, consultar [Resende, 1996]). Como exemplo simples de projeto de restrição, podemos desejar que um array uniforme e linear possua resposta unitária na direção de chegada do sinal desejado, ϕ d . A matriz de restrições irá reduzir-se então a um vetor de direcionamento, ou seja [ C = e j ⋅ f 1 (ϕ d ) e j ⋅ f 2 (ϕ d ) e j ⋅ f N (ϕ d ) ] T (III.21) onde f n (ϕ d ) foi definido em (II.33). Nesse caso o vetor de resposta do array será um escalar unitário, ou seja, g = 1. Como dissemos, o array de Frost tem como intuito minimizar a potência de saída, que pode ser escrita como [ ] 1 2 E y( k ) 2 1 = E[ w H ( k )x( k )x H ( k ) w ( k )] 2 1 = w H (k)E[x( k )x H ( k )]w ( k ) 2 1 = w H ( k )R xx w ( k ) 2 P= (III.22) 35 O objetivo do array de Frost é, dessa forma, w 1 H w ( k )R xx w ( k ) 2 (III.23a) sujeito a CH w = g (III.23b) min P = A partir de (III.23) utiliza-se o método dos multiplicadores de Lagrange (ver [Haykin, 1996]) para determinar a função custo ψ a ser minimizada, obtendo-se ψ = { } 1 H w ( k )R xx w ( k ) + Re λH ( CH w ( k ) − g) 2 (III.24) onde λ é o vetor de multiplicadores de Lagrange. Para encontrarmos o mínimo de ψ , calculamos seu gradiente e igualamos a zero, obtendo a seguinte equação em w(k) ∇ w (ψ ) = R xx w ( k ) + CλH = 0 (III.25) cuja solução é −1 w opt = −R xx CλH (III.26) Para eliminarmos o multiplicador de Lagrange da expressão do vetor de coeficientes ótimo, substituimos (III.26) em (III.24) e obtemos −1 H CH w opt = −CH R xx λ C=g (III.27) Isolando λ na equação acima obtemos −1 λ = −( CH R xx C) g −1 (III.28) 36 Substituindo (III.28) em (III.26) obtemos a expresão final para o vetor de coeficientes ótimo −1 −1 w opt = R xx C(CHR xx C) g −1 (III.29) O algoritmo iterativo de atualização dos coeficientes utiliza o método da descida mais íngrime, ou seja w ( k + 1) = w ( k ) − µ∇ w (ψ ) (III.30) = w ( k ) − µ[R xx w ( k ) + CλH ( k ) ] Como a restrição deve ser sempre mantida, a seguinte equação deve ser verdadeira: g = CH w ( k + 1) (III.31) = CH w ( k ) − µCH R xx w ( k ) − µCH CλH ( k ) Isolando λ ( k ) em (III.31), vem λ ( k ) = ( µCHC) [CH w ( k ) − µCH R xx w ( k ) − g] −1 (III.32) Substituindo (III.32) em (III.30), obtemos a expressão final do algoritmo de Frost [ ] w ( k + 1) = w ( k ) − µ I − C( CH C) CH R xx w ( k ) + C( CH C) −1 −1 [g − C H w ( k )] (III.33) É importante salientar que há uma grande flexibilidade para o projeto do vetor de restrições. Suponha como exemplo que se queira, além de uma determinada resposta do array na direção do sinal desejado, cancelar um interferente que possui uma direção de chegada conhecida. Uma restrição possível que atende essas condições pode ser escrita na forma 37 c T g T w(k ) = 0 i (III.34) onde i é o vetor contendo as informações sobre o interferente que se quer cancelar. A Figura III.7(a) abaixo mostra o padrão de irradiação de um array de Frost de 2 elementos. A restrição imposta foi de que a resposta na direção de chegada do sinal desejado ( ϕ d = 30 ) fosse unitária. Ou seja, g = 1. A SNR de entrada é de 10 dB. A Figura III.7(b) mostra o padrão de irradiação do mesmo array, agora com um sinal interferente na direção ϕ i = 120 e com potência 10 dB maior que a do desejado. 90 90 0.99971 120 60 1.5166 60 120 0.74979 1.0111 0.49986 150 30 150 30 0.50554 0.24993 180 0 210 180 330 210 300 240 0 330 240 300 270 270 (a) (b) Figura III.7 - Padrões de irradiação de um array de Frost com sinal desejado em 30 . Em (b) há um interferente na direção 120 com potência 10dB maior. O algoritmo de Frost, apesar de ter carga computacional maior que as dos outros algoritmos até agora mencionados, possui flexibilidade para o projeto das restrições, aumentando a variedade de aplicações em que pode ser utilizado. Em 1982 Griffiths e Jim [Griffiths e Jim, 1982] propuseram uma alternativa ao array de Frost de implementação mais simples que passou a ser chamada de GSC (generalized sidelobe canceller). Este é o tema abordado na próxima seção. 38 III.5 O GSC No GSC (Generalized Sidelobe Canceller) as restrições não são incorporadas à adaptação do algoritmo, sendo realizadas por um filtro de coeficientes constantes. Aqui apresentaremos apenas uma visão sistêmica do GSC. Seu desenvolvimento matemático detalhado pode ser encontrado em [Resende, 1996]. A Figura III.8 traz um esquema do GSC. Como no array de Applebaum, os atrasadores de direcionamento servem para posicionar o lóbulo principal do array na direção do sinal desejado. O sinal processado pelo filtro de coeficientes constantes é a somatória das componentes dos sinais na entrada do array que estão em fase com o sinal desejado. O filtro impõe uma determinada resposta do array na direção do sinal desejado, ou seja, uma restrição. Os sinais nas entradas dos filtros transversais adaptativos são formados pelas diferenças par a par das componentes dos sinais de entrada que estão em fase com o sinal desejado, sendo, portanto, constituídos basicamente pelas componentes dos interferentes e ruídos. Estes, após processados, são subtraídos do sinal que possui influência forte do sinal desejado (saída do filtro fixo). O resultado é um erro que é minimizado no sentido LMS para corrigir os valores dos coeficientes dos filtros adaptativos. Griffiths e Jim [Griffiths e Jim, 1982] demonstram que a solução ótima do GSC é a mesma do array de Frost. 39 implementa a restrição do algoritmo Σ + filtro do sinal desejado (fixo) Σ y(k) - + - Σ w1∗ + ... - Σ w2∗ Σ ... + - Σ w∗N −1 e(k) Figura III.8 - O array de Griffiths/Jim (GSC) III.6 O Array de Resende (Algoritmo CFLS) Resende, em 1996, propôs um algoritmo adaptativo recursivo de mínimos quadrados rápido a ser aplicado em arrays onde a função custo apresenta restrições [Resende, 1996]. Foi considerada sua aplicação para resolver tanto o problema de minimização da potência de saída com restrições (o mesmo LCMV do algoritmo de Frost) quanto o de minimização do erro quadrático entre a saída e um sinal de referência (critério de mínimos quadrados), acrescida de restrições. Esta última formulação é chamada de LCID (de Linear Constrained Identifier). A função custo do critério de mínimos quadrados minimiza o erro quadrático, ponderado por um fator de esquecimento 0 < ϕ ≤ 1 [Haykin, 1996]. Para formularmos o problema LCID acrescentamos as restrições, resultando em 40 k min ψ = ∑ ϕ w i =1 k −i k e ( k ) = ∑ ϕ k −i [ d (i ) − w H x(i )] 2 2 (III.35a) i =1 CH w = g sujeito a (III.35b) A restrição representada por (III.35b) é da mesma forma da restrição do algoritmo de Frost, representada por (III.20). ϕ é o fator de esquecimento como no algoritmo RLS, visto anteriormente. A solução ótima de (III.35) é obtida, à maneira do problema LCMV do algoritmo de Frost, pelo método dos multiplicadores de Lagrange, resultando no seguinte vetor de coeficientes [ ] [g − C −1 −1 −1 w opt ( k ) = R xx ( k )rxd ( k ) + R xx ( k )C C H R xx ( k )C −1 H ] −1 R xx ( k )rxd ( k ) (III.36) onde R xx ( k ) é dado pela Eq. II.14 e rxd ( k ) é dado pela Eq. II.15. Como observado em [Resende, 1996], a solução ótima do problema de minimização restrita é composta de duas componentes. A primeira é a solução ótima do critério de mínimos quadrados, ou seja w sr = R −1 xx rxd (III.37) A segunda é a correção da primeira no sentido de acompanhar as restrições do processo [ ] [g − C −1 −1 w r = R xx C C H R xx C −1 H −1 R xx rxd ] (III.38) w r , por sua vez, é composto de dois fatores. O primeiro é um vetor da mesma dimensão de g representando o erro propriamente dito entre a solução sem restrições e a solução com restrições, dado por −1 e r = g − C H R xx rxd = g − C H w sr (III.39) 41 O segundo é um operador linear que tem como função mapear o erro para o espaço cuja dimensão é a mesma do vetor w sr , representado pela matriz [ ] −1 −1 Q = R xx C C H R xx C −1 (III.40) Uma primeira aproximação para um algoritmo adaptativo que busque resolver o problema formulado em (III.35) pode ser escrita diretamente de (III.36), (III.37) e (III.40), ou seja [ w ( k + 1) = w sr ( k + 1) + Q( k + 1) g − C H w sr ( k + 1) ] (III.41) Para adaptar o conjunto de coeficientes w sr , Resende utiliza o algoritmo de mínimos quadrados rápido (FLS - Fast Least Squares) [Haykin, 1996], obtendo a seguinte formulação w sr ( k + 1) = w sr ( k ) + f ( k + 1) ⋅ esr∗ ( k + 1) (III.42) onde o erro esr(k+1) é definido por esr ( k + 1) = d ∗ ( k + 1) − w srH ( k )x( k + 1) (III.43) e o ganho de adaptação f(k) por f ( k + 1) = −1 R xx ( k )x( k + 1) −1 H ϕ + x ( k + 1)R xx ( k )x( k + 1) (III.44) Para eliminarmos em (III.41) a dependência com a componente não restrita w sr , começamos substituindo (III.42) em (III.41) para obtermos 42 w ( k + 1) = w sr ( k ) + f ( k + 1)d ( k + 1) − f ( k + 1) w srH ( k )x( k + 1) + − Q( k + 1)C H f ( k + 1)d ( k + 1) + Q( k + 1)C H f ( k + 1) w srH ( k )x( k + 1) + (III.45) [ + Q( k + 1) g − C H w sr ( k ) ] Em [Resende, 1996], demonstra-se que a seguinte igualdade é válida: Q( k + 1) = Q( k ) − f ( k + 1)x H ( k + 1)Q( k ) + Q( k + 1)C H f ( k + 1)x T ( k + 1)Q( k ) (III.46) Substituindo (III.46) no último termo de (III.45) e reagrupando alguns termos, temos { ]} [ w ( k + 1) = w sr ( k ) + Q( k ) g − C H w sr ( k ) + f ( k + 1)d ( k + 1) + − Q( k + 1)C H f ( k + 1)d ( k + 1) + { [ ]} − f ( k + 1)x H ( k + 1) w sr ( k ) + Q( k ) g − C H w sr ( k ) + { [ + Q( k + 1)C H f ( k + 1)x H ( k + 1) w sr ( k ) + Q( k ) g − C H w sr ( k ) (III.47) ]} Observando que os termos entre chaves são iguais a w(k) (Eq. III.41), podemos reescrever (III.45), reagrupando-lhe alguns termos, como w ( k + 1) = w ( k ) + f ( k + 1)[ d ( k + 1) − x H ( k + 1) w ( k )] + − Q( k + 1)CH f ( k + 1)[ d ( k + 1) − x H ( k + 1) w ( k )] (III.48) ∗ = w ( k ) + f ( k + 1)e ( k + 1) − Q( k + 1)C f ( k + 1)e ( k + 1) * H onde e( k + 1) = d ∗ ( k + 1) − w H ( k )x( k + 1) (III.49) P( k + 1) = I − Q( k + 1)C H (III.50) Definindo a matriz Podemos reescrever o algoritmo em (III.48) na forma sucinta 43 w ( k + 1) = w ( k ) + P( k + 1)f ( k + 1)e∗ ( k + 1) (III.51) O desenvolvimento realizado até aqui foi para o problema LCID. O problema LCMV, de minimização restrita da potência de saída do array, pode ser representado como min ψ = w k ∑ϕ k −i y (k ) = 2 i =1 sujeito a ∑ ϕ [w k i =1 k −i H x(i )] 2 CH w = g (III.52a) (III.52b) A solução ótima de (III.52) é a mesma do algoritmo de Frost, dada por (III.29), que, ao substituirmos a expressão da matriz Q dada em (III.40), é representada por w opt = Q( k )g (III.53) Para procedermos ao desenvolvimento de um algoritmo iterativo, agimos como no caso LCID e primeiramente escrevemos (III.53) na sua forma temporal w ( k + 1) = Q ( k + 1)g (III.54) Substituimos então a expressão de Q(k+1) dada por (III.46) e da matriz P dada por (III.50) em (III.54), resultando no seguinte algoritmo w ( k + 1) = w ( k ) − P( k + 1)f ( k + 1) w H ( k )x( k + 1) (III.55) O algoritmo representado por (III.51) apresenta um problema de desvio das restrições com o tempo, pois na recursão de w(k) não há menção ao vetor g, que funciona como um corretor para esse desvio. E em ambos os algoritmos (III.51) e (III.55) há perda gradativa das restrições na recursão da matriz Q(k) [Resende, 1996]. Portanto, os algoritmos não são robustos, principalmente em se tratando de longas seqüências de dados. Uma maneira de contornar o problema de desvio das restrições do caso LCID é 44 adicionar, em (III.51), um termo de correção, como foi feito em (III.39). O resultado é w ( k + 1) = w ( k ) + P( k + 1)f ( k + 1)e∗ ( k + 1) + Q( k + 1)[g − CH w ( k )] = w ( k ) − Q( k + 1)CH w ( k ) + P( k + 1)f ( k + 1)e∗ ( k + 1) + Q( k + 1)g (III.56) Rearranjando alguns termos e expandindo a matriz P, obtemos uma forma computacionalmente mais econômica do algoritmo: { } w ( k + 1) = w ( k ) + f ( k + 1)e∗ ( k + 1) + Q( k + 1) g − CH [ w ( k ) + f ( k + 1)e∗ ( k + 1)] (III.57) Finalmente, para resolver o problema de perda gradativa das restrições na atualização da matriz Q(k+1) para ambos os algoritmos, Resende sugere a adição de um termo de correção à matriz, gerando a matriz corrigida Q cor ( k + 1) [Resende, 1996]: Q cor ( k + 1) = Q( k + 1) + C[ CH C] −1 [I − C H Q( k + 1)] (III.58) Os algoritmos desenvolvidos devem ser inicializados segundo o critério de mínimos quadrados. A inicialização adotada por Resende consiste em igualar a zero todas as variáveis, exceto a matriz de autocorrelação R xx , à qual é atribuído, na diagonal principal, um valor inicial positivo E0 [Resende, 1996]. O algoritmo desenvolvido por Resende, denominado CFLS (de Constrained Fast Least Squares), pode ser sumariado, em suas aplicações para os problemas CFLS e LCID num array de banda estreita (somente um coeficiente por elemento), nos seguintes procedimentos: Para o problema LCID (array com sinal piloto restrito) • Inicialização w ( 0) = Q ( 0)g , onde [ ] −1 −1 Q(0) = R xx (0)C CH R xx (0)C −1 e 45 −1 R xx (0) = E0 I • Adaptação • Novos dados no instante k+1: x(k+1) e d(k+1) • Calcular o ganho de adaptação: f ( k + 1) = −1 R xx ( k )x( k + 1) H −1 ϕ + x ( k + 1)R xx ( k )x( k + 1) • A inversa de R xx é calculada como no algoritmo RLS, ou seja [ −1 −1 −1 R xx ( k + 1) = ϕ −1 R xx ( k ) − f ( k + 1)x T ( k + 1)R xx (k ) ] • Atualizar a matriz Q(k): Q(k + 1) = Q cor (k ) − f (k + 1)x H (k + 1)Q cor (k ) + Q cor (k + 1)C H f (k + 1)w srH (k )x(k + 1)Q cor (k ) Q cor ( k ) = Q( k ) + C[ CH C] −1 [I − C H Q( k )] • Calcular o sinal de erro: e( k + 1) = d ∗ ( k + 1) − w H ( k )x( k + 1) • Calcular o próximo vetor de coeficientes: { } w ( k + 1) = w ( k ) + f ( k + 1)e∗ ( k + 1) + Q( k + 1) g − CH [ w ( k ) + f ( k + 1)e∗ ( k + 1)] Para o problema LCMV • Inicialização w ( 0) = Q ( 0)g , onde [ ] −1 −1 Q(0) = R xx (0)C CH R xx (0)C −1 e −1 R xx (0) = E0 I • Adaptação •Novos dados no instante k+1: x(k+1) • Calcular o ganho de adaptação: f ( k + 1) = −1 R xx ( k )x( k + 1) H −1 ϕ + x ( k + 1)R xx ( k )x( k + 1) 46 • A inversa de R xx é calculada como no algoritmo RLS, ou seja [ −1 −1 −1 R xx ( k + 1) = ϕ −1 R xx ( k ) − f ( k + 1)x T ( k + 1)R xx (k ) ] • Atualizar a matriz Q(k): Q(k + 1) = Q cor (k ) − f (k + 1)x H (k + 1)Q cor (k ) + Q cor (k + 1)C H f (k + 1)w srH (k )x(k + 1)Q cor (k ) Q cor ( k ) = Q( k ) + C[ CH C] −1 [I − C H Q( k )] • Calcular o próximo vetor de coeficientes: w ( k + 1) = Q (k + 1)g III.7 Arrays Parcialmente Adaptativos Graus de Liberdade de um Array O número de graus de liberdade de um array é igual ao número de coeficientes menos o número de restrições do algoritmo (sobre restrição, consultar as seções III.4 e III.6). Por exemplo, para um array de Frost com restrição dada por cT w ( k ) = g (III.59) o número de graus de liberdade é N-1 (sendo N o número total de elementos do array), já que existe uma única restrição. Já num array de Frost com restrição c g i w( k ) = 0 (III.60) o número de graus de liberdade é N-2. 47 A quantidade de graus de liberdade de um array determina o número de nulos possíveis no padrão de irradiação, e, por extensão, determina também o número de interferentes que podem ser cancelados. Um array adaptativo de N graus de liberdade pode anular até N-1 interferentes [Widrow e Stearns, 1985]. Arrays Parcialmente Adaptativos A quantidade de operações necessárias para realizar um passo de adaptação dos coeficientes de um array depende do número de coeficientes N. Para um caso em que N é grande pode haver prejuízo de performance ou mesmo inviabilização do array devido ao excessivo tempo gasto na computação do algoritmo. Uma alternativa para resolver esse problema sem que seja necessário diminuir o número de coeficientes é utilizar somente um sub-conjunto deles no algoritmo adaptativo, ou seja utilizar um número de graus de liberdade menor que o disponível no array. Um array totalmente adaptativo utiliza todos os seus coeficientes no processo de adaptação, enquanto que um array parcialmente adaptativo utiliza somente um sub-conjunto deles. Um array parcialmente adaptativo consome menos recursos computacionais e tem convergência mais rápida que um array totalmente adaptativo. Podemos representar a diminuição do número de graus de liberdade pela introdução de uma transformação linear no vetor de entrada do array: x p ( k ) = T T x( k ) (III.61) onde x p ( k ) é o novo vetor de entrada do array, que incorpora a redução do número de graus de liberdade dada pela transformação linear T. Para definição da matriz T utiliza-se comumente uma técnica denominada de técnica do 48 espaço de elementos, onde seleciona-se somente uma parte dos elementos do array para terem seus coeficientes controlados pelo algoritmo adaptativo. O restante dos coeficientes permanecem fixos. Neste caso T é uma matriz esparsa de L ≤ N colunas, sendo L o número de elementos do array que se quer utilizar, cada uma contendo somente um elemento unitário (relativo à posição, no array, do elemento que se quer utilizar), sendo que todos os outros são iguais a zero. Segue de (III.61) que a matriz de autocorrelação do vetor de entrada num array parcialmente adaptativo é dada por [ ] R pp = E x p x tp = T t R xx T (III.62) Utilizando no algoritmo adaptativo o vetor de entrada do array como dado pela transformação (III.61), qualquer um dos algoritmos apresentados nas seções anteriores pode ser utilizado. III.8 Sumário Neste capítulo apresentamos alguns dos principais algoritmos de arrays adaptativos já desenvolvidos. Procuramos esclarecer não só seus princípios de funcionamento mas também as diferenças que existem entre cada um. Com isso estaremos mais capacitados para estabelecer o domínio possível de aplicação de cada array. O próximo capítulo é sobre técnicas de estimação de direção de chegada de sinais. Estas técnicas são úteis para viabilizar a aplicação dos algoritmos que necessitam conhecer as direções de chegada dos sinais, como, por exemplo, os arrays de Frost, Applebaum e Resende. Apesar de se tratar de um assunto intimamente relacionado ao deste capítulo, optamos por escrevê-lo em um capítulo em separado pois achamos que essa atitude contribuiu para uma maior clareza do texto, já que o Capítulo III por si só já é bastante extenso. 49 0 MA:u77u:u7 337 M¡3 Os arrays adaptativos cujos algoritmos requerem o conhecimento a priori da direção de chegada do sinal desejado (por exemplo, os arrays de Applebaum, de Frost e de Resende) não são de imediata implementação em ambientes de comunicações móveis. Isso se deve à impossibilidade de se adquirir essa informação, já que os móveis possuem trajetórias aleatórias nas células e o efeito de multipercurso gera cópias do sinal que chegam ao receptor segundo direções diferentes da do sinal transmitido. Para viabilizar a aplicação desses algoritmos em sistemas de comunicações móveis, alguns trabalhos, como [Klouche-Djedid e Fujita, 1996] e [Anderson et. al., 1991], têm considerado o emprego de técnicas para estimação das direções de chegada do sinal desejado. As técnicas de estimação de direção de chegada de sinais fazem parte das soluções dadas para problemas de estimação de parâmetros, há longo tempo estudados por matemáticos e estatísticos [Krim e Viberg, 1996]. Essas técnicas tiveram no processamento espaçotemporal realizado com arrays de antenas uma base consistente para viabilizar suas aplicações. Os métodos de estimação de parâmetros utilizando arrays de antenas tiveram suas primeiras aplicações na localização de fontes de sinal em radares e sonares utilizando técnicas de arrays formadores de feixes. Esses métodos mostram-se limitados para aplicações que exigem alta resolução de estimação, como em comunicações pessoais e comunicações via 50 satélite, uma vez que suas performances são diretamente dependentes do tamanho físico (abertura) do array, o que acaba por restringir a resolução dos algoritmos. A introdução de técnicas de estimação baseadas em subespaços proporcionou o surgimento de algoritmos de alta resolução. Neste Capítulo descreveremos resumidamente algumas das técnicas de estimação de parâmetros. Iniciaremos pelas técnicas baseadas nos arrays formadores de feixes (já descritos anteriormente no Capítulo III), passando posteriormente para as técnicas de decomposição em subespaços. Esses dois conjuntos formam um superconjunto de algoritmos baseados em espectros, onde estão contidos os algoritmos de menor custo computacional, entre eles o popular MUSIC. Depois descreveremos alguns dos métodos paramétricos, que são, em geral, computacionalmente muito complexos, mas apresentam melhor resolução e suas performances são menos dependentes do número de amostras analisadas. Antes da descrição dos algoritmos vamos dedicar algumas linhas à fatoração espectral da matriz de autocorrelação do sinal de entrada do array, necessária ao desenvolvimento matemático dos algoritmos. IV.1 Fatoração Espectral de R xx Segundo o modelo de sinais descrito no Capítulo II, o vetor dos sinais nas saídas dos elementos do array é descrito como x(k ) = A(ϕ ) ⋅ s(k ) + n(k ) (IV.1) Nos algoritmos de estimação que iremos apresentar os sinais são considerados de faixa estreita. A função de autocorrelação de x(k), considerando que o ruído é descorrelacionado do sinal, é 51 [ ] [ ] [ R xx = E x( k )x H ( k ) = AE s( k )s H ( k ) A H + E n( k )n H ( k ) ] (IV.2) onde o índice h indica conjugado transposto. A dependência de A com o vetor ϕ foi omitida para maior clareza do texto. Se considerarmos o ruído como sendo branco e de potência σ 2 , temos que [ ] E n( k ) n H ( k ) = σ 2 I (IV.3) A matriz de autocorrelação dos sinais incidentes no array é definida como [ R ss ( k ) = E s( k )s H ( k ) ] (IV.4) A decomposição de R xx em seus autovalores e autovetores leva à seguinte expressão [Boldrini et. al., 1980]: R xx = AR ss A H + σ 2 I = QΛQ H (IV.5) onde Λ = diag{ λ1 λ2 ¢ ¢ λN } , λ1 ≥ λ2 ≥ ≥ λN (IV.6) é a matriz diagonal formada pelos N autovalores de R xx ordenados em forma decrescente e Q é a matriz cujas colunas são os autovetores correspondentes aos autovalores em Λ . Pode-se demonstrar [Roy e Kailath, 1989] que os autovetores de R xx correspondentes aos I maiores autovalores, sendo I o número de sinais incidentes, estão contidos no subespaço vetorial formado pelas colunas de A, ao qual daremos o nome de Subespaço de Sinais. Demonstra-se também que os autovetores restantes são ortogonais ao Subespaço de Sinais e correspondem aos N - I menores autovalores, todos iguais a σ 2 . Esses vetores estão contidos no subespaço denominado de Subespaço de Ruído. 52 Podemos agora decompor a matriz R xx nas suas componentes de sinal e de ruído, da seguinte maneira: R xx = Q s Λ s Q Hs + Q n Λ n Q nH (IV.7) As colunas de Q s são os autovetores correspondentes aos I maiores autovalores de R xx (elementos de Λ s ) pertencentes ao subespaço de sinais e as colunas de Q n são os autovetores correspondentes aos N - I menores autovalores (todos iguais a σ 2 e dispostos na diagonal principal de Λ n ) pertencentes ao subespaço de ruído. É importante salientar que a matriz de autocorrelação R xx na maioria das vezes não é conhecida a priori, devendo portanto ser estimada. Uma estimação freqüentemente utilizada é a que realiza uma média temporal das M amostras do sinal x, como segue: £ R xx = 1 M M ∑ x( k )x H (k ) (IV.8) k =1 A fatoração espectral de R xx nos fornece de imediato um método para conhecermos o número de sinais incidentes, que é igual ao número N de elementos do array menos o número de autovalores de R xx iguais a σ 2 . No entanto, quando a matriz de autocorrelação dos dados de entrada é estimada, os autovalores do subespaço de ruído não são todos exatamente iguais, possuindo um espalhamento em torno de uma média. Neste caso, deve-se lançar mão de métodos estatísticos especiais [Roy e Kailath, 1989] para a estimação de I. IV.2 Solução Geométrica Quando da ausência de ruído, podemos solucionar o problema de estimação das direções de chegada dos sinais geometricamente. Sabemos que neste caso particular todos os 53 autovetores de R xx pertencem ao subespaço de sinais e que, portanto, formam uma base para ele. Sabemos também que o subespaço de sinais é formado por uma combinação linear dos vetores das colunas de A, definida em (II.37). Sabemos, finalmente, que o array manifold, conhecido de antemão, contém todos os vetores de direcionamento do array para qualquer ângulo de chegada no intervalo [0,2π ) , ou seja, contém a matriz A. Portanto, ao encontrarmos a intersecção do subespaço de sinais com o array manifold, estaremos determinando o conjunto de vetores de A que formam uma base para o subespaço de sinais, ou seja, as próprias colunas dessa matriz. Assumindo que conhecemos a função f n (ϕ i ) (Equação II.33), ou seja, o mapeamento único entre as direções de chegada dos sinais e as colunas de A, então os parâmetros desejados estarão automaticamente determinados (Fig. IV.9). No entanto, quando se considera a situação mais realista de um ambiente ruidoso, devemos levar em conta os algoritmos existentes para estimação de parâmetros, cujos principais e mais utilizados estão descritos na seção seguinte. IV.3 Algoritmos Baseados em Espectros Essa classe de algoritmos realiza a estimação dos parâmetros de interesse através da análise de funções espectrais relativas às estatísticas dos sinais. Os algoritmos podem ser divididos em métodos de subespaço e métodos de arrays formadores de feixes. Métodos de Arrays Formadores de Feixes Esses métodos utilizam os arrays apresentados no capítulo III e procuram por pontos de máximo na curva da potência de saída do array pelo ângulo de chegada. Esta curva 54 subespaço de sinais q3 a (ϕ 1) q1 a(ϕ 2) q2 array manifold Figura IV.9 - Solução geométrica para um array de três elementos onde incidem dois sinais, sem ruído corresponde, no domínio espacial, ao espectro de potência do sinal de entrada. Podemos escrever a saída do array como sendo o vetor de entrada ponderado pelo vetor de coeficientes: y ( k ) = w H x( k ) (IV.9) A potência de saída é dada por 1 Po = M 1 = M M ∑ y( k ) 2 k =1 (IV.10) M ∑w H H x( k ) x w k =1 onde M é o número de amostras considerado. Podemos substituir em (IV.10) a expressão da aproximação estocástica da matriz de 55 autocorrelação do vetor de entrada, dada em (IV.8), para obtermos uma expressão reduzida para a potência de saída: ¤ Po = w H R xx w (IV.73) Veremos em seguida, a título de exemplo, um método de arrays formadores de feixes que utiliza aquele que é considerado o primeiro array formador de feixes desenvolvido [Krim e Viberg, 1996]. Estimação Utilizando o Array de Bartlett O primeiro array formador de feixes foi proposto por Bartlett [Krim e Viberg, 1996] nos anos 40. O array de Bartlett atua maximizando a potência do sinal de saída. Ele não foi incluído como um dos integrantes dos arrays apresentados no Capítulo III devido à sua pouca aplicabilidade em sistemas com presença de ruído e de interferentes, já que neles a potência do sinal de saída de um array pouco informa a respeito da qualidade desse sinal. Fizemos sua inclusão nesta seção, no entanto, apenas por motivos didáticos, devido à simplicidade de sua solução. Considerando a presença somente de um sinal com direção de chegada ϕ e de ruído aditivo branco, a expressão do sinal nas saídas dos elementos (Eq. II.34) reduz-se a x(k ) = a(ϕ ) s (k ) + n(k ) (IV.12) Maximizar a potência de saída é o mesmo que otimizar a seguinte função objetivo: [ max E y ( k ) w 2 ] = max w E[x(k )x (k )]w = max { w a (ϕ ) E[ s(k) ] + σ H H w H w 2 2 2 w 2 } (IV.13) A solução do problema de otimização acima pode ser encontrada calculando-se o gradiente da função objetivo e igualando-o a zero. Os coeficientes ótimos resultantes desta 56 operação são [Krim e Viberg, 1996] w opt = a (ϕ ) a H (ϕ )a (ϕ ) (IV.14) Para conhecermos o espectro espacial de potência deste array, substituímos (IV.14) em (IV.73), obtendo Po = ¥ a H (ϕ )R xx a (ϕ ) a (ϕ )a (ϕ ) H (IV.15) A resolução (diferença mínima entre as direções de chegada de dois sinais de tal forma que o método ainda consiga discriminá-los) do método de estimação utilizando arrays de antenas é dependente de sua geometria. Para que o array consiga resolver dois sinais (os picos correspondentes no espectro espacial são suficientemente afastados de maneira que se pode discerni-los), a diferença, em graus elétricos, entre suas direções de chegada deve ser muito maior que a largura de feixe do array, que, para uma geometria linear uniforme com afastamento de λ / 2 entre os elementos, é de 2π / N [Krim e Viberg, 1996]. Métodos de Subespaço Esses métodos, que fazem parte dos métodos de estimação de alta resolução, utilizam a estrutura de autovalores e autovetores da matriz de autocorrelação do sinal de entrada para realizar suas estimativas. O método mais utilizado é o MUSIC [Schmidt, 1986], que foi o primeiro a despertar um real interesse para aplicações de métodos de estimação de parâmetros em sistemas de tempo real. 57 MUSIC Quando surgiu, num congresso militar do final da década de 1970, o MUSIC apareceu como uma atraente inovação na medida em que apresentava a capacidade de lidar com qualquer configuração de arrays. Antes dele, a escolha de um determinado método de estimação definia certos parâmetros de calibração dos arrays, o que alterava seus projetos. A economia representada pela eliminação desse trabalho talvez tenha sido o maior responsável pela alta popularidade inicial do método [Krim e Viberg, 1996]. Como já mostramos neste capítulo, nos casos onde não existe ruído a solução para o problema de estimação de DOA se dá através da intersecção do subespaço de sinais com o array manifold (ver Figura IV.9). Quando o ruído é considerado, a solução são os elementos de ¦ que estão mais próximos ao subespaço de sinais. Uma métrica para avaliação dessa proximidade é, portanto, necessária. § A métrica utilizada por Scmidt foi a distância euclidiana quadrática entre o elemento de na direção a ser estimada ϕ e o subespaço de sinais. Sabendo que o subespaço de ruído é ortogonal ao subespaço de sinais e, conseqüentemente, aos elementos de ¨ , a seguinte distância: d E2 = a H (ϕ )Q n Q nH a (ϕ ) (IV.16) deverá ser nula para os elementos a(ϕ ) que pertencem ao subespaço de sinais. Esses vetores são a solução do algoritmo. O espectro proposto por Schmidt (Eq. IV.17) é o inverso dessa distância, ponderada pelo módulo quadrático do vetor de © na direção ϕ , de maneira que as soluções aparecem na forma dos I maiores picos do espectro [Schmidt, 1986]: 58 Po = a H (ϕ )a (ϕ ) d E2 (IV.17) Podemos escrever o seguinte procedimento para o algoritmo MUSIC: • Colher os dados e formar R̂ xx , a estimativa de R xx ; • Calcular os autovalores e autovetores Λ n e Q n da fatoração espectral de R̂ xx ; • Estimar o número I de sinais; • Encontrar os I maiores picos de PM (ϕ ) . Apesar de ser um método de alta resolução, o MUSIC é extremamente sensível à relação sinal/ruído na entrada do array e ao número de amostras consideradas nos seus cálculos, gerando estimativas polarizadas quando esses números não se apresentam favoráveis. Root MUSIC A geometria dos arrays lineares e uniformes permite a simplificação de alguns algoritmos, como é o caso do MUSIC. No Root MUSIC definem-se polinômios em z de maneira que a estimação das direções de chegada sejam realizadas através de suas raízes. Para defini-los, aproveita-se a ortogonalidade existente entre o espaço de ruído e o de sinais e, portanto, entre os autovetores daquele e a matriz de direcionamento, ou seja: A h (ϕ i )Q n = 0, ϕ i ∈ {ϕ 1 , ϕ 2 , ª ,ϕ I } (IV.18) Se recordarmos que um array linear uniforme possui f n (ϕ i ) como dado por (II.33), os seguintes polinômios construídos a partir dos autovetores do espaço de sinais possuem I de suas raízes sobre a circunferência de raio unitário, ou seja, em z i = e jϕi , i = 1, [ Pi ( z ) = qˆ ih ⋅ 1 z ] t z N −1 , i = I + 1, I + 2, ¬ ,N « ,I (IV.19) 59 onde q̂ i é o autovetor da matriz R̂ xx correspondente ao i-ésimo autovalor. Podemos também representar simultaneamente todos os N - I polinômios através do vetor [ ˆh⋅1 z p( z ) = Q n ® z N −1 ] t ( N − I × 1) (IV.20) Define-se também [Rao e Hari, 1989] o polinômio V ( z ) = p h ( z −1 ) ⋅ p( z ) (IV.21) V(z) possui 2 × ( N − 1) raízes dispostas em pares de fases simétricas (complexas conjugadas), sendo que as I raízes de interesse (e seus respectivos pares) estão localizadas sobre a circunferência de raio unitário e as N - I restantes possuem módulo menor que um. Portanto, as direções de chegada dos sinais são estimadas como as fases das I raízes de maior módulo. O Root MUSIC, além da maior simplicidade em relação ao MUSIC, possui melhor performance do que este quando o número de amostras do sinal é pequeno [Krim e Viberg, 1996]. ESPRIT Desenvolvido numa tese de doutorado da Universidade de Standford [Roy e Kailath, 1989], o ESPRIT adota uma geometria particular do array e explora esse recurso em favor de uma maior simplicidade do algoritmo em relação ao MUSIC. Sua geometria considera a existência de dois arrays “gêmeos” de forma que, par a par, os elementos de cada um mantêm a mesma distância em relação aos elementos correspondentes do outro. Podemos esclarecer essa restrição através de um exemplo com um array linear uniforme de seis elementos, separados por uma distância d. Nesse caso, pode-se considerar que os primeiros cinco elementos formam o primeiro sub-array e os últimos cinco, seu gêmeo, de forma que o primeiro elemento do segundo sub-array é o segundo elemento do 60 primeiro sub- array 1 2 d 3 d 4 d 1 2 5 d 3 d 4 5 segundo sub- array Figura IV.10 - Divisão de um array linear e uniforme de seis elementos, segundo o algoritmo ESPRIT primeiro e assim sucessivamente (Figura IV.10). Se denominarmos de x n (k ) a k-ésima amostra do sinal na saída do n-ésimo elemento do primeiro array e de y n (k ) a saída do nésimo elemento do segundo, podemos escrever, I x n (k ) = ∑ a n (ϕ i ) ⋅ s i (k ) + n xn (k ) (IV.22) i =1 e I y n (k ) = ∑ a n (ϕ i ) ⋅ e d j 2π senϕ i λ i =1 ⋅ s i (k ) + n yn (k ) (IV.23) Ou, em notação matricial x(k ) = As(k ) + n x (k ) (IV.24) e 61 y (k ) = A s(k ) + n y (k ) (IV.25) onde j 2π d senϕ1 = diag e λ î e j 2π d senϕ 2 λ ¯ e d j 2π senϕ I λ (IV.26) é a matriz diagonal contendo os deslocamentos de fase provocados pelos ângulos de chegada dos I sinais no segundo array, em relação ao primeiro. O algoritmo resume-se num método que procura estimar Φ a partir de relações existentes entre as decomposições em autovalores das matrizes de autocorrelação dos sinais x e y, R xx e R yy . Denotamos por Q xs e Q ys as matrizes cujas colunas são os autovetores correspondentes aos I maiores autovalores das matrizes R xx e R yy , respectivamente. Já que os elementos dessas duas matrizes formam dois conjuntos distintos de bases para o mesmo espaço (o subespaço de sinais), podemos relacioná-las através de um operador linear não singular, na forma Q xs = Q ys Da mesma maneira, as colunas das matrizes A e A (IV.27) formam dois conjuntos de bases para o subespaço de sinais e portanto podem também ser relacionadas a Q xs e Q ys através de um operador linear [Godara, 1997]: Q xs = A (IV.28) Q ys = AΦΘ (IV.29) Substituindo (IV.28) e (IV.29) em (IV.27) encontramos a relação fundamental do 62 algoritmo ESPRIT: −1 Ou seja, os elementos de = (IV.30) são os autovalores de autovetores. O problema de estimar e as colunas de portanto é o mesmo que estimar seus autovalores. A estimativa de são seus e decompô-la em a partir da observação de x e de y pode ser realizada através do método de mínimos quadrados totais [Roy e Kailath, 1989]. Sumariando o algoritmo ESPRIT, podemos escrever: • Colher os dados e calcular R̂ xx e R̂ yy ; • A partir dos I maiores autovalores de R̂ xx e R̂ yy , formar Q̂ xs e Q̂ ys ; • Estimar através do método de mínimos quadrados totais [Roy e Kailath, 1989]; • Calcular os ângulos de chegada, que são dados por: arg(λi ) ϕ i = sen −1 2π d î λ onde λi é o i-ésimo autovalor de i = 1, ° ,I (IV.31) . IV.4 Algoritmos Paramétricos Enquanto que nos algoritmos baseados em subespaços as estimações dos parâmetros de interesse são feitas em seqüência, uma após a outra, nos algoritmos paramétricos eles são estimados todos simultaneamente. Apesar do alto custo computacional que essa metodologia requer, os algoritmos paramétricos possuem melhor resolução do que os baseados em 63 subespaços. Descreveremos aqui somente o algoritmo de Máxima Verossimilhança, que é o mais mencionado na literatura. Algoritmo de Máxima Verossimilhança A metodologia estatística presente no algoritmo de máxima verossimilhança foi desenvolvida no início do século passado nos trabalhos de Gauss e de Legendre. Sua aplicação na estimação de parâmetros em sistemas de comunicações tem sido estudada desde a década de 1960 [Miller e Fuhrmann, 1990]. A idéia é calcular os parâmetros que maximizam uma função (de verossimilhança) que é a densidade de probabilidade do vetor observado x. Determinar esses parâmetros significa determinar as direções de chegada para as quais a probabilidade de que os sinais incidentes produzam o vetor observado x é máxima. Existem duas estratégias para o algoritmo de acordo com o modelo estatístico dos sinais incidentes. No algoritmo dito determinístico, s(k) é determinístico mas desconhecido, sendo portanto um dos parâmetros a serem estimados. Como n(k) é um processo gaussiano branco de média nula, o vetor x temporalmente é um processo gaussiano branco e possui simetria circular (suas partes real e imaginária são igualmente distribuídas e possuem simetria na [ { ]} [ { ]} função de correlação cruzada, tal que E Re[x(k )] Im x t (k ) = -E Im[x(k )] Re x t (k ) ). Partindo desse modelo de sinais, demonstra-se [Krim e Viberg, 1996] que a função de verossimilhança pode ser representada por ( ) M ( L ϕ , s(k ), σ 2 = ∏ πσ 2 k =1 ) N e − x ( k ) − As ( k ) 2 /σ 2 (IV.32) Os três parâmetros a serem determinados ( ϕ , s(k ), σ 2 ) são aqueles que maximizam L. Ao invés de L, adota-se a função -logL, e o problema de otimização é resolvido através da sua minimização da função de verossimilhança, que, ao desprezar-se o termo independente 64 N log π , torna-se: ( ) l ϕ , s(k ), σ 2 = N log σ 2 + 1 2 σ M M ∑ x(k ) − As(k ) 2 (IV.33) k =1 A dedução da solução de (IV.33) encontra-se detalhada em [Wax, 1992] e aqui apresentaremos somente os resultados. Com respeito a σ 2 e s(k), temos que: σˆ 2 = {[ ( 1 Tr I − A A h A N ) −1 ] } ˆ Ah R xx (IV.34) e ( sˆ (k ) = A h A ) −1 A h x( k ) (IV.35) A solução para o vetor de direções de chegada é encontrada substituindo-se (IV.34) e (IV.35) em (IV.33) minimizada, resultando em { {[ ] }} −1 ϕˆ = arg mín Tr I − A(A h A ) A h Rˆ xx ϕ (IV.36) IV.5 Discussão Neste capítulo apresentamos os métodos de estimação de direção de chegada de sinais mais utilizados. Sua utilidade, no contexto desta tese, é viabilizar a aplicação dos arrays adaptativos que necessitam da informação de direção de chegada do sinal desejado. No entanto, exatamente de que maneira esses métodos podem ser utilizados nos arrays em ambientes de comunicações ainda é um assunto pouco explorado. O maior fator desencorajador de pesquisas no assunto é a alta complexidade computacional desses métodos. 65 No capítulo seguinte apresentaremos as técnicas de diversidade, que formam o outro ramo de evolução dos métodos de processamento espacial. 66 ±²CE³ ´:3:7 Concomitantemente ao desenvolvimento de técnicas para aprimoramento da recepção de sinais em radares, um outro grupo concentrava esforços no sentido de melhorar a qualidade dos sinais em transmissões via rádio, deteriorados pelo desvanecimento. V.1 Desvanecimento Desvanecimento é uma flutuação do nível do sinal que pode ser modelada como um ruído multiplicativo [Yacoub, 1993]. Há dois tipos básicos: o desvanecimento lento, também chamado de sombreamento, e o desvanecimento rápido. O desvanecimento rápido corresponde às rápidas flutuações do sinal em torno da sua média. É causado pela multipropagação do sinal devido às várias reflexões e refrações sofridas pelos espalhadores ao longo do percurso [Paulraj e Papadias, 1997]. Se assumirmos um número muito grande de espalhadores e que as fases das diversas componentes de multipercurso chegam ao receptor com distribuição equiprovável no intervalo [0,2π ) , então o sinal recebido terá distribuição de Rayleigh, dada por 67 x − x 2 / 2σ 2 x≥0 e p( x ) = σ 2 î 0 x<0 (V.1) onde x é a variável aleatória, µ é sua média e σ o desvio padrão. O sombreamento provoca flutuações no nível médio do sinal. É causado por grandes obstáculos, tais como prédios, montanhas e morros e pode provocar a perda completa do sinal, às vezes por longos períodos de tempo, conforme as dimensões dos obstáculos. O sombreamento é a média local do sinal em desvanecimento rápido. Experimentalmente demonstra-se que se um sinal em desvanecimento rápido possui distribuição de Rayleigh, a média local de sua potência possui distribuição do tipo log-normal [Paulraj e Papadias, 1997], dada por ( log x − µ ) 1 − 2 e 2σ p( x ) = xσ π î 0 2 x>0 (V.2) x≤0 O único método efetivo de combate ao sombreamento é evitar a obstrução do sinal, o que pode ser conseguido com a utilização de técnicas de diversidade espacial “macroscópica” [Yacoub, 1993], como aquela que provê o posicionamento estratégico de mais de uma estação base em torno da célula que contém o obstáculo, de tal forma que, a qualquer instante, haja um caminho livre entre o móvel e uma das estações (fig V.1). Para o combate ao desvanecimento rápido são utilizadas técnicas de diversidade “microscópica”, como aquelas que veremos nas seções seguintes. 68 V.2 Diversidade Antes mesmo do final da década de 1920 já se sabia que o fenômeno de desvanecimento é um dos maiores responsáveis pela degradação da qualidade dos sinais de rádio [Romano e Brandão, 1997]. Nessa época já se pensavam em esquemas que utilizavam mais de uma antena para combinar em fase os sinais na recepção como forma de contornar o problema. Sabia-se que se essas antenas fossem posicionadas com uma separação mínima entre elas, cujo valor era obtido empiricamente, os sinais captados eram descorrelacionados ao ponto de garantir uma pequena probabilidade de ocorrência de desvanecimento em todos eles ao mesmo tempo. Os experimentos realizados pela Marconi Company em conjunto com a BBC inglesa no começo dos anos 1930 utilizaram essa técnica, que é uma forma simples de diversidade, hoje conhecida como combinação com ganhos iguais (equal gain combining). Diversidade, como definido em [Baghdady, 1961], “é uma técnica que utiliza duas ou mais cópias do sinal transmitido com vários graus de degradação para atingir, por meio de um esquema de seleção ou de combinação, um grau de performance de recuperação da mensagem consistentemente maior que aquele que seria alcançado utilizando-se qualquer uma das cópias separadamente”. Os esquemas de diversidade mais utilizados podem ser classificados, de acordo com a propriedade do sinal a ser explorada, em: a) diversidade no tempo: transmitem-se cópias do mesmo sinal em tempos diferentes (ex. os códigos de repetição utilizados em modems). Se o tempo de separação entre duas cópias consecutivas for bem planejado, há pequena probabilidade de ocorrência de desvanecimento nas duas ao mesmo tempo; b) diversidade em freqüência: transmite-se o sinal em mais de uma portadora diferente, explorando a propriedade de dependência com a freqüência do desvanecimento (ex. os sistemas que utilizam a técnica de salto em freqüência); 69 Figura V.1 - Diversidade macroscópica c) diversidade de polarização: as três componentes de polarização do sinal experimentam diferentes caminhos de propagação, diminuindo a chance de ocorrência de desvanecimento em todas elas ao mesmo tempo. Na recepção são utilizadas antenas diferentes para captar separadamente as componentes de polarização; d) diversidade no espaço: utiliza um array de antenas para recepção de cópias descorrelacionadas do mesmo sinal. É o método mais clássico. Nas próximas seções trataremos das técnicas mais usuais para prover diversidade espacial, da mais simples (diversidade por seleção) à mais sofisticada (diversidade por combinação ótima) e mostraremos que o caminho percorrido pela evolução dessas técnicas levou ao seu encontro com a tecnologia de antenas adaptativas desenvolvida pelos pesquisadores do ramo detecção, quando percebeu-se a aplicabilidade de ambas em sistemas de comunicações móveis. 70 V.3 Esquemas de Diversidade Curiosamente, a propriedade dos meios dispersivos de criar cópias descorrelacionadas de um sinal devido ao multipercurso, a mesma propriedade causadora do desvanecimento, é a que viabiliza a existência de técnicas de diversidade no espaço. São basicamente cinco as técnicas de diversidade espacial, divididas em dois grupos: diversidade por seleção e diversidade por combinação. Diversidade por Seleção Na diversidade por seleção somente o sinal de um dos elementos do array de antenas é utilizado por vez, de acordo com algum critério pré-estabelecido. As duas técnicas pertencentes a esse grupo são denominadas seleção pura e seleção por limiar. Na seleção pura o elemento do array escolhido é aquele que possui, a cada instante, o melhor sinal de acordo com algum critério, que pode ser a relação sinal/ruído ou mesmo a potência total do sinal. É necessária, para isso, a presença de um sistema que continuamente monitore os sinais nas saídas dos elementos (Fig. V.2). Podemos citar como desvantagens desse método a necessidade de um receptor em cada elemento e a alta taxa de monitoramento. A técnica de seleção por limiar é uma alternativa que contorna esses problemas. Os sinais dos elementos são monitorados sequencialmente até que seja encontrado aquele que possui potência, ou relação sinal/ruído, maior do que um certo limiar. Este elemento então é selecionado até que a potência do sinal não caia para um valor menor que o limiar, quando o processo de busca reinicia (Fig. V.3). A escolha do valor do limiar é portanto fator determinante da performance do método. 71 ... ... Seleção do Melhor Sinal Melhor Sinal Seletor Amostragem/ Comparação Figura V.2 - Seleção pura ... Seletor Sinal acima do limiar Limiar de Referência Amostragem/ Comparação Figura V.3 - Seleção por limiar 72 Diversidade por Combinação Nesse método o sinal de saída do array é uma combinação linear dos sinais em cada elemento. Ou seja, se chamarmos de wi o coeficiente complexo e de xi (k ) o sinal de saída do i-ésimo elemento num instante k qualquer, num array de N elementos, a saída pode ser descrita como y( k ) = N −1 ∑ w x (k ) i i (V.3) i =0 São três as técnicas de diversidade por combinação, chamadas de combinação com ganhos iguais, combinação por razão máxima e combinação ótima. Na diversidade de combinação com ganhos iguais os sinais dos N elementos são somados com ganhos iguais para todos. Ou seja wi = cte . A combinação com ganhos iguais foi a primeira técnica de diversidade espacial a ser utilizada. Apesar de, à primeira vista, as técnicas de seleção parecerem mais simples, o chaveamento de sinais em rádio freqüência só foi possível com o advento da tecnologia de semicondutores, enquanto que na combinação por ganhos iguais as defasagens necessárias dos sinais podem ser feitas por meio de indutores, já disponíveis na época das primeiras implementações. Uma técnica mais apurada para a melhoria de qualidade do sinal corrompido pelo desvanecimento é a combinação por razão máxima. Nela os sinais de cada elemento têm peso proporcional à sua própria relação sinal/ruído e podem ser estimados através de algoritmos adaptativos. Ou seja, os coeficientes de cada elemento são 73 wi = α Pi ,d σ i2, n (V.4) onde Pi ,d é a potência do sinal desejado e σ i2,n é a potência do ruído no i-ésimo elemento. α é uma constante de proporcionalidade. A próxima seção é dedicada à técnica de diversidade por combinação ótima. V.4 O Vértice do “Y”: Combinação Ótima Quando a técnica de combinação tem como objetivo a maximização da SINR na saída do array, ela é chamada de combinação ótima. Podemos dizer que a combinação ótima é o ponto de encontro entre o ramo de pesquisas em arrays de antenas adaptativas para radares e o ramo de pesquisas em diversidade de sinais de rádio, pois é realizada por meio dos algoritmos adaptativos que descrevemos no capítulo III [Winters, 1984]. De acordo com [Vaughan, 1988], em [Bogachev e Kiselev, 1980] publicou-se a primeira discussão sobre combinação ótima com o intuito de combater o fenômeno do desvanecimento. Nesse trabalho são apresentadas curvas para probabilidade da SNR em ambientes onde o desvanecimento possui distribuição do tipo Rayleigh. Um outro trabalho também de importância histórica e que apresenta resultados comparativos interessantes entre as técnicas de combinação por razão máxima e a de combinação ótima em ambiente de desvanecimento Rayleigh é o que foi publicado por Jack Winters em [Winters, 1984]. Talvez o primeiro a considerar a aplicação de combinação ótima em sistemas de comunicações móveis celulares, o trabalho de Winters destaca-se também por considerar a presença de interferência co-canal na recepção do sinal, além do desvanecimento. Através dessas considerações, chega-se à conclusão de que a diferença de performance entre a combinação ótima e a combinação por razão máxima se faz mais perceber quando 74 consideramos a presença de interferentes correlacionados nos elementos do array, situação que pode ser comum em ambientes de comunicações móveis celulares. Nessa situação há ganhos de performance em relação à combinação por razão máxima, medidos através das estatísticas da SINR e da taxa de erro de bits (em inglês, BER – Bit Error Rate), mesmo nas situações em que o número de interferentes supera o número de elementos do array. Na próxima seção mostraremos alguns resultados comparativos de performance entre as técnicas de diversidade espacial apresentadas neste trabalho e verificaremos que a combinação ótima possui os melhores números, nas condições acima mencionadas. A dedução desses resultados pode ser encontrada com detalhes em [Brandão, 1995] e em [Winters, 1984]. V.5 Comparação entre os Métodos Em seu trabalho [Brandão, 1995], André Brandão realiza o cálculo dos ganhos de potência proporcionados pelos métodos de seleção pura, combinação com ganhos iguais e combinação por razão máxima. Assumiu-se que o desvanecimento é plano, ou seja, age igualmente em todas as freqüências, e que segue uma distribuição de Rayleigh. Não foi considerada a presença de sinais interferentes. Para a seleção pura, a seguinte SNR média normalizada na saída do array foi obtida: N 1 i =1 i SNR sel = ∑ (V.5) onde N é o número de elementos do array. Verifica-se, a partir dessa equação, que para essa técnica de seleção existe uma saturação no ganho da SNR obtido com o aumento do número de antenas, como pode ser observado na Figura V.4. Por exemplo, num array de três antenas mais de 50% do ganho de SNR total é atingido. 75 35 30 25 20 ganho de SNR (%) 15 10 5 0 2 3 4 5 6 7 8 9 10 Figura V.4 - Ganho na SNR (%) em relação ao número de antenas na seleção pura Na combinação com ganhos iguais a SNR média na saída do array é dada por SNRganhos iguais = 1 + π ( N − 1) 4 (V.6) e, na combinação por razão máxima, por SNRrazao maxima = N (V.7) Nos dois casos a SNR média de saída é proporcional ao número de elementos do array. A partir de (V.5), (V.6) e (V.7), Brandão monta a seguinte tabela comparativa dos ganhos de SNR obtidos em relação à situação de uma única antena, para cada uma das três técnicas: 76 núm. de seleção por limiar comb. com ganhos comb. por razão elementos (dB) iguais (dB) máxima (dB) 2 1,76 2,62 3,01 3 2,63 4,10 4,77 4 3,19 5,26 6,02 6 3,99 6,93 7,78 8 4,34 8,13 9,03 Tabela V.1 - Ganho na SNR (dB) em relação ao número de antenas em três técnicas de diversidade A Tabela V.1 confirma a conclusão obtida a partir da análise da Figura V.4 de que a técnica de seleção pura apresenta resultados satisfatórios apenas quando é pequeno o número de elementos do array, situação, aliás, em que sua performance é comparável às das outras técnicas. No entanto, se quisermos maiores ganhos de SNR, devemos partir para outras técnicas de diversidade com um maior número de elementos. Combinação por Razão Máxima X Combinação Ótima Num ambiente onde os interferentes não são correlacionados entre um elemento e outro do array, a combinação por razão máxima produz a melhor SNR de saída, constituindo-se, segundo esse critério, na técnica ótima para esse caso [Jakes, 1974]. O ganho de performance introduzido pela combinação ótima, portanto, dá-se em ambientes onde os interferentes estão presentes em todos os elementos. Winters, em seu trabalho [Winters, 1984], faz uma análise da performance de um array LMS num sistema de comunicações móveis com interferentes comuns a todos os elementos, onde o desvanecimento, independente entre os elementos do array, segue uma distribuição Rayleigh. A modulação utilizada é a PSK. Interessante é notarmos que a distância entre elementos considerada nesse trabalho é muito maior que a distância coerente do array. Ou 77 seja, o autor propõe um esquema de diversidade que utiliza um algoritmo de array adaptativo. Apresentaremos aqui somente os resultados finais, cujas deduções encontram-se no referido trabalho. Para os casos onde existem mais de um interferente, foram feitas simulações da taxa de erro de bits em função da SINR média de entrada. Definindo-se o ganho de performance como sendo a diferença, em dB, entre a SINR média de entrada necessária para se alcançar uma determinada taxa de erro de bits com combinação ótima e a SINR necessária para se atingir a mesma taxa utilizando-se combinação por razão máxima, verifica-se que há um ganho de performance praticamente constante (0,6 dB aproximadamente para INR de entrada igual a 3 dB para todos os interferentes) a cada incremento unitário do número de elementos do array. Há ganho de performance mesmo nos casos em que o número de interferentes é muito maior que o número de elementos, o que é um resultado surpreendente se considerarmos que, teoricamente, um array adaptativo de N elementos sem restrição pode anular até N-1 interferentes (ver [Widrow e Stearns, 1985]). V.6 Esquemas de Diversidade e Arrays Adaptativos Os esquemas de diversidade, ao lidarem com sinais descorrelacionados em cada um dos elementos do array, diferem dos métodos de arrays de antenas voltados para aplicações em radares (que, por simplicidade, passamos a chamar apenas de arrays adaptativos). Como as fases dos sinais em cada elemento também são descorrelacionadas entre si, não é possível estabelecer a priori qualquer tipo de relação geométrica entre os sinais, como foi feito na Figura II.4 e equacionado em (II.33). Dessa maneira também é impossível num esquema de diversidade, ao contrário dos métodos de arrays adaptativos, realizar-se o controle sobre o padrão de irradiação do array, que, inclusive, nesse caso, é uma entidade que não tem sentido. 78 É importante salientar que o processamento puramente espacial realizado por meio de arrays adaptativos é insensível à dimensão temporal dos sinais, sendo portanto ineficaz para combater desvanecimentos. No entanto, é eficaz no combate ao ruído de multipercurso, ou seja, aquele provocado pela somatória das cópias de multipercurso dos sinais, originadas por espalhadores posicionados ao longo do caminho por eles percorrido. As cópias de multipercurso chegam ao array segundo direções distintas, o que possibilita a ação dos algoritmos adaptativos em cancelá-las. Vemos portanto que são duas formas distintas de antenas “inteligentes”, com origens distintas, mas que em sistemas de comunicações móveis tiveram um ambiente comum de aplicação. O maior legado do supracitado trabalho de Winters, para nós que procuramos estabelecer relações de semelhança na aplicação das técnicas desenvolvidas pelos dois ramos de pesquisas tratados neste texto, é ter mostrado que para implementar um esquema de diversidade do tipo combinação ótima pode-se utilizar um array adaptativo do tipo LMS, o mesmo apresentado no capítulo III, entre outras “várias técnicas de arrays adaptativos que podem ser utilizadas em rádio móvel” [Winters, 1984, pág. 536]. O array de antenas assim idealizado aproveitaria as vantagens dos dois esquemas, ou seja, estaria apto a combater desvanecimentos do sinal ao mesmo tempo em que realizaria o cancelamento de interferentes. Dessa forma, esse trabalho nos auxilia a termos uma visão unificada dos dois ramos de pesquisas e por isso consideramos que ele se encontra no ponto de encontro dos dois, no vértice do nosso “Y”. 79 0 µ¶¶·¸¹77ºF¡3¡3 7»¡7¼½7¾À¿3´: Com o aumento vertiginoso da demanda por telefones móveis que vem ocorrendo ultimamente torna-se necessário o desenvolvimento de novas tecnologias que permitam a expansão da capacidade dos atuais sistemas, principalmente nos grandes centros urbanos, onde o problema é mais crítico. Além disso, há a necessidade de melhoria na qualidade dos sinais recebidos. Na qualidade e principalmente na confiabilidade destes, ou seja, na probabilidade de que os sinais desejados possuam qualidade aceitável durante a maior parte do tempo. É basicamente para esses dois problemas (capacidade dos sistemas e qualidade/confiabilidade dos sinais) que os arrays de antenas têm sido vistos como promissoras soluções. Outras técnicas têm sido utilizadas, como as microcélulas, que proporcionam aumento na concentração de usuários pela diminuição do tamanho das células, ou a setorização, que é a divisão da célula em setores que utilizam o mesmo conjunto de freqüências [Yacoub, 1993]. Mas o emprego de arrays de antenas abre um horizonte de possibilidades muito mais amplo para o uso eficiente do espectro de rádio por viabilizar a implementação de conceitos como a alocação dinâmica de células. Além disso, os arrays de antenas não trazem as desvantagens operacionais que técnicas como as de microcélulas trazem, como o aumento da complexidade do hand-off, o aumento do número de ERBs (Estações Rádio-Base) requeridas e a sofisticação do planejamento das posições destas nas células. 80 Historicamente podemos citar como pioneiros os trabalhos de Bogachev e Kiselev [Bogachev e Kiselev, 1980], que consideraram a aplicação de arrays de antenas para eliminação do ruído de multipercurso, o já citado trabalho de Winters [Winters, 1984], onde há uma análise comparativa de performance entre as técnicas de antenas adaptativas com sinal piloto e de combinação por razão máxima na redução do desvanecimento, quando considerase a existência de interferentes, e o trabalho de Vaughan [Vaughan, 1988], onde há uma análise (rara, aliás) da utilização de antenas adaptativas dentro das unidades móveis. Este capítulo tem o propósito de apresentar uma visão geral de como as técnicas de arrays de antenas têm sido pesquisadas para uso em ambientes de comunicações móveis, na solução de dois problemas básicos: redução da interferência co-canal, com conseqüente aumento de capacidade dos sistemas e combate ao ruído de multipercurso. O capítulo inicia com alguns resultados significativos sobre diminuição de interferência co-canal publicados na literatura especializada. Em seqüência serão apresentados nossos resultados de simulações das performances de alguns dos principais algoritmos de arrays adaptativos que estão descritos ao longo desta tese, vale dizer, o LMS, o algoritmo de Applebaum, o algoritmo de Frost, o algoritmo de Resende e o algoritmo cego CMA, para combater interferência co-canal e ruído de multipercurso. VI.1 Redução de Interferência Co-canal A propriedade de filtragem espacial dos arrays de antenas pode ser utilizada para reduzir o nível de interferência co-canal (ICC) e, conseqüentemente, aumentar o número de usuários que simultaneamente comunicam-se dentro de uma mesma célula. Idealmente podemos pensar que esse objetivo pode ser alcançado utilizando-se um array instalado numa ERB que possua habilidade de posicionar, tanto para recepção quanto para transmissão de sinais, um lóbulo estreito na direção de cada usuário móvel ativo (Fig. VI.1) e persegui-lo ao longo do tempo com esse lóbulo de acordo com seu movimento na célula. Nesse esquema o 81 acesso de cada móvel ao sistema de comunicações dá-se de acordo com sua posição azimutal na célula, Figura VI.1 - ERB utilizando um array de antenas que posiciona um lóbulo para cada usuário tendo sido por isso chamado de SDMA (de Space Division Multiple Access, ou acesso múltiplo por divisão espacial). Como primeira aproximação para o ganho de capacidade proporcionado pelo uso de arrays de antenas, podemos inferir que, se um array com N elementos sem restrição pode anular até N-1 interferentes (ver capítulo III), então pode-se aumentar em até N-1 vezes o número de usuários numa célula para que a performance de quando do uso de uma única antena omnidirecional ainda se mantenha. Se quisermos refinar o cálculo do ganho de capacidade devemos utilizar alguma das métricas existentes para avaliação de performance. Uma delas, que em inglês chama-se outage probability, é a probabilidade do sinal desejado encontrar-se abaixo de um limite mínimo préestabelecido devido à interferência provocada por um co-canal. Ou seja, é a probabilidade de se estar na condição de interferência e, por esse motivo, iremos chamá-la de probabilidade de interferência. Esse limite pode ser expresso por uma comparação entre os envelopes do sinal desejado e do interferente. 82 Consideraremos por ora, à maneira do que é feito em [Swales et. al., 1990], somente o canal celular direto e uma única célula co-canal (Fig.VI.2), de maneira que o receptor em questão é o do móvel, o sinal desejado é proveniente da ERB da célula desejada e o sinal interferente, da ERB da célula co-canal. Apesar de estarmos considerando apenas o canal direto, assumimos que os mesmos lóbulos calculados e posicionados na recepção são utilizados na transmissão dos sinais. Nessas condições há interferência quando o envelope do sinal desejado, medido no móvel receptor, é menor que o envelope do sinal interferente, ponderado por uma margem de proteção, ou seja v d ≤ αvi (VI.1) onde v d é o envelope do sinal desejado e vi é o envelope do interferente. α é a margem de proteção, cujo valor depende da modulação utilizada. Testes subjetivos têm mostrado que, por exemplo, para uma transmissão em FM de 25 kHz em ambiente móvel celular urbano, α =18dB permite boa qualidade de voz [Swales et al., 1990]. Se considerarmos somente as perdas devido ao percurso de propagação, podemos considerar que a média na área de recepção da potência de um sinal é inversamente proporcional à distância da ERB ao móvel, elevada a uma potência que, comumente, é adotada como sendo quatro [Yacoub, 1993]. Portanto, se considerarmos que as ERBs transmitem com a mesma potência e que as constantes de propagação do meio são iguais para ambos os percursos dos sinais desejado e interferente, os envelopes, em Volts, do sinal desejado e do sinal interferente no móvel poderão ser expressos, respectivamente, por vd = k d d2 (VI.2) vi = k d i2 (VI.3) e 83 ERB co-canal di dd ERB desejada Figura VI.2 - Sistema com uma única célula co-canal onde d d e d i são as distâncias das ERBs desejada e interferente ao móvel e k é uma constante de proporcionalidade. Substituindo (VI.2) e (VI.3) em (VI.1) obtemos o lugar geométrico dos pontos onde existe interferência: di ≤ α dd (VI.4) A Figura VI.3 representa as duas regiões definidas por (VI.4). Para calcularmos a probabilidade de interferência, consideramos que o tráfego oferecido é de a Erlangs e que a probabilidade de bloqueio em cada célula é B. Com isso, o tráfego escoado ou o número de canais ativos por célula é a (1 − B ) . Define-se como fator de carga do sistema ou eficiência de uso de canal a razão entre o número de canais ativos e o número total de canais disponíveis por célula, ou seja 84 ERB co-canal di Região de interferência dd Região de não interferência di = α d d ERB desejada Figura VI.3 - Regiões de interferência para o caso de uma célula co-canal, sem desvanecimento ξ= a (1 − B) C (VI.5) onde C é o número total de canais em cada célula. Supondo-se que o móvel esteja localizado na região de interferência e que a ele já esteja alocado um determinado canal, a probabilidade de interferência será a probabilidade de que a ERB da célula co-canal esteja utilizando um outro canal alocado na mesma freqüência. Portanto, para o caso em que se utiliza uma única antena omnidirecional na ERB e existe somente uma célula co-canal, a probabilidade de interferência será Promni {vd ≤ αvi } = # de canais ativos Cξ = =ξ # total de canais C (VI.6) Para calcularmos a probabilidade de interferência quando do uso de um array formador de feixes, consideramos que a distribuição de usuários na célula é uniforme e que toda ERB, posicionada no centro da célula, é capaz de gerar n feixes que podem ser apontados para qualquer um dos móveis da célula, resultando numa relação de número de canais por feixe 85 igual a Cξ / n . Considerando que o móvel esteja na região de interferência e que ele é coberto por ao menos um feixe proveniente da ERB co-canal, a probabilidade de interferência será a probabilidade de que um dos canais desse feixe seja o mesmo canal já alocado para o móvel pela célula à qual pertence, que, considerando distribuição equiprovável de canais por feixe, será Prarray {vd ≤ αvi } = # de canais ativos por feixe Cξ / n ξ = = # total de canais C n (VI.7) Ou seja, a probabilidade de interferência, se comparada à situação em que se utiliza apenas uma antena omnidirecional, é n vezes menor, o que é coerente com a primeira aproximação que fizemos. Além disso, vemos que a probabilidade de interferência é tanto menor quanto menor for o fator de carga, o que é previsível se lembrarmos que o fator de carga representa a porcentagem de canais que estão ativos na célula. Se esse número é grande, também o é a chance de termos um interferente co-canal. Porém a análise realizada acima é simplista na medida em que considera a existência de apenas uma célula co-canal e despreza a ação do desvanecimento. Em [Swales et. al., 1990] há uma análise mais completa, considerando a ação do desvanecimento e a existência de seis células co-canal ativas (que estejam utilizando ao menos um canal de mesma freqüência que o canal utilizado pelo móvel desejado) ao redor da célula desejada, representando uma configuração típica de cluster de sete células (Fig. VI.4). Nesse caso, a probabilidade de interferência será a probabilidade do sinal desejado, em desvanecimento, encontrar-se abaixo do sinal interferente (Equação (VI.1)) e de existir seis células co-canal ativas. Ou seja, Pr{vd ≤ αvi } = ∑ Pr{v 6 u =1 d ≤ αvi u} ⋅ Pr{ u} (VI.8) Pr{ vd ≤ αvi u} é a probabilidade de interferência do sinal desejado em desvanecimento, dado que existem u células co-canal ativas. Ela é dada por uma longa expressão, constante em [Swales et. al., 1990], que depende da relação SIR na entrada do array. Pr{u} é a probabilidade de haver u células co-canal ativas que, se os canais são independentes e 86 igualmente distribuídos, é uma distribuição binomial dada por 6 u 6− u Pr{ u} = pomni 1 − pomni ) ( u (VI.9) onde pomni é a probabilidade de haver uma única célula co-canal ativa: pomni = # de canais ativos a (1 − B ) = =ξ # total de canais C (VI.10) onde ξ é o fator de carga, definido em (VI.5). Substituindo (VI.10) em (VI.9) e o resultado em (VI.8), encontramos a probabilidade de interferência para o caso de seis células co-canal na presença de desvanecimento utilizando uma única antena omnidirecional na ERB: Pr{ vd ≤ αvi } = 6 ∑ Pr{ v d u =1 6 6−u ≤ αvi u} ⋅ ξ u (1 − ξ ) u (VI.11) Com o uso de um array formador de feixes, a probabilidade de haver uma célula cocanal ativa, dado que, a cada instante, existem n feixes formados em cada célula, é a probabilidade de que o co-canal interferente esteja no feixe que está sendo apontado para o móvel desejado, ou seja, padap = # de canais ativos por feixe a(1 − B) / n ξ = = # total de canais C n (VI.12) Se substituirmos (VI.12) em (VI.9) e o resultado em (VI.8), encontramos a probabilidade de interferência para o caso de antenas adaptativas, que é 6 ξ ξ Pr{ vd ≤ αvi ; n} = ∑ Pr{ vd ≤ αvi u} ⋅ 1 − u n n u =1 6 u 6−u (VI.13) Utilizando (VI.13) pode-se demonstrar [Swales et. al., 1990] que a SIR de entrada (ou 87 seja, 20log( vd / αvi ) ) num array capaz de gerar dois feixes (n = 2), se quisermos manter a probabilidade de interferência em 10-2, é cerca de 5 dB menor do que se utilizássemos uma antena omnidirecional (n = 1) e cerca de 9 dB menor se o array for capaz de gerar 4 feixes (n = 4). De outro modo, se fixarmos a SIR de entrada em 20 dB, a probabilidade de interferência, que para o caso de antena omnidirecional é de 0,3, para um array capaz de formar 4 feixes passa a ser de 0,05, ou seja, uma ordem de grandeza menor. Em ambos os casos o fator de carga é 0,7. Figura VI.4 - Cluster de sete células. Há seis células co-canal ao redor da célula desejada. Redução de ICC em sistemas GSM Uma outra métrica, geralmente utilizada para medir a performance dos arrays de antenas em sistemas específicos, definidos por normas técnicas, é a taxa de bits errados (BER). Em [Wells, 1996] foi proposto um esquema para utilização de um array adaptativo no sistema GSM, cuja performance é avaliada medindo-se a BER de saída. O esquema pode ser resumido pelo procedimento abaixo (a Figura IV.5 esquematiza um sistema que permite sua realização): (a) Calcula-se um vetor de coeficientes inicial utilizando-se somente a fração do quadro de bits GSM relativa à seqüência de treinamento; 88 (b) Utiliza-se esse vetor para obter a saída do array para o quadro inteiro; (c) Um equalizador de Viterbi é utilizado para detectar os símbolos a partir da saída calculada no item anterior; (d) A seqüência estimada é então utilizada como novo sinal de referência e um novo vetor de coeficientes é calculado; (e) Volta ao item (c) até convergir. Não há considerações a respeito do algoritmo adaptativo a ser utilizado para os cálculos dos coeficientes, apenas considera-se que a solução ótima de Wiener é alcançada. O esquema é semelhante ao algoritmo clássico de decisão direta [Haykin, 1996], exceto pelo cálculo inicial do vetor de coeficientes e pelo fato dos novos vetores serem calculados a partir da informação contida em todo o quadro, e não símbolo a símbolo. Simulações realizadas com o esquema proposto consideraram a presença de quatro interferentes co-canal em células vizinhas com a mesma potência do sinal desejado e utilizaram um modelo de propagação denominado TU-50 (modela um ambiente tipicamente urbano, estando o móvel à velocidade de 50km/h) [Failli, 1989]. Através de gráficos de BER x E b / N 0 para um array de oito antenas, constatou-se que o esquema proposto possui performance somente de 3 a 4 dB inferior a um sistema em que fosse possível conhecer antecipadamente o conteúdo de todo o quadro de símbolos, situação que pode ser vista como ideal, e 3 dB superior ao esquema clássico que utiliza somente a seqüência de treinamento, sem fazer uso do equalizador de Viterbi. w1 w2 Σ ... wN equalizador de Viterbi controle das iterações cálculo do vetor de coeficientes seqüência de treinamento Figura VI.5 - Array de antenas para GSM 89 Redução de ICC em sistemas CDMA Partiremos do resultado obtido em [Pursley, 1977], que conclui uma expressão aproximada para o cálculo da BER em um canal reverso CDMA assíncrono com adição de ruído gaussiano branco, operando com controle de potência perfeito, sem interferência de móveis em células adjacentes, utilizando uma antena omnidirecional na recepção. O número de usuários por célula é consideravelmente grande de forma que a somatória de seus sinais toma a forma de um ruído gaussiano branco. Dessa maneira, a BER é calculada como 3S BER omni ≈ Q I − 1 (VI.14) onde S é o ganho de processamento, I é o número de sinais incidentes na ERB e Q(X) é a probabilidade de x > X quando x é uma variável aleatória gaussiana de média nula e variância unitária. Para avaliarmos o efeito provocado pela introdução de arrays de antenas em sistemas CDMA consideraremos um array de N elementos capaz de posicionar, através da conformação do seu padrão de irradiação H (ϕ ) , um lóbulo principal na direção do sinal desejado, sem preocupação com que técnica utilizar para atingir esse objetivo. Se assumirmos que existem I sinais incidentes, sendo que um deles é o desejado, e que a potência de chegada na estação base de cada um deles é Pm , a potência total dos interferentes na saída do array será dada por I −1 Pi = Pm ⋅ E ∑ H (ϕ j ) j =1 (VI.15) onde ϕ j é a direção de chegada do j-ésimo sinal interferente. 90 Assumindo que os móveis estão distribuídos de maneira uniforme e independente na célula, podemos reescrever (VI.15) como [Liberti e Rappaport, 1994] 2π I −1 Pi = Pm H (ϕ ) dϕ 2π ∫0 (VI.16) Define-se diretividade de uma antena, ou de um array de antenas, como [Krauss, 1950] D= 2π (VI.17) 2π ∫ H (ϕ )dϕ 0 Substituindo (VI.17) em (VI.16) temos a expressão para a potência dos interferentes na saída do array: Pi = Pm I −1 D (VI.18) Em [Liberti e Rappaport, 1994] assume-se que M interferentes, cada um com potência P/M, provocam o mesmo efeito na BER média de saída que um único interferente com potência P. Assim, a expressão (VI.14) é aproximada para ( BER ≈ Q 3S ⋅ SIR ) (VI.19) onde SIR é a relação sinal/interferentes de saída. Utilizando (VI.18) e considerando que a potência do sinal desejado é Pm na saída do array, temos que: SIR = Pm = Pi Pm D = I −1 I −1 Pm D (VI.20) 91 Substituindo (VI.20) em (VI.19) encontramos a expressão final para a BER quando utilizamos um array de antenas: 3DS BER array ≈ Q I − 1 (VI.21) Para ilustrar a diferença causada na BER média pela introdução de um array de antenas, imaginemos um sistema CDMA com fator de espalhamento espectral (ganho de processamento) S = 256, e que no array incidem I = 200 sinais. Calculando a BER para o caso de antena omnidirecional (Eq. VI.14), teremos BER omni = 2,5 ⋅ 10 −2 . Se considerarmos agora um array de antenas com um lóbulo secundário 75% menor que o principal e com largura do Á lóbulo principal de 60 , sua diretividade será de cerca de 2,67 [Liberti e Rappaport, 1994], resultando, portanto, numa BER array = 8,2 ⋅ 10−4 (Eq. VI.21), ou seja, numa redução de duas ordens de grandeza. Enxergando essa diferença de um outro modo, podemos calcular o número de sinais incidentes para o qual, utilizando-se o array de antenas com o padrão especificado acima, obtemos a mesma BER de quando usamos uma antena omnidirecional. O resultado é que, se para o caso omnidirecional o número de sinais incidentes para o qual BER omni = 2,5 ⋅ 10 −2 é I omni = 200 , utilizando o array com o padrão especificado acima obtemos a mesma BER média com um número 2,56 vezes maior de incidentes, ou seja I adap = 512 . Se assumirmos que para ambos os casos, com antena omnidirecional e com array de antenas, o número de espalhadores de multipercurso nas células permaneceu constante, o ganho de capacidade do sistema também é de 2,56. A análise acima desconsidera o efeito causado por interferentes localizados em células adjacentes. Em [Liberti e Rappaport, 1994] há a dedução da expressão da BER média na saída do array quando existem oito células co-canal em torno da célula central, cada uma contendo I sinais incidentes com distribuição uniforme. Assume-se também perfeito controle de potência e perda de percurso exponencial do sinal, com expoente igual a quatro. Nessas condições, a BER média tem expressão: 92 3DS BER adap,8 ≈ Q I (1 + 8α ) (VI.22) onde α é uma constante que depende do expoente n da perda de percurso. Tipicamente, para n = 4, α = 0,05513 [Liberti e Rappaport, 1994]. Repetindo os cálculos já realizados para o caso em que se desconsideram as interferências de células vizinhas, para S = 256, I = 200 e D = 2,67, teremos BER array = 4,4 ⋅ 10−3 . E se o número de sinais incidentes para o qual BER omni = 2,5 ⋅ 10 −2 é I omni = 200 , utilizando-se o array especificado, a capacidade aumenta para I adap = 355, ou seja, um ganho de 1,775. Esses resultados encontram-se sumariados na Tabela VI.1. omnidirecional BER @ I = 200 I @ BER = 2,5 ⋅ 10 −2 array sem células array com oito células interferentes (D = 2,67) interferentes (D = 2,67) 2,5 ⋅ 10 −2 8,2 ⋅ 10 −4 4,4 ⋅ 10 −3 200 512 355 Tabela VI.1 - Aumento de performance de um sistema CDMA com array de antenas (S = 256) VI.2 Resultados de Simulações Para avaliarmos os desempenhos dos arrays adaptativos no cancelamento de interferentes co-canal e redução do ruído de multipercurso, desenvolvemos um ambiente de simulação seguindo o mesmo modelo de propagação em multipercurso adotado em [KloucheDjedid e Fujita, 1996]. Segundo o modelo, cada móvel é circundado por um anel de espalhadores igualmente espaçados, fazendo com que o array receba, para cada móvel, um sinal de linha de visada e suas cópias de multipercurso espalhadas dentro de um ângulo ϕ esp 93 (Figura VI.6). O número de espalhadores determina o número de cópias de multipercurso. A direção de chegada da k-ésima cópia do i-ésimo sinal incidente no array pode ser calculada pela relação 1 2π ϕ i , k = ϕ i + ϕ esp sen k 2 (VI.23) ϕesp ϕi ... 1 N Figura VI.6 - Modelo de multipercurso A modulação que utilizamos é a 4-PSK, sendo que os símbolos transmitidos pertencem ao alfabeto { 2 e jπ / 4 2e j 3π / 4 2e j 5π / 4 } 2e j 7π / 4 . As cópias de multipercurso sofrem atrasos temporais de números inteiros de intervalos de símbolo, equiprovavelmente distribuídos entre 0 e 10 intervalos de símbolo. Nas nossas simulações o canal não provoca nenhuma alteração nos envelopes dos sinais, que não sofrem, portanto, desvanecimento. Todas as cópias de multipercurso possuem a mesma potência do sinal de linha de visada ao qual estão associadas. Para o algoritmo CMA, a potência dos raios de multipercurso associados ao sinal desejado sofrem uma redução de amplitude pela metade, para que se evitasse que o algoritmo convergisse para uma delas, já que é o único que não possui sinal de referência e nem informação de direção de chegada do sinal desejado. 94 O sistema desenvolvido permite facilidade para alteração dos seguintes parâmetros: • número de elementos do array; • algoritmo a ser executado; • número de iterações; • número de interferentes; • número de raios de multipercurso para cada sinal incidente; • ângulo ϕ esp de espalhamento de multipercurso; • potência de cada interferente; • direção de chegada (DOA) de cada interferente; • direção de chegada (DOA) do sinal desejado; • relação SNR de entrada; • distância entre os elementos do array. Nosso estudo comparativo baseou-se na análise das seguintes medidas: • Módulo do erro: o erro é a diferença entre o sinal desejado na entrada do array e o sinal de saída. Sua evolução ao longo das iterações nos permite avaliar a velocidade de convergência do array e o valor de regime do erro (após a convergência do algoritmo) permite avaliar o grau de imunidade ao ruído e de cancelamento de interferentes; • Constelação de saída & constelação de entrada: a comparação entre a constelação na entrada do array (corrompida pelos interferentes, raios de multipercurso, atraso de multipercurso e ruído) e a constelação de saída permite avaliar a performance dos algoritmos em termos de número de símbolos errados; • ganho de SINR: compararemos também a relação Pot { sinal} Pot{ ruido} + Pot { interferentes} (SINR) de entrada com a SINR de saída, calculando o ganho de SINR. Esta medida nos permite avaliar o grau de imunidade a ruído e de cancelamento de interferentes 95 do algoritmo. • Porcentagem de símbolos errados: apesar de ter sido calculada para um número muito pequeno de ensaios e de iterações por ensaio para ser considerada uma medida da taxa de erro de símbolos de cada algoritmo, ela nos ajuda a avaliar o desempenho dos algoritmos especificamente nas situações simuladas. • Padrão de irradiação: o padrão de irradiação é o análogo espacial do espectro freqüencial de um filtro temporal. Ele nos dá idéia da capacidade do array em cancelar interferentes e privilegiar o sinal desejado. Os resultados, a menos da constelação de saída, são obtidos através da média aritmética de oito ensaios, cada um com o número de iterações especificado. A constelação apresentada representa o melhor ensaio, dentre os oito, em termos de número de símbolos errados. Primeira Simulação Na nossa primeira simulação definimos os seguintes parâmetros: DOA do sinal desejado -90° SIR 10 dB número de interferentes 1 DOA do interferente 30° número de raios de multipercurso 2 ângulo de espalhamento ϕ esp 50° SNR de entrada 25 dB número de iterações 7000 número de elementos 15 distância entre os elementos 0,5 λ 96 Na Figura VI.7 encontram-se os gráficos de evolução do erro ao longo das iterações de cada um dos cinco algoritmos avaliados. A Figura VI.8 mostra a constelação de entrada (em verde, ou cinza claro em cópias preto & branco) e a constelação de saída (em azul, ou cinza escuro em cópias preto & branco) do array num mesmo gráfico. Os círculos vermelhos representam os pontos da constelação 4PSK utilizada. A Figura VI.9 mostra os padrões de irradiação dos cinco algoritmos testados. O ganho de SINR (SINR de saída - SINR de entrada) e a porcentagem média de símbolos errados foram: algoritmo ganho de % de símbolos SINR (dB) errados LMS 43,4 0 Applebaum 12,0 7,4 CMA 37,8 0 Frost 9,1 41,5 CFLS 18,5 11,0 O fator de passo ( µ ) para os algoritmos LMS e Applebaum foi de 5 ⋅ 10 −3 , para o algoritmo CMA, 5 ⋅ 10 −4 , e para o algoritmo de Frost, 5 ⋅ 10 −6 . Para o algoritmo CFLS, o fator de esquecimento foi ϕ = 1 e a energia inicial do erro de predição, necessária para o cálculo do valor inicial da matriz de autocorrelação do sinal de entrada, foi E 0 = 0,1 . 97 Erro Erro 1.5 1 1 ampl.do erro módulo do erro 1.5 0.5 0.5 0 0 0 1000 2000 3000 4000 iterações 5000 6000 7000 0 1000 2000 3000 4000 iterações (a) 5000 6000 7000 6000 7000 (b) Erro Erro 1.5 1.5 1 módulo do erro módulo do erro 1 0.5 0 1000 2000 3000 4000 iterações 5000 6000 0 7000 0 1000 2000 3000 4000 iterações (c) 5000 (d) Erro 1.5 1 módulo do erro 0 0.5 0.5 0 0 1000 2000 3000 4000 iterações 5000 6000 7000 (e) Figura VI.7 - Módulo do erro. (a) LMS; (b) Applebaum; (c) CMA; (d) Frost; (e) CFLS 98 (a) (b) (c) (d) (e) Figura VI.8 - Constelações de saída. (a) LMS; (b) Applebaum; (c) CMA; (d) Frost; (e) CFLS 99 90 90 1.0552 60 120 0.59226 120 60 0.84415 0.47381 0.63311 0.35535 150 30 150 30 0.42207 0.2369 0.21104 0.11845 180 0 210 180 330 240 0 210 300 330 240 300 270 270 (a) 90 (b) 90 0.73036 120 1.0352 120 60 60 0.82812 0.48691 0.62109 150 150 30 30 0.41406 0.24345 0.20703 180 180 0 210 0 210 330 240 300 240 330 300 270 270 (c) (d) 90 1.0289 120 60 0.82314 0.61735 150 30 0.41157 0.20578 180 0 210 330 240 300 270 (e) Figura VI.9 - Padrões de irradiação. (a) LMS; (b) Applebaum; (c) CMA; (d) Frost; (e) CFLS 100 Segunda Simulação O ambiente simulado aqui é mais árduo que o da primeira simulação. O ângulo de espalhamento de multipercurso ϕ esp foi reduzido de 50° para 20°. Também a potência do interferente foi elevada de -10 dB para -3 dB e o número de elementos, reduzido de 15 para 12. Os parâmetros de simulação são, então: DOA do sinal desejado -90° SIR 3 dB número de interferentes 1 DOA do interferente 30° número de raios de multipercurso 2 ângulo de espalhamento ϕ esp 20° SNR de entrada 25 dB número de iterações 7000 número de elementos 12 distância entre os elementos 0,5 λ Na Figura VI.10 encontram-se os gráficos de evolução do erro ao longo das iterações de cada um dos cinco algoritmos avaliados. A Figura VI.11 mostra a constelação de entrada (em verde, ou cinza claro em cópias preto & branco) e a constelação de saída (em azul, ou cinza escuro em cópias preto & branco) do array num mesmo gráfico. Os círculos vermelhos representam os pontos da constelação 4PSK utilizada. A Figura VI.12 mostra os padrões de irradiação dos cinco algoritmos testados. O ganho de SINR e o número de símbolos errados médio foram: 101 algoritmo ganho de % de símbolos SINR (dB) errados LMS 30,3 0 Applebaum 15,0 4,8 CMA 14,5 2,3 Frost 7,7 40,8 CFLS 21,0 10,1 O fator de passo ( µ ) para os algoritmos LMS e Applebaum foi de 5 ⋅ 10 −3 , para o algoritmo CMA, 5 ⋅ 10 −4 , e para o algoritmo de Frost, 5 ⋅ 10 −6 . Para o algoritmo CFLS, o fator de esquecimento foi ϕ = 1 e a energia inicial do erro de predição, necessária para o cálculo do valor inicial da matriz de autocorrelação do sinal de entrada, foi E 0 = 0,1 . 102 Erro 4 3.5 3.5 3 3 2.5 2.5 módulo do erro módulo do erro Erro 4 2 1.5 2 1.5 1 1 0.5 0.5 0 0 1000 2000 3000 4000 iterações 5000 6000 0 7000 0 1000 2000 3000 4000 iterações (a) 6000 7000 (b) Erro Erro 4 3.5 3.5 3 3 2.5 2.5 módulo do erro 4 2 1.5 2 1.5 1 1 0.5 0.5 0 0 0 1000 2000 3000 4000 iterações 5000 6000 7000 0 1000 2000 3000 4000 iterações (c) 5000 6000 7000 (d) Erro 4 3.5 3 módulo do erro módulo do erro 5000 2.5 2 1.5 1 0.5 0 0 1000 2000 3000 4000 iterações 5000 6000 7000 (e) Figura VI.10 - Módulo do erro. (a) LMS; (b) Applebaum; (c) CMA; (d) Frost; (e) CFLS 103 (a) (b) (c) (d) (e) Figura VI.11 - Constelações de saída. (a) LMS; (b) Applebaum; (c) CMA; (d) Frost; (e) CFLS 104 90 90 4.6606 60 120 2.9023 120 60 2.3218 3.4955 1.7414 2.3303 150 30 150 30 1.1609 1.1652 0.58045 180 0 210 180 330 240 0 210 300 330 240 300 270 270 (a) 90 (b) 90 0.87435 120 60 1.1131 120 60 0.89051 0.65576 0.66788 0.43717 150 30 150 30 0.44525 0.21859 0.22263 180 0 210 180 330 0 210 300 240 330 240 300 270 270 (c) (d) 90 5.4773 120 60 4.3818 3.2864 150 30 2.1909 1.0955 180 0 210 330 240 300 270 (e) Figura VI.12 - Padrões de irradiação. (a) LMS; (b) Applebaum; (c) CMA; (d) Frost; (e) CFLS 105 Discussão Dos algoritmos analisados o LMS foi o que manteve a melhor performance em todos os quesitos avaliados, nas duas simulações. No entanto o LMS treinado constantemente por uma réplica do sinal desejado, como foi feito, não deve ser avaliado como um algoritmo passível de implementação. Sua presença nas simulações portanto possui finalidade apenas de comparação da performance dos outros algoritmos com a performance de um algoritmo atuando em situação extremamente favorável. Mesmo assim nota-se que a performance do CMA na primeira simulação é muito próxima da performance do LMS, apesar de termos que descontar a diferença na SINR de entrada para os dois sinais: enquanto que para o LMS a SINR de entrada foi -9,5 dB, para o CMA foi de -6,0 dB. Como não há nenhum compromisso, na formulação do array de Applebaum, de garantir um determinado ganho na direção do sinal desejado, percebemos que a constelação de saída possui potência diferente da constelação de entrada, o que não acontece com o LMS, que atua no sentido de recuperar o sinal desejado na saída, com o CMA, que tenta recuperar o módulo da constelação transmitida, com o array de Frost, que imprime ganho unitário na direção do sinal desejado ou com o array de Resende, que também possui essa mesma restrição. É interessante notar também que o array de Applebaum manteve uma certa constância de performance nas duas simulações, fato também observado no array de Resende, com índices de SINR de saída melhores. Na comparação dos dois algoritmos com restrição notamos uma clara superioridade do array de Resende sobre o array de Frost, em todos os quesitos. O array de Frost, inclusive, não conseguiu convergir em nenhuma das duas simulações. O último capítulo desta tese é dedicado às conclusões do trabalho e perspectivas para trabalhos futuros, que poderão inclusive conter uma ampliação da análise dos algoritmos realizadas aqui. 106 00 7¡7ÂÃAÄ:Å7 A análise discriminatória que realizamos, separando o ramo detecção do ramo diversidade, não foi encontrada por nós na literatura prévia. Julgamo-la importante pois com ela estabelecemos com clareza as distinções e as fronteiras existentes entre os arrays adaptativos e os esquemas de diversidade. Os arrays adaptativos, apesar de eficientes na detecção de sinais desejados e cancelamento de interferentes, não são viáveis para combate ao desvanecimento, já que os sinais em seus elementos possuem alta correlação, o que permite que se deduzam relações determinísticas entre a fase de um sinal num determinado elemento e a fase desse mesmo sinal num outro elemento qualquer. Já os esquemas de diversidade são eficientes no combate ao desvanecimento por imporem um afastamento entre seus elementos muito maior que a distância coerente do array. Interessante é observarmos que até recentemente as evoluções dos dois ramos eram estancadas, não havendo interação entre eles. A partir do momento em que a viabilidade de utilização dos algoritmos adaptativos espaciais em esquemas de diversidade foi comprovada, abriu-se um campo muito grande de investigação de uma nova solução que possui a habilidade de cancelamento de interferentes em conjunto com a de combate ao desvanecimento. Vimos que essa alternativa foi sugerida no âmbito de aplicações de arrays de antenas em comunicações móveis, que tem sido o grande incentivador de pesquisas em aplicações de processamento espacial. 107 No entanto algumas lacunas ainda devem ser preenchidas para que seja possível uma implementação abrangente dos arrays de antenas em comunicações móveis. Uma das maiores é o desenvolvimento de métodos eficientes de estimação de direção chegada dos sinais desejados, uma vez que os métodos atualmente existentes ainda são computacionalmente muito custosos para uso em sistemas de comunicações móveis, onde a mobilidade dos usuários pode ser grande e a quantidade de sinais também. Sabemos que existem sistemas comerciais que implementam arrays de antenas em estações rádio base para o WLL (Wireless Local Loop). Mas no WLL a mobilidade dos usuários é pequena e por isso mesmo não é difícil conhecer de antemão suas localizações na célula. O grande desafio portanto é extender ao máximo a aplicação dos arrays, inclusive em ambientes com alta mobilidade de usuários. Além disso há que se verificar com mais refino o emprego de algoritmos de arrays adaptativos em esquemas de diversidade. Talvez seja necessário um maior rigor matemático no modelamento dessa situação, já que estamos falando em conciliar esquemas que em essência são muito diferentes. Por exemplo, deve-se saber modelar com mais exatidão o que acontece quando tentamos implementar um algoritmo adaptativo, que originalmente agrega em seu equacionamento a resposta complexa do array a diferentes direções de chegada dos sinais, num esquema de diversidade, onde a direção de chegada é uma variável sem sentido, já que não há nenhuma relação que se possa estabelecer a priori entre a fase do sinal em um elemento e a fase do sinal num elemento adjacente. 108 000 ÆHÇ È¡7 : Anderson, S., Millnert, M., Viberg, M. e Wahlberg, B., “An Adaptive Array for Mobile Communication Systems”, IEEE Trans. on Vehicular Tech., vol. 40, nº1, Fev. 1991 Applebaum, S., “Adaptive Arrays”, IEEE Trans. on Antennas and Propag., AP-24, nº 5, Set. 1976 Baghdady, E. J., ed., Lectures on Communication System Theory, McGraw-Hill, 1961 Balaban, P. e Salz, J., “Dual Diversity Combining and Equalization in Digital Cellular Mobile Radio”, IEEE Trans. on Vehic Tech., vol. 40, nº2, maio/1991 Bigler, L., Lin, H. P., Jeng, S. S. e Xu, G., “Experimental DOA and Spatial Signature Measurements at 900 MHz for Smart Antenna Systems”, Proc. of the 45th IEEE Vehic. Tech. Conf., 1995 Bogachev, V. M. e Kiselev, I. G., “Optimum Combining of Signals in Space-Diversity Reception”, Telecommun. Radio Eng., vol. 34/35, nº10, 1980 Boldrini, J. L., Costa, S. R., Figueiredo, V. L. e Weltzer, H. G., Álgebra Linear, Harper & Row, 1980 109 Brandão, A. L., Quality-Based Algorithms for Diversity and Equalization in Personal Communications, Tese de Doutorado, Department of Electronic and Electrical Eng., The University of Leeds, England, 1995 Brandão, J. C. e Quinaud, E. F., “Fundamentos de Antenas Adaptativas e Aplicação à Comunicação Móvel Celular”, relatório CETUC PASR 08/96, PUC-RJ, 1996 Cadzow, J. A., “A High Resolution Direction of Arrival Algorithm for Narrow-Band Coherent and Incoherent Sources”, IEEE Trans. on Acoustics, Speech and Signal Proc., vol. 36, nº7, jul./1988 Chiba, I., Chujo, W. e Fujise, M., “Beam-Space CMA Adaptive Array Antennas”, Electronics and Comm. in Japan, Part I, vol. 78, nº2, 1995 Compton, Jr, R. T., Adaptive Antennas: Concepts and Performance, Prentice Hall, Englewood Cliffs, NJ, 1988 Compton, Jr., R. T., “An Adaptive Array in a Spread Spectrum System”, Proc. of the IEEE, vol. 66, Mar. 1978 Diniz, P. S. R., Adaptive Filtering: Algorithms and Practical Implementation, Kluwer Academic Pub., 1997 Eng, T. e Kong, N., “Comparison of Diversity Combining Techniques for Raylegh-Fading Channels”, IEEE Trans. on Communications, vol. 44, nº9, set./1996 Failli, M., Digital Land Mobile Radio Communications, COST 207. Commission of the European Communities, 1989 Frost III, O. L., “An Algorithm for Linearly Constrained Adaptive Array Processing”, Proc. of the IEEE, vol. 60, Ago. 1972 110 Gabriel, W. F., “Adaptive Arrays - An Introduction”, Proc. of the IEEE, vol. 64 Fev. 1976 Gabriel, W. F., “Adaptive Processing Array Systems”, Proc. of the IEEE, vol. 80 nº 1, Jan. 1992 Godara, L., C., “Applications of Antenna Arrays to Mobile Communications, Part I: Performance Improvement, Feasibility and System Considerations”, Proc. of the IEEE, vol. 85, nº 7, Jul. 1997 (a) Godara, L., C., “Applications of Antenna Arrays to Mobile Communications, Part II: Beamforming and DOA Considerations”, Proc. of the IEEE, vol. 85, nº 8, Ago. 1997 (b) Golub, G. H. e Van Loan, C. F., Matrix Computations, The Johns Hopkis University Press, 1989 Griffiths, L. J., “A Simple Adaptive Algorithm for Real-Time Processing in Antenna Arrays” Proc. of the IEEE, vol. 57, Out. 1969 Griffiths, L. J. e Jim, C. W., “An Alternative Approach to Linearly Constrained Adaptive Beamforming” IEEE Trans. on Antennas and Prop., vol. AP-30, Jan. 1982 Hansen, P. M. e Loughlin, J. P., “Adaptive Array for Elimination of Multipath Interference at HF”, IEEE Trans. on Antennas and Propag., AP-29, nº 6, Nov. 1981 Haykin, S., ed., Array Signal Processing, Prentice-Hall, N.J., 1984 Haykin, S., Adaptive Filter Theory, Prentice-Hall, N.J., 1996 IEEE Trans. on Antennas Propag., Edição Especial em Antenas Adaptativas e Ativas, vol. 12, Mar. 1964 IEEE Trans. on Antennas Propag., Edição Especial em Antenas Adaptativas, vol. 24, Mar. 111 1976 IEEE Trans. on Antennas Propag., Edição Especial em Sistemas de Processamento Adaptativo em Antenas, vol. 34, Mar. 1986 Ishii, N. e Kohno, R., “Spatial and Temporal Equalization Based on an Adaptive Tapped Delay Line Array Antenna”, IEICE Trans. Comm., vol. E78-B, nº8, ago./1995 Jakes, W. C., Jr., Microwave Mobile Communications, John Wiley & Sons, 1974 Klouche-Djedid, A. E Fujita, M., “Adaptive Array Sensor Processing Applications for Mobile Telephone Communications”, IEEE Trans. on Vehicular Tech., vol. 45, nº 3, Ago. 1996 Krauss, J. D., Antennas, McGraw-Hill, New York, 1950 Krim, H. e Viberg, M., “Two Decades of Array Signal Processing Research: The Parametric Approach”, IEEE Signal Proc. Mag., vol. 13, nº 4, Jul. 1996 Kucar, A., “Mobile Radio: An Overview”, IEEE Comm. Mag., Nov. 1991 Liberti, J. C. Jr., e Rappaport, T. S., “Analytical Results for Capacity Improvements in CDMA”, IEEE Trans. on Vehicular Tech., vol. 43 nº3, ago./1994 Litva, J. e Lo, T. K. Y., Digital Beamforming in Wireless Communications, Artech House, 1996 Liu, H. e Xu, G., “Smart Antennas in Wireless Systems: Uplink Multiuser Blind Channel and Sequence Detection”, IEEE Trans. on Comm., vol. 45, nº2, fev./1997 Liu, H. e Zoltowski, M. D., “Blind Equalization in Antenna Array CDMA Systems”, IEEE Trans. on Signal Proc., vol. 45, nº1, jan./1997 112 Madhow, U., “Blind Adaptive Interference Suppression for the Near-Far Resistant Acquisition and Demodulation of Direct-Sequence CDMA Signals”, IEEE Trans. on Signal Proc., vol. 45, nº1, jan./1997 Mayrargue, S., “A Blind Spatio-Temporal Equalizer for a Radio-Mobile Channel Using the Constant Modulus Algorithm (CMA)”, Proc. of the International Conf. on Acoustics, Speech and Signal Proc. (ICASSP), Adelaide, Austrália, 1994 Miller, M. e Fuhrmann, D., “Maximum Likelihood Narrow-Band Direction Finding and the EM Algorithm”, IEEE Trans. on Acoustics, Speech and Signal Proc., vol. 38, nº9, Set./1990 Misaizu, K., Matsuoka, T., Ohnishi, H., Kohno, R. e Imai, H., “Adaptive Equalization with Dual Diversity Combining”, IEICE Trans. Comm., vol. E76-B, nº2, fev./1993 Mizuno, M. e Ohgane, T., “Application of Adaptive Array Antennas to Radio Communications”, Electronics and Comm. in Japan, part 1, vol. 77, nº 2, Fev. 1994 Naguib, A. F., Paulraj, A. e Kailath, T., “Capacity Improvement with Base-Station Antenna Arrays in Cellular CDMA”, IEEE Trans. on Vehic. Tech., vol. 43, nº3, ago./1994 Naguib, A. F. e Paulraj, A., “Performance Enhancement and Trade-Offs of Smart Antennas in CDMA Cellular Networks”, Proc. of the 45th IEEE Vehic. Tech. Conf., 1995 Ogawa, Y., Ohmiya, M. e Itoh, K., “An LMS Adaptive Array for Multipath Fading Reduction”, IEEE Trans. on Aerospace and Electronic Systems, vol. AES-23, nº 1, Jan. 1987 Ohgane, T., “Characteristics of CMA Adaptive Array for Selective Fading Compensation in Digital Land Mobile Radio Communications”, Electr. and Comm. in Japan, Part I, vol. 74, nº9, 1991 Ohgane, T., Shimura, T., Matsuzawa, N. e Sazaoka, H., “An Implementation of a CMA 113 Adaptive Array for High Speed GMSK Transmission im Mobile Communications”, IEEE Trans. on Vehicular Tech., vol. 42, 1993 Passerini, C., Missiroli, M., Riva, G. e Frullone, M., “Adaptive Antenna Arrays for Reducing the Delay Spread in Indoor Radio Channels”, Electronics Letters, vol. 32, nº4, fev./1996 Paulraj, A. J. e Papadias, C. B., “Space-Time Processing for Wireless Communications: Improving Capacity, Coverage and Quality in Wireless Networks by Exploiting the Spatial Dimension”, IEEE Signal Proc. Mag., vol. 14, Nov. 1997 Petrus, P e Reed, J. H., “Cochannel Interference Rejection for AMPS Signals Using Spectral Correlation Properties and an Adaptive Array”, Proc. of the 45th IEEE Vehic. Tech. Conf., 1995 Pursley, M. B., “Performance Evaluation for Phased-Coded Spread Spectrum MultilpleAccess Communications with Random Signature Sequences”, IEEE Trans. on Comm., vol. 25, ago./1977 Rao, B. D., “Performance Analysis of Root-MUSIC”, IEEE Trans. on Acoustics, Speech and Signal Proc., vol. 37, nº12, Dez./1989 Reddi, S. S., “Multiple Source Location - a Digital Approach”, IEEE Trans. on Aerospace and Elect. Systems, vol. AES-15, nº1, jan./1979 Resende, L.S., Algoritmos Recursivos de Mínimos Quadrados para Processamento Espacial/Temporal com Restrições Lineares : Aplicação em Antenas Adaptativas , Tese de Doutorado FEEC-UNICAMP, Dez. 1996. Riba, J., Goldberg, J. e Vàzquez, G., “Robust Beamforming for Interference Rejection in Mobile Communications”, IEEE Trans. on Signal Proc., vol. 45, nº1, jan./1997 114 Robertson, W. e Phillips, W., “A System of Systolic Modules for the MUSIC Algorithm”, IEEE Trans. on Signal Proc., vol. 39, nº11, nov./1991 Romano, J. M. T. e Brandão, A L., Processamento Digial de Sinais para Comunicações Móveis, Curso de Pós-Graduação, FEEC UNICAMP, 1997 Roy, R. e Kailath, T., “ESPRIT - Estimation of Signal Parameters Via Rotational Invariance Techniques”, IEEE Trans. on Acoustics, Speech and Signal Proc., vol. 37, nº7, Jul./1989 Schmidt, R. O. e Franks, R. E., “Multiple Source DF Signal Processing: An Experimental System”, IEEE Trans. on Antennas and Propag., vol. AP-34, nº3, mar./1986a Schmidt, R. O., “Multiple Emitter Location and Signal Parameter Estimation”, IEEE Trans. on Antennas and Prop., vol. AP-34, nº3, mar./1986b Stoica, P. e Nehorai, A., “MUSIC, Maximum Likelihood and Cramer-Rao Bound”, IEEE Trans. on Acoustics, Speech and Signal Proc., vol. 37, nº5, maio/1989 Takao, K., “Overview of the Theory of Adaptive Antennas”, Electronics and Comm. in Japan, part 1, vol. 76, nº 7, Jul. 1993 Thompson, J. S., Grant, P. M., e Mulgrew, B., “Smart Antenna Arrays for CDMA Systems”, IEEE Personal Communications, out./1996 Treichler, J. R. e Agee, B. G., “A New Approach to Mulipath Correction of Constant Modulus Signals”, IEEE Trans. on Ac., Speech and Sig. Proc., vol. 31, nº 2, abr./1983 Tsoulos, G. V., Beach, M. A. e Swales, S. C., “Adaptive Antennas for Third Generation DSCDMA Cellular Systems”, Proc. of the 45th IEEE Vehic. Tech. Conf., 1995 Van Veen, B. D. e Buckley, K. M., “Beamforming: a Versatile Approach to Spatial Filtering”, IEEE Acoust., Speech, Signal Processing Mag., Abril 1988 115 Vaughan, R. G., “On Optimum Combining at the Mobile”, IEEE Trans. on Vehicular Technology, vol. 37, nº4, nov./1988 Wang, Y. e Cruz, J. R., “Adaptive Antenna Arrays for the Reverse Link of CDMA Cellular Communications Systems”, Electronics Letters, vol. 30, nº13, jun./1994 Wax, M., “Dedection and Localization of Multiple Sources in Noise with Unknown Covariance”, IEEE Trans. on Acoustics, Speech and Signal Proc., vol. 40, nº1, Jan./1992 Wells, M. C., “Increasing the Capacity of GSM Cellular Radio Using Adaptive Antennas”, IEE Proc.-Communications, vol. 143, nº5, out/1996 Widrow, B. et al., “Adaptive Antenna Systems”, Proc. of the IEEE, vol. 55, nº12, Dez. 1967 Widrow, B. e Stearns, S. D., Adaptive Signal Processing, Prentice Hall, Englewood Cliffs, NJ, 1985 Winters, J. H., “Optimum Combining in Digital Mobile Radio with Cochannel Interference”, IEEE Journal on Selected Areas in Comm., Julho 1984 Winters, J. H., “Signal Acquisition and Tracking with Adaptive Arrays in the Digital Mobile Radio System IS-54 with Flat Fading”, IEEE Trans. on Vehic. Tech., vol. 42, nº4, nov./1993 Winters, J. H., Salz, J. e Gitlin, R. D., “The Impact of Antenna Diversity on the Capacity of Wireless Communication Systems”, IEEE Trans. on Comm., vol.42, nº2/3/4, fev./mar./abr./1994 Yacoub, M. D., Foundations of Mobile Radio Engineering, CRC Press, Boca Raton, 1993 116