MOUSE-CÂMERA ATIVADO PELO MOVIMENTO DA CABEÇA
Transcrição
MOUSE-CÂMERA ATIVADO PELO MOVIMENTO DA CABEÇA
II Seminário ATIID - Acessibilidade, TI e Inclusão Digital, São Paulo-SP, 23-24/09/2003 MOUSE-CÂMERA ATIVADO PELO MOVIMENTO DA CABEÇA Nelise DIAS, Jefferson OSOWSKY, Humberto Remigio GAMBA, Percy NOHAMA [email protected] RESUMO: este artigo apresenta um sistema de controle do cursor do mouse pelo movimento da cabeça de uma pessoa que está posicionada na frente do monitor de um microcomputador. No topo desse monitor, coloca-se uma câmera de vídeo colorida com saída padrão NTSC que fica capturando imagens do usuário. Essas imagens são processadas utilizando-se técnicas de processamento digital de imagem, sendo que o objetivo final é relacionar, de modo proporcional, os movimentos de cabeça do usuário (identificados por um círculo azul pintado sobre uma testeira) com o cursor do mouse. As imagens capturadas têm 320 pixels de largura por 240 de altura, montadas no modelo de cor RGB. O algoritmo de localização de círculo foi implementado por meio da Transformada de Hough contendo como parâmetros de entrada: 10 ≤ r ≤ 25 pixels e 15 ≤ θ ≤ 75 graus. Os resultados preliminares vêm demonstrando eficiência no controle da posição do cursor na tela computador. INTRODUÇÃO Estima-se que 2 milhões de pessoas convivem com lesões medulares (SCI) e a cada 49 min uma outra sofre nova lesão (NSCIA, 2003). Desse total, 48,7% ficam tetraplégicos. Para facilitar a realização de suas atividades diárias e propiciar uma vida mais produtiva e feliz, em casa, na escola ou no trabalho, urge criar novos utensílios, dispositivos e equipamentos para esses usuários. Sendo, hoje, o computador um meio de lazer, estudo, trabalho e comunicação, novas ferramentas vêm sendo criadas para melhorar sua acessibilidade (Foggiatto, 2002) e torná-lo mais eficiente nas novas tarefas que surgem. OBJETIVOS Com a impossibilidade de utilizar os membros superiores, as pessoas tetraplégicas ficam privadas do uso dos computadores pessoais. Visando criar um novo dispositivo de entrada independente das mãos, projetou-se um sistema de controle para cursor de mouse por meio do movimento da cabeça de um usuário posicionado à frente de um computador rodando no sistema operacional Windows 95 (ou superior). Sobre o monitor, coloca-se uma câmera de vídeo colorida (padrão NTSC) que captura imagens da cabeça do usuário e, utilizando técnicas de processamento digital de imagens (PDI), converte-as em informações necessárias para que o cursor do mouse se desloque na direção solicitada. Outros dispositivos similares podem ser encontrados no mercado internacional, porém, com tecnologias diferentes da descrita neste projeto: (1) HeadMouse, da Origin Instruments Corp., utiliza dois sensores de infravermelho (IR) distanciados em alguns centímetros para emitir sinais IR que são refletidos pela cabeça do usuário e II Seminário ATIID - Acessibilidade, TI e Inclusão Digital, São Paulo-SP, 23-24/09/2003 recebidos pelo equipamento que calcula o deslocamento que o mouse deve realizar e (2) Smart-Nav, da NaturalPoint Inc. utiliza diodos emissor de luz posicionados na fronte do usuário. A luz emitida é adquirida por uma câmera que está sobre o monitor e um algoritmo calcula a posição do cursor. METODOLOGIA No projeto desenvolvido, uma fita, do tipo testeira esportiva, é colocada na cabeça do usuário. No centro desta fita, há um círculo pintado de azul, que é o ponto de referência que a câmera de vídeo deve procurar quando captura uma imagem. Esta busca pelo centróide é realizada utilizando técnicas de PDI. Uma vez localizada a coordenada, o cursor do mouse é deslocado para a sua nova posição, que é proporcional ao deslocamento do centróide do círculo na imagem capturada. A figura 1 ilustra o sistema implementado. Qualquer movimento da cabeça, horizontal e/ou vertical, desloca o círculo fixado na testeira. Como a câmera de vídeo está recebendo imagens do usuário, este deslocamento refletir-se-á nas imagens, fazendo com que o centróide do círculo mude de coordenada. Esta mudança afetará, proporcionalmente, a posição do cursor do mouse na tela do computador. A figura 2 exemplifica este conceito. O clique simples do mouse é emulado quando o usuário fica pelo menos n segundos sem mover a cabeça e o duplo clique quando fica n+1 segundos. Figura 1: Sistema para controlar o mouse pelo movimento da cabeça. O círculo azul colocado no usuário é a referência das imagens capturaras pela câmera de vídeo sobre o monitor. Técnicas de PDI determinam seu centróide na imagem que proporcionalmente movimenta o cursor do mouse na tela para a posição desejada. A figura 3 mostra todos os algoritmos aplicados nas imagens até se chegar ao objetivo final. RESULTADOS E DISCUSSÃO O aplicativo desenvolvido para o mouse foi montado em linguagem de programação C++. Utilizou-se uma câmera de vídeo colorida WAT-202B da Watec Inc. e uma placa de captura de sinal de vídeo, frame grabber CPH050 da Tview Inc., sendo executado num computador IBM/PC com processador Pentium IV, 1,700 GHz, e 256 Mbytes de memória RAM. As imagens capturadas tinham 320 pixels de largura por 240 de altura, montadas no modelo de cor RGB. O algoritmo de localização de círculos pela Transformada de Hough tinha os seguintes parâmetros de entrada: 10 ≤ r ≤ 25 pixels e 15 ≤ θ ≤ 75 graus. Para o clique do mouse, adotou-se n=2 s. O tempo de processamento de todas as etapas do sistema foi inferior a 67 ms, por isso, foi possível obter uma taxa de captura de frames de 15/s. II Seminário ATIID - Acessibilidade, TI e Inclusão Digital, São Paulo-SP, 23-24/09/2003 Figura 2: Reflexo do movimento da cabeça no cursor do mouse na tela. Uma diferença dx no centróide é relacionada à um deslocamento αdx no cursor e uma diferença dy causa um deslocamento βdy. As constantes α e β determinam a sensibilidade do sistema. As imagens da direita e da esquerda são invertidas porque a câmera de vídeo captura imagens espelhadas. Figura 3: Procedimentos de PDI para localizar o centróide do círculo azul colocado na cabeça do usuário. Segmentação da Cor Azul Imagens coloridas são formadas pela combinação de n canais de informação (Gonzalez, 1993), onde n geralmente é igual a 3. As imagens digitalizadas sempre utilizam o modelo de cor conhecido por RGB, onde R representa o canal vermelho, G o canal verde e B o canal azul. Contudo, este tipo não é o mais adequado para realizar segmentação. Por este motivo, é realizado uma conversão de RGB para HSI, onde H representa a matiz da cor, S sua saturação e I sua intensidade (brilho). O valor da matiz do pixel é dado em graus, sendo que 0º significa vermelho, 60º amarelo, 120º verde, e assim por diante. Para localizar regiões da imagem com pixels da cor azul, é necessário apenas procurar matizes que tenham valores próximos de 240º. Uma nova imagem é então gerada, onde pixels azul são marcados como brancos e os outros como pixels pretos. Localização do Círculo A partir de uma imagem binarizada onde os pixels brancos sejam tratados como objetos e pixels pretos como fundo, a técnica proposta por Hough (Gonzalez, 1993) e Parker (Parker, 1997), chamada atualmente de Transformada de Hough, é reconhecida como sendo uma das mais eficazes na localização de formas geométricas existentes em imagens. Formas II Seminário ATIID - Acessibilidade, TI e Inclusão Digital, São Paulo-SP, 23-24/09/2003 geométricas circulares podem ser identificadas através da equação (1). (1) ρ = K ± k 2 − C , para k 2 − C ≥ 0 , onde K = x ⋅ cos(θ ) + y ⋅ sin(θ ) e C = x 2 + y 2 − r 2 A coordenada (x, y) faz referência a qualquer pixel branco na imagem. A variável r representa o raio do círculo a ser localizado que deve variar num intervalo predeterminado, de acordo com as dimensões da imagem. A distância ρ e o ângulo θ representam a coordenada polar do centroíde do círculo em relação à posição (0, 0) da imagem, canto superior-esquerdo. O ângulo também deve variar dentro de um intervalo específico. O resultado desta transformada é um array 3D, onde uma dimensão é representada por r, outra por θ e a última por ρ. Neste array, os elementos de coordenada (r, θ, ρ) que tiverem valores mais elevados são identificados como círculos de raio r, e coordenada ρ). O polar do centróide (θ, processamento é finalizado quando se converte a coordenada do centróide de representação polar para retangular. Até o presente, foram realizados testes somente com pessoas do próprio laboratório, sem qualquer problema motor e os resultados vêm sendo promissores. AGRADECIMENTOS Os autores agradecem ao CNPq pelo auxílio e bolsas de pesquisa. REFERÊNCIAS GONZALEZ, R.C.; WOODS R.E. Digital (1993) Image Processing. Boston, Addison-Wesley Publishing. NSCIA (2003) About Spinal Cord Injury. www.spinalcord.org; disponível em 2003/07/03. PARKER, J.R. (1997) Algorithms for Image Processing and Computer Vision. New Jersey, Wiley Computer Publishing. FOGGIATTO, M.N.S.; OSOWSKY, J. GAMBA, H.R. NOHAMA, P. (2002) Mouse Ativado pelo Movimento dos Olhos. Anais do XVIII Congresso Brasileiro de Engenharia Biomédica; 5:232-236. Importante: Qualquer citação deste texto ou partes dele, sob qualquer forma ou meio, deve obrigatoriamente incluir, além do título e autor, a menção de "Anais do II Seminário ATIID, São Paulo-SP, 2324/09/2003" disponíveis online em: http://www.fsp.usp.br/acessibilidade