Análise do uso de diferentes bandas de cores na detecç ˜ao do

Transcrição

Análise do uso de diferentes bandas de cores na detecç ˜ao do
Análise do uso de diferentes bandas de cores na detecção do
disco óptico em imagens de retina
Fernando A. Sousa, Luckas M. R. dos Santos e Rodrigo de M. S. Veras
1
Departamento de Computação
Universidade Federal do Piauı́
Teresina, PI, Brasil
{assuncao,luckasmoreno,rveras}@ufpi.edu.br
Abstract. In this work, we sought to develop several processing techniques to
locate the optical disc (OD) of images on the retina. Find the DO in a retinal
image improves the chances of detecting non-systemic and systemic diseases
such as diabetes, hypertension and arteriosclerosis. The location also serves
as input to detect other anatomical structures of the retina and macula such
as blood vessels, for this purpose have been implemented and compared six
different algorithms that use different approaches to detection of DO, making
use of four color bands in five image databases in the public domain.
Resumo. Neste trabalho procura-se desenvolver várias técnicas de processamento para a localização do disco óptico (DO) em imagens de retina. Encontrar o DO em uma imagem da retina melhora as chances de detectar doenças
não-sistêmicas e sistêmicas, como a diabetes, a hipertensão e a arteriosclerose. A sua localização também serve como entrada para a detecção de outras
estruturas anatômicas da retina, tais como mácula e vasos sanguı́neos. Para
esta finalidade foram implementados e comparados seis algoritmos diferentes
que utilizam diversas abordagens para detecção do DO, fazendo uso de quatro
bandas de cores, em cinco bases de imagem de domı́nio público.
1. Introdução
O olho humano é responsável pela capacidade do homem interagir visualmente com o
meio ambiente que o rodeia. Baseado em um conjunto de processos quı́micos e fı́sicos
básicos, o olho transforma estı́mulos luminosos em estı́mulos elétricos e envia-os ao
cérebro para que possam ser interpretados.
A retina constitui a membrana mais interna do olho, situando-se na sua parede
posterior. Quando o olho focaliza uma cena, a imagem correspondente é projetada sobre a
retina. A análise da retina pode prover informações sobre mudanças patológicas causadas
por doenças oculares locais e sinais recentes de doenças sistemáticas como hipertensão,
arterioesclerose, diabetes mellitus [Hoover and Goldbaum 2003] [Tobin et al. 2007]. A
Figura 1 mostra uma ilustração da retina humana.
O disco ótico aparece no lado esquerdo desta imagem destacado com o cı́rculo
branco. Esta estrutura constitui em uma imagem de retina saudável a parte mais brilhante e também a região de convergência dos vasos. Em uma retina normal, as várias
propriedades (forma, cor, tamanho e convergência dos vasos) auxiliam na identificação
do disco óptico. Existem diversos algoritmos para detecção dessa importante região da
retina. [Hoover and Goldbaum 2003] [Veras et al. 2014]
O trabalho de Veras et al [Veras et al. 2014] em comparação a este tem uma
diferença, pois na abordagem dele não houve uma verificação de qual método que apresentou melhor resultado decorrente da banda de cor utilizada, ele verifica qual dos
métodos teve melhor taxa de acerto. Já este além de verificar qual o método com melhor
taxa de acerto, verifica-se com qual banda de cor predominou nas taxas de melhor acerto.
Figura 1. Imagem da retina humana e suas principais estruturas.
Normalmente algoritmos de detecção do DO fazem uso de um canal de cor especı́fico muitas vezes baseado empiricamente no conjunto de imagens utilizados para
teste, o que muitas vezes elevam suas taxas de acerto.
O objetivo principal deste trabalho é descrever a influência do canal de cor em
seis métodos de detecção do DO implementados a partir de trabalhos de proposição
dos seguintes autores: [Liu et al. 1997], [Akram et al. 2010], [Rajaput et al. 2011],
[Sekar and Nagarajan 2012], [Punnolil 2013] e [Zubair et al. 2013], comparando o desempenho em seu canal de cor originalmente proposto a outros três canais em imagens de
retina com diferentes caracterı́sticas.
2. Materiais e Métodos
2.1. Canais de cor utilizados
As imagens coloridas são resultantes da combinação de três imagens obtidas, cada uma
em um canal diferente R (red), G (green), B (blue). Quando se trata de imagens coloridas
de retina, muitos trabalhos afirmam que o canal verde (G) contém o melhor contraste entre
os elementos e o fundo, enquanto no canal vermelho (R) é encontrado muita saturação e
o canal azul na maioria dos casos não contém informação relevante.[Guerra 2008]
Dessa forma, além de avaliarmos os canais R e G, também, avaliamos outras
combinações dado pelas equações 1 e 2. [Gonzalez and Woods 2011]
D = 0, 5R + 0, 5G
Y = 0, 299R + 0, 5876G + 0, 114B
(1)
(2)
A primeira imagem (D) é formada pela associação dos canais R e G. Esperava-se
que na imagem resultante o DO apareça como uma região mais homogênea e destacada do
fundo da imagem. Já a imagem resultante da equação 2 representa a luminância(medida
de intensidade de luz refletida). Utilizamos a luminância visto que o DO normalmente
apresenta a caracterı́stica de ser mais brilhante em relação a outras partes da imagem.
2.2. Métodos de detecção de DO utilizados para avaliação dos canais de cor
O método de [Liu et al. 1997] utiliza a transformada Circular de Hough (TCH) para identificar o DO através de uma metodologia que detecta formas geométricas em imagens
digitais. No algoritmo mesmo podendo interferir na detecção de bordas, os autores usaram a componente vermelha, pois com uso dessa componente não aparecem os vasos
sanguı́neos do DO. Este algoritmo leva em consideração somente a diferença do fundo da
imagem e o brilho do DO.
O método de Akram et al introduzido em [Akram et al. 2010] utiliza um algoritmo onde inicialmente a imagem de entrada é transformada para a banda verde, posteriormente, os autores aplicaram um filtro de média no canal verde para remover o ruı́do
resultante no fundo da imagem. Como o DO é considerado uma parte brilhante no fundo
de uma imagem de retina, os autores buscaram a região onde tinham os pixels com maior
intensidade segundo o histograma da imagem. Estes pixels localizados são identificados
como a região de interesse (ROI). A partir da ROI, eles extraem o DO aplicando a TCH e
marcam um cı́rculo onde foi localizado.
O método de [Rajaput et al. 2011] faz a localização da fóvea em imagens coloridas de retina, o qual considera um conhecimento a priori do diâmetro e centro do DO. Em
virtude dessa informação os autores propuseram um método de detecção do DO. Com este
objetivo, os autores aplicam um equalização de histograma no canal vermelho da imagem
para realçar o contraste. Em seguida, a imagem é invertida e as áreas de mı́nima intensidade são identificadas utilizando a TCH, empiricamente os autores definiram o valor de
h (altura limite) como 20 pixels. O resultado desse processamento é uma imagem binária
com os pixels brancos representando as regiões de mı́nima intensidade da imagem original. Essas regiões de mı́nimo são pixels conectados e que possuem o mesmo valor de
intensidade e cujo os pixels da borda externa possuem um valor de intensidade mais alto.
Sekar e Nagarajan propuseram em [Sekar and Nagarajan 2012] um método para
localização do DO baseado em uma abordagem de agrupamento de histograma. Neste
métodos, primeiro é necessário determinar as regiões candidatas, agrupando os 1% dos
pixels mais intensos na banda vermelha em imagens de retina. Em seguida, é gerada
uma imagem verde contendo os agrupamentos de pixels mais intensos gerados no passo
anterior, esta nova imagem gerada na banda verde é processada por três métodos independentes chamados de método de máxima variância, máxima diferença e filtro gaussiano.
Após esta etapa os autores analisam o histograma das três subimagens retornadas por
estes métodos e analisam aquela que possuir um maior número de pixels na banda azul.
Em [Punnolil 2013] é apresentado um sistema para detecção e classificação automática de gravidade do edema macular. Para esta finalidade, o centro DO foi detectado
e a região da fóvea foi localizada utilizando as informações dos vasos da retina. Para
detecção do DO os autores aplicaram um operador de fechamento morfológico no canal
verde da imagem com elemento estruturante de raio 15 para eliminar os vasos sanguı́neos
da região do DO. Um operador de vizinhança em coluna foi aplicado usando uma janela
deslizante de tamanho 11 x 11. A imagem resultante foi binarizada com um valor de limiar de 0,95 com base em uma estimativa interativa para cada imagem. Por fim, o centro
da região resultante da binarização é fixado como sendo o centro do DO.
Em Zubair et al [Zubair et al. 2013] é proposto um método para detecção de DO e
que inicialmente seleciona o canal verde em imagem colorida de retina. Posteriormente,
é feita uma equalização do histograma para melhorar as caracterı́sticas da imagem e um
alongamento do contraste utilizando uma operação morfológica de erosão para remover
os candidatos que não são DO e posteriormente é feita uma dilatação com elemento estruturante próximo ao tamanho do DO, o candidato que possuir maior contraste em relação
aos outros candidatos detectados é escolhido como o DO.
2.3. Bases de Imagens
Para testar o desempenho dos algoritmos foram utilizadas cinco bases de imagens,
a saber: STARE [Hoover and Goldbaum 2003], DRIVE [Staal et al. 2004], DRISHTI,
ARIA [Damian 2006] e DRIONS [Carmona et al. 2008]. Tais bases apresentam imagens com diferentes formatos, patologias e caracterı́sticas como luminosidade, tamanho,
posição e raio do DO definidos manualmente por especialistas. A tabela 1 exibe as
informações de cada base.
Tabela 1. Bases de imagens.
Qtd. Total
Qtd. Saudáveis
Qtd. Doentes
Resolução(pixels
Câmera
Formato
TopCon TRV-50
JPEG
Canon CR5 3CCD
JPEG
Zeiss FF450+
TIFF
–
JPEG
–
JPEG
STARE
402
36
67
700 × 605
DRIVE
40
–
–
768 × 584
ARIA
116
61
55
768× 576
DRIONS
110
–
–
600×400
DRISHTI
101
–
–
2896×1944
3. Resultados e Discussões
Neste trabalho será utilizado uma metodologia de avaliação que é taxa de sucesso que
avalia a proximidade da marcação dos métodos individuais em relação ao DO. Tobin et
al. em [Tobin et al. 2007], introduziu uma metodologia simples para avaliar o desempenho de métodos de detecção de DO, o que compara as coordenadas estimadas (xE ,yE )
marcadas pelo método para um par de coordenadas que foi marcado manualmente, como
o centro do DO(xDO ,yDO ). Esta abordagem exibe o resultado como sucesso se a equação
3 for válida, nos casos em que a distância entre dois pontos for menor ou igual a um raio
(1R).
q
(xDO − xE )2 + (yDO − yE )2 ≤ 1R,
(3)
Para realizar a avaliação dos algoritmos implementados foi utilizado a metodologia de avaliação proposta na equação 3 em um total de 420 imagens utilizando os quatro
canais de cor (R, G, D, Y) nas 5 bases descritas na seção 2.2. A fim de comparar o desempenho dos métodos foi realizada uma avaliação global dos algoritmos utilizando a média
da taxa de sucesso de todas as bases para cada canal de cor como pode ser ilustrado na
Figura 2.
Figura 2. Resultado comparativo em todas as bases.
De uma maneira geral, pode-se afirmar que o método do obteve melhor taxa
de sucesso no canal vermelho foi [Akram et al. 2010] com (77,80%) seguido por
[Rajaput et al. 2011] com 71,80%, no canal verde [Rajaput et al. 2011] obteve 86,15%.
Já na junção dos canais vermelho e verde (D) [Punnolil 2013] teve melhor desempenho
com 78,76%, e por fim nas imagens em tons de cinza [Rajaput et al. 2011] obteve novamente a maior taxa de acerto com 86,15%.
4. Conclusão e Trabalhos Futuros
Na avaliação utilizando imagens com diversas caracterı́sticas (formato, cor, tamanho)
concluı́-se que houve muita variação nos resultados e que o algoritmo deve ser especı́fico
para o canal de cor, visto que a utilização deste canal de cor escolhido tende a ser melhor
no conjunto de imagens que este método vai ser implementado.
Como trabalho futuros irá ser pesquisada a influência da utilização de imagens
saudáveis ou com alguma patologia na influência do resultado geral e posteriormente
aprofundar pesquisas para detecção de DO no canal D, pois os melhores resultados foram
obtidos neste canal.
Referências
Akram, M. U., Khan, A., Iqbal, K., and Butt, W. H. (2010). Retinal images: Optic disk
localization and detection. In Aurélio Campilho, M. K., editor, International Cnference
on Image Analysis and Recognition, volume 6112, pages 40–49.
Carmona, E., Rincon, M., Garcia-Feijoo, J., and de-la Casa, J. M. M. (2008). Identification of the optic nerve head with genetic algorithms. Artificial Intelligence in Medicine,
43(3):243–259.
Damian, F. (2006). Aria online, retinal image archive. http://www.eyecharity.
com/aria_online/.
Gonzalez, R. C. and Woods, R. E. (2011). Processamento Digital De Imagens. Pearson
Education, 3 edition.
Guerra, R. A. A. (2008). Identificação automática do disco óptico em imagens coloridas
da retina. Master’s thesis, Faculdade de Engenharia da Universidade do Porto, Porto.
Hoover, A. and Goldbaum, M. (2003). Locating the optic nerve in a retinal image using
the fuzzy convergence of the blood vessels. IEEE Transactions on Medical Imaging,
22(8):951–958.
Liu, Z., Opas, C., and Krishnan, S. (1997). Automatic image analysis of fundus photograph. In Proceedings 19th IEEE Engineering in Medicine and Biology Society Annual
Conference, volume 2, pages 524–525, Chicago, IL, EUA.
Punnolil, A. (2013). A novel approach for diagnosis and severity grading of diabetic
maculopathy. Advances in Computing, Communications and Informatics (ICACCI),
2013 International Conference on, pages 1230–1235.
Rajaput, G. G., Reshmi, B. M., and Sidramappa, C. (2011). Automatic localization of
fovea center using mathematical morpology in fundus images. International Journal
of Machine Intelligence, 3(4):172–179.
Sekar, G. B. and Nagarajan, M. P. (2012). Localisation of optic disc in fundus images by
using clustering and histogram techniques. In International Conference on Computing,
Electronics and Electrical Technologies - ICCEET, pages 584 – 589.
Staal, J., Abramoff, M. D., Niemeijer, M., Viergever, M. A., and Ginneken, B. V. (2004).
Ridge-based vessel segmentation in color images of the retina. IEEE Transactions on
Medical Imaging, 23(4):501–509.
Tobin, K. W., Chaum, E., Govindasamy, V. P., and Karnowski, T. P. (2007). Detection of
anatomic structures in human retinal imagery. IEEE Transactions on Medical Imaging,
26(12):1729–1739.
Veras, R., Medeiros, F., Santos, L., and Assunção, F. (2014). A comparative study of optic
disc detection methods on five publicly available database. In Workshop de Informática
Médica, Brasilia, Brasil.
Zubair, M., Yamin, A., and Khan, S. (2013). Automated detection of optic disc for the
analysis of retina using color fundus image. In IEEE International Conference on
Imaging Systems and Techniques, pages 239 – 242, Beijing.