Avaliação da Qualidade de Vídeos Transcodificados
Transcrição
Avaliação da Qualidade de Vídeos Transcodificados
Avaliação da Qualidade de Vídeos Transcodificados após a Transmissão Raissa Bezerra Rocha, Carlos Danilo M. Regis e Marcelo Sampaio de Alencar Instituto de Estudos Avançados em Comunicações (Iecom) Universidade Federal de Campina Grande (UFCG), Campina Grande, Brasil Resumo— O uso da TV para dispositivos móveis exige a redução da dimensão da imagem para que os sinais de vídeos sejam visualizados de forma adequada. Este artigo apresenta resultados de análise da transmissão por meio de um canal com desvanecimento Rayleigh de vídeos transcodificados. Sete tipos de filtros são utilizados na redução da resolução espacial de vídeos CIF para vídeos QCIF. A medida de qualidade objetiva PSNR foi utilizada para avaliação dos vídeos transcodificados. Palavras-Chave— Transcodificação de Vídeo, TV Móvel, Transmissão de Vídeo. Abstract— The use of mobile television requires the reduction of the dimension of the image so that the video signals can be visualized adequately. This article presents results of the transmission of transcoded videos through a Rayleigh fading channel. Seven types of filters are used in the spatial reduction of CIF videos to QCIF videos. The objective quality metric PSNR was used to evaluate the transcoded videos. Keywords— Video transcoding, Mobile TV, Streaming Video. I. I NTRODUÇÃO Nos últimos anos, o uso da TV em dispositivos móveis vem se destacando entre as várias aplicações de multimídia. Entretanto, esse serviço possui certas características que podem atrapalhar a continuação dessa evolução, como por exemplo: o custo elevado, a cobertura imperfeita, e a vida curta da bateria dos dispositivos móveis. A tecnologia tem motivado pesquisas com o objetivo de desenvolver técnicas para melhorar a qualidade e aumentar a capacidade dos sistemas móveis. Para que os sinais de vídeo sejam visualizados adequadamente nos dispositivos móveis é necessário o uso de sistema de transcodificação de vídeo, que converte um vídeo em uma outra sequência com diferentes parâmetros, como codificação, resolução temporal e espacial e taxa de bits. Nos sistemas multimídias atuais é possível encontrar dispositivos com displays de vários tamanhos, com resolução inferior à de uma TV convencional, que não precisam receber o vídeo na resolução de TV padrão. Técnicas de redução espacial dos vídeos são estudadas para reduzir complexidade dos sistemas, uma vez que o vídeo com uma resolução menor representa menor espaço de armazenamento, menor custo computacional para os dispositivos e menor banda necessária para a transmissão. Raissa Bezerra Rocha, Carlos Danilo Miranda Regis, Waslon Terllizzie A. Lopes e Marcelo Sampaio de Alencar, Instituto de Estudos Avançados em Comunicações – (Iecom), Universidade Federal de Campina Grande (UFCG), Campina Grande, Brasil, E-mails: {raissa, danilo, waslon, malencar}@iecom.org.br Este artigo tem como objetivo discutir a viabilidade do uso de vídeos em dispositivos móveis, apresentando uma avaliação da qualidade de vídeos transcodificados transmitidos por meio de um canal com desvanecimento Rayleigh. A avaliação é realizada utilizando o método objetivo PSNR (Peak Signal Noise Ratio). Essa avaliação é importante para identificar a qualidade dos vídeos para os usuários levando em consideração o grau de degradação da transcodificação dos vídeos. A Figura 1 ilustra o diagrama de blocos genérico do sistema de comunicações investigado neste artigo. Fig. 1. Diagrama de blocos genérico do sistema de comunicações investigado. A simulação utilizou funções que executam cada uma das etapas do sistema de comunicações da Figura 1, permitindo avaliar o desempenho dos vídeos transcodificados mediante distorções causadas pelo canal de comunicações. As modulações QPSK, 16-QAM e 64-QAM, com diferentes SNRs, foram utilizadas para verificar a transmissão em diversas situações. Este artigo encontra-se organizado da seguinte forma. A seção II apresenta as especificações do transcodificador utilizado. Na seção III são descritas as características dos diferentes tipos de esquemas de modulação. Na seção IV está descrito o método de avaliação objetiva PSNR. A apresentação e análise dos resultados estão na Seção V. Na seção VI são apresentadas as conclusões. II. S ISTEMA DE T RANSCODIFICAÇÃO Um sistema de transcodificação tem o objetivo de converter uma sequência de vídeo em outra sequência com diferentes parâmetros. Sintaxe, resolução espacial, resolução temporal, taxa de bits e adição de funcionalidades, são exemplos de parâmetros usados [1]. O sistema de transcodificação proposto realiza a conversão da resolução espacial, no domínio dos pixels, de vídeos com resolução CIF (Common Intermediate Format - 352 × 288 pixels) para vídeos QCIF (Quarter Common Intermediate Format - 176×144 pixels). Para isto, foi aplicado o subamostrador com valor 2 e um superamostrador com fator 1, como ilustrado na Figura 2 (S = 1, N = 2), em que h(v) representa um filtro passa-baixa. Esses fatores foram escolhidos de acordo com a taxa de redução espacial dos vídeos (352/176 = 288/144 = 2) e os filtros são posicionados entre o superamostrador e o subamostrador para garantir que o sinal de saída não apresente aliasing [2]. Fig. 2. Interpolador fracional com taxa de S/N . Os seguintes filtros (h(v)) são utilizados neste trabalho: • Média dos pixels: Esta técnica substitui os valores de uma janela de M ×M pixels do quadro do vídeo por um único pixel, que representado pela média aritmética dos pixels dentro da janela M × M [3]. • Mediana: A técnica da mediana consiste em ordenar de forma crescente os valores dos pixels de uma janela M × M e escolher o valor mediano dessa ordenação como sendo o valor do pixel considerado. • Sigma: O algoritmo calcula a média p e o desvio padrão σ de uma janela de M × M pixels e verifica quais pixels estão dentro do intervalo (p − 2σ, p + 2σ). Em seguida, a média aritmética dos pixels pertencentes ao intervalo é calculada [4]. • Média Ponderada: Uma média ponderada é obtida pela média de um conjunto de dados cujas entradas têm pesos variáveis. Cada peso depende da ordem de vizinhança do pixel a ser observado em relação ao pixel central s, como ilustrado na Figura 3. Nesse caso, a suavização é menos intensa porque o pixel central tem maior importância que os outros pixels da janela [5]. de TV digital no Brasil [7]. No esquema de modulação QAM pode ser variado o número de símbolos de acordo com as necessidades. O aumento do número de símbolos permite que se aumente as taxas de transmissão, mas provoca um maior erro na transmissão, como apresentado nessa seção. A. Quadrature Amplitude Modulation (QAM) Os esquemas de modulação 16-QAM e 64-QAM (16 - Quadrature Amplitude Modulation e 64 - Quadrature Amplitude Modulation) são tipos de modulações coerentes com 16 e 64 símbolos, respectivamente, cujas sequências de bits são divididas em quatro e seis fluxos distintos. Os esquemas de entrelaçamento são adaptados para inserir um atraso diferente em cada um dos diferentes fluxos de informações. As probabilidades de erro de bit (BER) para as modulações 16-QAM and 64-QAM em um canal com desvanecimento Rayleigh são obtidas da Equação 2 [8] e ilustradas na Figura 4. PRay = 1 √ log2 log2 √ XM M PRay (k), (2) k=1 com √ ( (1−2−k ) M −1 1 PRay (k) = √ M X q 1 − q k−1 w(i, k, M ) = (−1) w(i, k, M )· i=0 √ b i·2 M c 3(2i+1)2 log2 M ·γ 2(M −1) 3(2i+1)2 log2 M ·γ 2(M −1) ) (3) , +1 i · 2k−1 1 √ · 2k−1 − + . (4) 2 M em que M é a ordem da modulação, γ = Eb /N0 denota a relação sinal ruído (SNR) por bit, bxc representa o maior inteiro menor do que x, e erfc(·) é a função erro complementar, dado por Z ∞ 2 2 erfc(x) = √ e−t dt. (5) π x Fig. 3. Representação da vizinhança do pixel central com valor s. Considerando a Figura 3, o peso pode ser determinado por [6] 1 1 xs + (x0t + xt + x0u + xu ) + 4 8 1 0 (x + xv + x0z + xz ), (1) 16 v em que x e y representam as posições horizontais e verticais do quadro, respectivamente. g(x, y) = III. E SQUEMAS DE M ODULAÇÃO As modulações PSK e QAM são muito utilizadas nos sistemas de transmissão sem fio, como por exemplo o sistema Fig. 4. Curvas de desempenho para as modulações 16-QAM, 64-QAM e QPSK em um canal com desvanecimento Rayleigh. TABELA I F ILTROS USADOS NA TRANSCODIFICAÇÃO ESPACIAL . B. Quadrature Phase Shift Keying (QPSK) O QPSK é um esquema de modulação coerente em que a sequencia de bits é separada em dois canais paralelos, denominados canal I e canal Q. A probabilidade de erro de bit (BER) para a modulação QPSK está ilustrada na Figura 4 e é obtida pela Equação 2, uma vez que esta modulação é semelhante ao 4-QAM. IV. M ÉTODO DE AVALIAÇÃO O método objetivo de avaliação PSNR (Peak Signal Noise Ratio) é amplamente usado para estimar a qualidade de vídeos, pois apresenta expressões matemáticas simples, facilitando a manipulação analítica. É uma relação entre o máximo de potência de um sinal, pela potência do ruído, quando comparados o sinal antes e depois de um processo de degradação. Desta forma, quanto maior o valor do PSNR, maior é a relação entre a potência do sinal pela potência do ruído, o que significa melhor qualidade. Para vídeos codificados com 8 bits por pixel, a PSNR é dada por [9] 2552 , (6) PSNR = 10 log10 MSE em que o MSE é o valor médio dos erros quadráticos entre os pixels do quadro original e do quadro decodificado. O MSE é MSE = 1 XX [F1 (x, y, f ) − F2 (x, y, f )]2 , P ·f x,y Número 1 2 3 4 5 6 7 8 Filtro Vídeo Original Média 3 × 3 Média 4 × 4 Mediana 2 × 2 Mediana 4 × 4 Média Ponderada 3 Sigma 2 × 2 Sigma 3 × 3 diferentes situações de transmissão, com esquemas de modulações QPSK, 16-QAM e 64-QAM e com diferentes valores de SNRs. A. Modulação QPSK Para a modulação QPSK, as seguintes SNRs foram selecionadas: 5 dB, 10 dB, 15 dB, 20 dB e 25 dB e os resultados são apresentados nas Figuras 5 e 6. Como esperado, os vídeos originais obtiveram valores maiores de PSNR comparados aos vídeos transcodificados. Entretanto, a medida que o valor da SNR diminui, o valor do PSNR dos vídeos originais se aproxima do valor do PSNR dos vídeos transcodificados. (7) f em que P é o número total de pixels, f o número de quadros, F1 e F2 representam o quadro original e o transcodificado, respectivamente. V. A NÁLISE E R ESULTADOS Para avaliar a qualidade dos vídeos transcodificados transmitidos por meio do canal com desvanecimento Rayleigh, foram selecionados os vídeos News e Foreman, por haver padrões nas resoluções CIF e QCIF, sendo possível usar o vídeo QCIF como fonte original na comparação com os vídeos transcodificados nos testes objetivos. As técnicas de transcodificação utilizadas foram escolhidas por apresentarem os melhores resultados na transcodificação de vídeos com resolução CIF para vídeos com resolução QCIF, considerando as avaliações objetiva e subjetiva, como apresentado em [6]. Essas técnicas de transcodificação e suas respectivas janelas deslizantes são apresentadas na Tabela I, em que foram utilizados os filtros da Média com janelas 3 × 3 e 4 × 4, os filtros da Mediana com janelas 2 × 2 e 4 × 4 e o filtro da Média Ponderada 3, como descrito pela Equação 1. Além destes, foi utilizado os filtros Sigma com janelas 2 × 2 e 3 × 3. Para as janelas 3 × 3 e 4 × 4 o vídeo foi gerado pelos pixels em torno do pixel de referência. O objetivo da simulação foi avaliar os efeitos da degradação nos vídeos originais e transcodificados provocados pelo canal de transmissão. Essa avaliação foi realizada de acordo com os resultados obtidos na avaliação objetiva PSNR, analisando Fig. 5. PSNR para o vídeo News transmitido por um canal com desvanecimento Rayleigh usando modulação QPSK. Os resultados também indicam que, para as SNRs de 5 dB e 10 dB, não existem diferenças significativas entre as qualidades dos vídeos transmitidos. Além disso, para esses valores de SNRs, as PSNRs obtidas para os vídeos transcodificados são similares aos valores de PSNR dos vídeos originais. Isso ocorre porque os erros gerados pela transmissão são tão elevados que não é possível observar o efeito de degradação do processo de transcodificação na transmissão dos vídeos. Deste modo, para esses valores de SNRs, a escolha do filtro não influencia a qualidade do vídeo transmitido. Para os outros valores de SNR, os resultados mostram que a melhor qualidade para o vídeo News foi obtida com o filtro Sigma 2 × 2. Os filtros da Média 3 × 3 e Média Ponderada 3 proporcionaram ao vídeo Foreman a melhor qualidade. A pior qualidade para os dois vídeos foi obtida com o filtro da Média 4 × 4. Fig. 6. PSNR para o vídeo Foreman transmitido por um canal com desvanecimento Rayleigh usando modulação QPSK. B. Modulação 16-QAM Com objetivo de avaliar a qualidade dos vídeos transmitidos com a modulação 16-QAM, foram utilizados valores de SNR de 5 dB, 10 dB, 15 dB, 20 dB, 25 dB e 30 dB. De acordo com as Figuras 7 e 8, os valores de PSNR dos vídeos originais se aproximam dos valores de PSNR dos vídeos transcodificados com a diminuição da SNR. Fig. 8. PSNR para o vídeo Foreman transmitido por um canal com desvanecimento Rayleigh usando modulação 16-QAM. C. Modulação 64-QAM Para a modulação 64-QAM, os valores de SNR de 5 dB, 10 dB, 15 dB, 20 dB, 25 dB e 30 dB foram selecionados e os resultados são apresentados nas Figuras 9 e 10. Fig. 9. PSNR para o vídeo News transmitido por um canal com desvanecimento Rayleigh usando modulação 64-QAM. Fig. 7. PSNR para o vídeo News transmitido por um canal com desvanecimento Rayleigh usando modulação 16-QAM. Deste modo, para valores de SNR abaixo de 10 dB, o alto índice de erros ocasionados na transmissão dos vídeos não permite verificar o efeito de degradação da transcodificação nos vídeos transmitidos, pois os valores de PSNR obtidos para os vídeos transcodificados são muito semelhantes aos obtidos para os vídeos originais, sendo irrelevante a escolha do filtro no processo de transcodificação. Para os demais valores de SNR, ambos os vídeos obtiveram os resultados mais baixos de PSNRs com o filtro da Média 4 × 4. Além disso, o filtro Sigma 2 × 2 proporcionou ao vídeo News a melhor qualidade, enquanto que o vídeo Foreman obteve a melhor qualidade com os filtros da Média Ponderada 3 e da Média 3 × 3 Fig. 10. PSNR para o vídeo Foreman transmitido por um canal com desvanecimento Rayleigh usando modulação 64-QAM. Com esse esquema de modulação, a grande quantidade de erros ocasionados pela transmissão para SNRs abaixo de 15 dB, faz com que o tipo do filtro utilizado no processo de transcodificação seja irrelevante, pois os resultados obtidos para a PSNR dos vídeos originais e vídeos transcodificados possuem valores semelhantes, assim como para os vídeos transmitidos transcodificados com os diferentes filtros. Para valores de SNR acima de 15 dB, o vídeo News apresentou melhor qualidade quando transcodificado com o filtro Sigma 2 × 2, enquanto que o vídeo Foreman obteve maiores valores de PSNR com os filtros da Média Ponderada 3 e da Média 3 × 3. Além disso, quando transcodificados com o filtro Média 4 × 4, os vídeos apresentaram uma menor qualidade. VI. C ONCLUSÕES Este trabalho apresenta resultados de simulações da transmissão por meio de um canal com desvanecimento Rayleigh de vídeos originais e transcodificados, considerando os esquemas de modulações QPSK, 16-QAM e 64-QAM, além de diversos valores de SNRs. Os vídeos apresentaram qualidades semelhantes quando as transmissões foram realizadas com SNRs abaixo de 10 dB para as modulações QPSK e 16-QAM, e para a modulação 64QAM com SNRs abaixo de 15 dB. Nesses casos, a escolha dos melhores filtros para a realização da transcodificação deve ser feita levando em consideração o custo computacional obtido pelos filtros, devido ao alto nível de erros nos vídeos. Deste modo, recomenda-se o uso dos filtros da Média 3 × 3 ou o filtro da Mediana 2 × 2 por apresentarem menor tempo de processamento na transcodificação de vídeos comparados aos demais filtros, como mostrado em [6]. É possível observar que para todos os valores de SNRs, os valores obtidos de PSNR com as modulações QPSK e 16-QAM são semelhantes e superiores aos obtidos com a modulação 64-QAM. Com essa modulação, seria necessário em média, o acréscimo de 3.6 dB para se obter a mesma qualidade do vídeo com as modulações QPSK e 16-QAM. Com os demais valores de SNR, os vídeos transcodificados com os filtros Sigma 2 × 2, Média 3 × 3 e Média Ponderada 3 obtiveram os melhores desempenhos. Deste modo, o uso desses filtros são recomendados no processo de transcodificação de vídeos. Todavia, não se recomenda a transcodificação com o uso do filtro da Média 4 × 4 por ter proporcionado aos vídeos a pior qualidade em todas as situações verificadas. Como trabalho futuro será realizada a avaliação subjetiva usando o método PC (Pair Comparison) dos vídeos transmitidos. Assim, será possível uma melhor análise dos efeitos da transmissão, uma vez que avaliações objetivas, como PSNR, possuem pouca correlação com as medidas subjetivas. R EFERÊNCIAS [1] J. Xin, C. Lin, and M. Sun, “Digital video transcoding,” Proceedings of the IEEE, vol. 93, no. 1, pp. 84–97, Jan. 2005. [2] J. Xin, M.-T. Sun, B.-S. Choi, and K.-W. Chun, “An HDTV-to-SDTV spatial transcoder,” IEEE Transactions on Circuits and Systems for Video Technology, vol. 12, no. 11, pp. 998–1008, Nov. 2002. [3] T. Acharya and A. K. Ray, Image Processing - Principles and Applications. Hoboken, New Jersey, USA: John Wiley & Sons, Inc., 2005. [4] R. Lukac, B. Smolka, K. Plataniotis, and A. Venetsanopoulos, “Generalized adaptive vector sigma filters,” International Conference on Multimedia and Expo. ICME ’03., vol. 1, pp. I–537–40 vol.1, July 2003. [5] R. C. Gonzalez and R. E. Woods, Digital Image Processing. Boston, MA, USA: Addison-Wesley Longman Publishing Co., Inc., 2001. [6] C. Regis, D. Morais, M. Alencar, and M. Farias, “Objective and subjective assessment of space-transcoded videos for mobile receivers,” in IEEE International Symposium on Broadband Multimedia Systems and Broadcasting, 2009. BMSB ’09., May 2009, pp. 1–6. [7] M. S. Alencar, Digital Television Systems. Cambridge Univ Press, 2009. [8] F. M. Waslon T. A. Lopes, Wamberto J. L. Queiroz and M. S. Alencar, “Exact Bit Error Probability of M-QAM Modulation Over Flat Rayleigh Fading Channels,” IEEE International Microwave and Optoelectronics Conference, 2007. [9] A. O. Julián Cabrera and J. I. Ronda, “Stochastic rate-control of video coders for wireless channels,” IEEE Transactions on Circuits and Systems for Video Technology, vol. 12, no. 6, pp. 496–510, June 2002.
Documentos relacionados
Avaliação de técnicas de redução da resolução espacial de vídeos
mediana, moda, sigma e média ponderada, com janelas de 2 × 2, 3 × 3 e 4 × 4. Para a avaliação da qualidade dos vídeos transcodificados foram usados os métodos objetivos PSNR e SSIM e o método subje...
Leia mais