Avaliação da Qualidade de Vídeos Transcodificados

Transcrição

Avaliação da Qualidade de Vídeos Transcodificados
Avaliação da Qualidade de Vídeos Transcodificados
após a Transmissão
Raissa Bezerra Rocha, Carlos Danilo M. Regis e Marcelo Sampaio de Alencar
Instituto de Estudos Avançados em Comunicações (Iecom)
Universidade Federal de Campina Grande (UFCG), Campina Grande, Brasil
Resumo— O uso da TV para dispositivos móveis exige a
redução da dimensão da imagem para que os sinais de vídeos
sejam visualizados de forma adequada. Este artigo apresenta
resultados de análise da transmissão por meio de um canal com
desvanecimento Rayleigh de vídeos transcodificados. Sete tipos de
filtros são utilizados na redução da resolução espacial de vídeos
CIF para vídeos QCIF. A medida de qualidade objetiva PSNR
foi utilizada para avaliação dos vídeos transcodificados.
Palavras-Chave— Transcodificação de Vídeo, TV Móvel, Transmissão de Vídeo.
Abstract— The use of mobile television requires the reduction
of the dimension of the image so that the video signals can
be visualized adequately. This article presents results of the
transmission of transcoded videos through a Rayleigh fading
channel. Seven types of filters are used in the spatial reduction of
CIF videos to QCIF videos. The objective quality metric PSNR
was used to evaluate the transcoded videos.
Keywords— Video transcoding, Mobile TV, Streaming Video.
I. I NTRODUÇÃO
Nos últimos anos, o uso da TV em dispositivos móveis vem
se destacando entre as várias aplicações de multimídia. Entretanto, esse serviço possui certas características que podem
atrapalhar a continuação dessa evolução, como por exemplo: o
custo elevado, a cobertura imperfeita, e a vida curta da bateria
dos dispositivos móveis. A tecnologia tem motivado pesquisas
com o objetivo de desenvolver técnicas para melhorar a
qualidade e aumentar a capacidade dos sistemas móveis.
Para que os sinais de vídeo sejam visualizados adequadamente nos dispositivos móveis é necessário o uso de sistema
de transcodificação de vídeo, que converte um vídeo em uma
outra sequência com diferentes parâmetros, como codificação,
resolução temporal e espacial e taxa de bits.
Nos sistemas multimídias atuais é possível encontrar dispositivos com displays de vários tamanhos, com resolução
inferior à de uma TV convencional, que não precisam receber
o vídeo na resolução de TV padrão. Técnicas de redução
espacial dos vídeos são estudadas para reduzir complexidade
dos sistemas, uma vez que o vídeo com uma resolução menor
representa menor espaço de armazenamento, menor custo
computacional para os dispositivos e menor banda necessária
para a transmissão.
Raissa Bezerra Rocha, Carlos Danilo Miranda Regis, Waslon Terllizzie
A. Lopes e Marcelo Sampaio de Alencar, Instituto de Estudos Avançados
em Comunicações – (Iecom), Universidade Federal de Campina Grande
(UFCG), Campina Grande, Brasil, E-mails: {raissa, danilo, waslon, malencar}@iecom.org.br
Este artigo tem como objetivo discutir a viabilidade do uso
de vídeos em dispositivos móveis, apresentando uma avaliação
da qualidade de vídeos transcodificados transmitidos por meio
de um canal com desvanecimento Rayleigh. A avaliação é realizada utilizando o método objetivo PSNR (Peak Signal Noise
Ratio). Essa avaliação é importante para identificar a qualidade
dos vídeos para os usuários levando em consideração o grau de
degradação da transcodificação dos vídeos. A Figura 1 ilustra
o diagrama de blocos genérico do sistema de comunicações
investigado neste artigo.
Fig. 1. Diagrama de blocos genérico do sistema de comunicações investigado.
A simulação utilizou funções que executam cada uma das
etapas do sistema de comunicações da Figura 1, permitindo
avaliar o desempenho dos vídeos transcodificados mediante
distorções causadas pelo canal de comunicações. As modulações QPSK, 16-QAM e 64-QAM, com diferentes SNRs, foram
utilizadas para verificar a transmissão em diversas situações.
Este artigo encontra-se organizado da seguinte forma. A seção II apresenta as especificações do transcodificador utilizado.
Na seção III são descritas as características dos diferentes
tipos de esquemas de modulação. Na seção IV está descrito o
método de avaliação objetiva PSNR. A apresentação e análise
dos resultados estão na Seção V. Na seção VI são apresentadas
as conclusões.
II. S ISTEMA DE T RANSCODIFICAÇÃO
Um sistema de transcodificação tem o objetivo de converter
uma sequência de vídeo em outra sequência com diferentes
parâmetros. Sintaxe, resolução espacial, resolução temporal,
taxa de bits e adição de funcionalidades, são exemplos de
parâmetros usados [1].
O sistema de transcodificação proposto realiza a conversão
da resolução espacial, no domínio dos pixels, de vídeos com
resolução CIF (Common Intermediate Format - 352 × 288
pixels) para vídeos QCIF (Quarter Common Intermediate Format - 176×144 pixels). Para isto, foi aplicado o subamostrador
com valor 2 e um superamostrador com fator 1, como ilustrado
na Figura 2 (S = 1, N = 2), em que h(v) representa um filtro
passa-baixa. Esses fatores foram escolhidos de acordo com a
taxa de redução espacial dos vídeos (352/176 = 288/144 =
2) e os filtros são posicionados entre o superamostrador e o
subamostrador para garantir que o sinal de saída não apresente
aliasing [2].
Fig. 2.
Interpolador fracional com taxa de S/N .
Os seguintes filtros (h(v)) são utilizados neste trabalho:
• Média dos pixels: Esta técnica substitui os valores de uma
janela de M ×M pixels do quadro do vídeo por um único
pixel, que representado pela média aritmética dos pixels
dentro da janela M × M [3].
• Mediana: A técnica da mediana consiste em ordenar de
forma crescente os valores dos pixels de uma janela M ×
M e escolher o valor mediano dessa ordenação como
sendo o valor do pixel considerado.
• Sigma: O algoritmo calcula a média p e o desvio padrão
σ de uma janela de M × M pixels e verifica quais pixels
estão dentro do intervalo (p − 2σ, p + 2σ). Em seguida,
a média aritmética dos pixels pertencentes ao intervalo é
calculada [4].
• Média Ponderada: Uma média ponderada é obtida pela
média de um conjunto de dados cujas entradas têm pesos
variáveis. Cada peso depende da ordem de vizinhança do
pixel a ser observado em relação ao pixel central s, como
ilustrado na Figura 3. Nesse caso, a suavização é menos
intensa porque o pixel central tem maior importância que
os outros pixels da janela [5].
de TV digital no Brasil [7]. No esquema de modulação QAM
pode ser variado o número de símbolos de acordo com as
necessidades. O aumento do número de símbolos permite que
se aumente as taxas de transmissão, mas provoca um maior
erro na transmissão, como apresentado nessa seção.
A. Quadrature Amplitude Modulation (QAM)
Os esquemas de modulação 16-QAM e 64-QAM (16 - Quadrature Amplitude Modulation e 64 - Quadrature Amplitude
Modulation) são tipos de modulações coerentes com 16 e
64 símbolos, respectivamente, cujas sequências de bits são
divididas em quatro e seis fluxos distintos. Os esquemas de
entrelaçamento são adaptados para inserir um atraso diferente
em cada um dos diferentes fluxos de informações.
As probabilidades de erro de bit (BER) para as modulações
16-QAM and 64-QAM em um canal com desvanecimento
Rayleigh são obtidas da Equação 2 [8] e ilustradas na Figura 4.
PRay =
1
√
log2
log2
√
XM
M
PRay (k),
(2)
k=1
com
√
(
(1−2−k ) M −1
1
PRay (k) = √
M

X
q
1 − q
k−1
w(i, k, M ) = (−1)
w(i, k, M )·
i=0
√
b i·2
M
c
3(2i+1)2 log2 M ·γ
2(M −1)
3(2i+1)2 log2 M ·γ
2(M −1)
)
(3)
 ,
+1
i · 2k−1
1
√
· 2k−1 −
+
. (4)
2
M
em que M é a ordem da modulação, γ = Eb /N0 denota a
relação sinal ruído (SNR) por bit, bxc representa o maior
inteiro menor do que x, e erfc(·) é a função erro complementar,
dado por
Z ∞
2
2
erfc(x) = √
e−t dt.
(5)
π x
Fig. 3.
Representação da vizinhança do pixel central com valor s.
Considerando a Figura 3, o peso pode ser determinado
por [6]
1
1
xs + (x0t + xt + x0u + xu ) +
4
8
1 0
(x + xv + x0z + xz ),
(1)
16 v
em que x e y representam as posições horizontais e verticais
do quadro, respectivamente.
g(x, y) =
III. E SQUEMAS DE M ODULAÇÃO
As modulações PSK e QAM são muito utilizadas nos
sistemas de transmissão sem fio, como por exemplo o sistema
Fig. 4. Curvas de desempenho para as modulações 16-QAM, 64-QAM e
QPSK em um canal com desvanecimento Rayleigh.
TABELA I
F ILTROS USADOS NA TRANSCODIFICAÇÃO ESPACIAL .
B. Quadrature Phase Shift Keying (QPSK)
O QPSK é um esquema de modulação coerente em que
a sequencia de bits é separada em dois canais paralelos,
denominados canal I e canal Q.
A probabilidade de erro de bit (BER) para a modulação
QPSK está ilustrada na Figura 4 e é obtida pela Equação 2,
uma vez que esta modulação é semelhante ao 4-QAM.
IV. M ÉTODO DE AVALIAÇÃO
O método objetivo de avaliação PSNR (Peak Signal Noise
Ratio) é amplamente usado para estimar a qualidade de vídeos,
pois apresenta expressões matemáticas simples, facilitando a
manipulação analítica. É uma relação entre o máximo de potência de um sinal, pela potência do ruído, quando comparados
o sinal antes e depois de um processo de degradação. Desta
forma, quanto maior o valor do PSNR, maior é a relação entre
a potência do sinal pela potência do ruído, o que significa
melhor qualidade.
Para vídeos codificados com 8 bits por pixel, a PSNR é dada
por [9]
2552
,
(6)
PSNR = 10 log10
MSE
em que o MSE é o valor médio dos erros quadráticos entre os
pixels do quadro original e do quadro decodificado. O MSE é
MSE =
1 XX
[F1 (x, y, f ) − F2 (x, y, f )]2 ,
P ·f
x,y
Número
1
2
3
4
5
6
7
8
Filtro
Vídeo Original
Média 3 × 3
Média 4 × 4
Mediana 2 × 2
Mediana 4 × 4
Média Ponderada 3
Sigma 2 × 2
Sigma 3 × 3
diferentes situações de transmissão, com esquemas de modulações QPSK, 16-QAM e 64-QAM e com diferentes valores
de SNRs.
A. Modulação QPSK
Para a modulação QPSK, as seguintes SNRs foram selecionadas: 5 dB, 10 dB, 15 dB, 20 dB e 25 dB e os resultados são
apresentados nas Figuras 5 e 6. Como esperado, os vídeos
originais obtiveram valores maiores de PSNR comparados
aos vídeos transcodificados. Entretanto, a medida que o valor
da SNR diminui, o valor do PSNR dos vídeos originais se
aproxima do valor do PSNR dos vídeos transcodificados.
(7)
f
em que P é o número total de pixels, f o número de quadros,
F1 e F2 representam o quadro original e o transcodificado,
respectivamente.
V. A NÁLISE E R ESULTADOS
Para avaliar a qualidade dos vídeos transcodificados transmitidos por meio do canal com desvanecimento Rayleigh,
foram selecionados os vídeos News e Foreman, por haver
padrões nas resoluções CIF e QCIF, sendo possível usar o
vídeo QCIF como fonte original na comparação com os vídeos
transcodificados nos testes objetivos.
As técnicas de transcodificação utilizadas foram escolhidas
por apresentarem os melhores resultados na transcodificação
de vídeos com resolução CIF para vídeos com resolução
QCIF, considerando as avaliações objetiva e subjetiva, como
apresentado em [6].
Essas técnicas de transcodificação e suas respectivas janelas
deslizantes são apresentadas na Tabela I, em que foram utilizados os filtros da Média com janelas 3 × 3 e 4 × 4, os filtros
da Mediana com janelas 2 × 2 e 4 × 4 e o filtro da Média
Ponderada 3, como descrito pela Equação 1. Além destes, foi
utilizado os filtros Sigma com janelas 2 × 2 e 3 × 3. Para as
janelas 3 × 3 e 4 × 4 o vídeo foi gerado pelos pixels em torno
do pixel de referência.
O objetivo da simulação foi avaliar os efeitos da degradação
nos vídeos originais e transcodificados provocados pelo canal
de transmissão. Essa avaliação foi realizada de acordo com
os resultados obtidos na avaliação objetiva PSNR, analisando
Fig. 5. PSNR para o vídeo News transmitido por um canal com desvanecimento Rayleigh usando modulação QPSK.
Os resultados também indicam que, para as SNRs de 5 dB
e 10 dB, não existem diferenças significativas entre as qualidades dos vídeos transmitidos. Além disso, para esses valores
de SNRs, as PSNRs obtidas para os vídeos transcodificados
são similares aos valores de PSNR dos vídeos originais.
Isso ocorre porque os erros gerados pela transmissão são tão
elevados que não é possível observar o efeito de degradação
do processo de transcodificação na transmissão dos vídeos.
Deste modo, para esses valores de SNRs, a escolha do filtro
não influencia a qualidade do vídeo transmitido.
Para os outros valores de SNR, os resultados mostram que
a melhor qualidade para o vídeo News foi obtida com o filtro
Sigma 2 × 2. Os filtros da Média 3 × 3 e Média Ponderada
3 proporcionaram ao vídeo Foreman a melhor qualidade. A
pior qualidade para os dois vídeos foi obtida com o filtro da
Média 4 × 4.
Fig. 6.
PSNR para o vídeo Foreman transmitido por um canal com
desvanecimento Rayleigh usando modulação QPSK.
B. Modulação 16-QAM
Com objetivo de avaliar a qualidade dos vídeos transmitidos
com a modulação 16-QAM, foram utilizados valores de SNR
de 5 dB, 10 dB, 15 dB, 20 dB, 25 dB e 30 dB. De acordo com
as Figuras 7 e 8, os valores de PSNR dos vídeos originais se
aproximam dos valores de PSNR dos vídeos transcodificados
com a diminuição da SNR.
Fig. 8.
PSNR para o vídeo Foreman transmitido por um canal com
desvanecimento Rayleigh usando modulação 16-QAM.
C. Modulação 64-QAM
Para a modulação 64-QAM, os valores de SNR de 5 dB,
10 dB, 15 dB, 20 dB, 25 dB e 30 dB foram selecionados e os
resultados são apresentados nas Figuras 9 e 10.
Fig. 9. PSNR para o vídeo News transmitido por um canal com desvanecimento Rayleigh usando modulação 64-QAM.
Fig. 7. PSNR para o vídeo News transmitido por um canal com desvanecimento Rayleigh usando modulação 16-QAM.
Deste modo, para valores de SNR abaixo de 10 dB, o alto
índice de erros ocasionados na transmissão dos vídeos não
permite verificar o efeito de degradação da transcodificação
nos vídeos transmitidos, pois os valores de PSNR obtidos para
os vídeos transcodificados são muito semelhantes aos obtidos
para os vídeos originais, sendo irrelevante a escolha do filtro
no processo de transcodificação.
Para os demais valores de SNR, ambos os vídeos obtiveram
os resultados mais baixos de PSNRs com o filtro da Média
4 × 4. Além disso, o filtro Sigma 2 × 2 proporcionou
ao vídeo News a melhor qualidade, enquanto que o vídeo
Foreman obteve a melhor qualidade com os filtros da Média
Ponderada 3 e da Média 3 × 3
Fig. 10.
PSNR para o vídeo Foreman transmitido por um canal com
desvanecimento Rayleigh usando modulação 64-QAM.
Com esse esquema de modulação, a grande quantidade
de erros ocasionados pela transmissão para SNRs abaixo
de 15 dB, faz com que o tipo do filtro utilizado no processo
de transcodificação seja irrelevante, pois os resultados obtidos
para a PSNR dos vídeos originais e vídeos transcodificados
possuem valores semelhantes, assim como para os vídeos
transmitidos transcodificados com os diferentes filtros.
Para valores de SNR acima de 15 dB, o vídeo News
apresentou melhor qualidade quando transcodificado com o
filtro Sigma 2 × 2, enquanto que o vídeo Foreman obteve
maiores valores de PSNR com os filtros da Média Ponderada 3
e da Média 3 × 3. Além disso, quando transcodificados com
o filtro Média 4 × 4, os vídeos apresentaram uma menor
qualidade.
VI. C ONCLUSÕES
Este trabalho apresenta resultados de simulações da transmissão por meio de um canal com desvanecimento Rayleigh de
vídeos originais e transcodificados, considerando os esquemas
de modulações QPSK, 16-QAM e 64-QAM, além de diversos
valores de SNRs.
Os vídeos apresentaram qualidades semelhantes quando as
transmissões foram realizadas com SNRs abaixo de 10 dB
para as modulações QPSK e 16-QAM, e para a modulação 64QAM com SNRs abaixo de 15 dB. Nesses casos, a escolha dos
melhores filtros para a realização da transcodificação deve ser
feita levando em consideração o custo computacional obtido
pelos filtros, devido ao alto nível de erros nos vídeos.
Deste modo, recomenda-se o uso dos filtros da Média 3 × 3
ou o filtro da Mediana 2 × 2 por apresentarem menor tempo
de processamento na transcodificação de vídeos comparados
aos demais filtros, como mostrado em [6].
É possível observar que para todos os valores de SNRs,
os valores obtidos de PSNR com as modulações QPSK e
16-QAM são semelhantes e superiores aos obtidos com a
modulação 64-QAM. Com essa modulação, seria necessário
em média, o acréscimo de 3.6 dB para se obter a mesma
qualidade do vídeo com as modulações QPSK e 16-QAM.
Com os demais valores de SNR, os vídeos transcodificados
com os filtros Sigma 2 × 2, Média 3 × 3 e Média Ponderada 3
obtiveram os melhores desempenhos. Deste modo, o uso desses filtros são recomendados no processo de transcodificação
de vídeos. Todavia, não se recomenda a transcodificação com
o uso do filtro da Média 4 × 4 por ter proporcionado aos
vídeos a pior qualidade em todas as situações verificadas.
Como trabalho futuro será realizada a avaliação subjetiva
usando o método PC (Pair Comparison) dos vídeos transmitidos. Assim, será possível uma melhor análise dos efeitos da
transmissão, uma vez que avaliações objetivas, como PSNR,
possuem pouca correlação com as medidas subjetivas.
R EFERÊNCIAS
[1] J. Xin, C. Lin, and M. Sun, “Digital video transcoding,” Proceedings of
the IEEE, vol. 93, no. 1, pp. 84–97, Jan. 2005.
[2] J. Xin, M.-T. Sun, B.-S. Choi, and K.-W. Chun, “An HDTV-to-SDTV
spatial transcoder,” IEEE Transactions on Circuits and Systems for Video
Technology, vol. 12, no. 11, pp. 998–1008, Nov. 2002.
[3] T. Acharya and A. K. Ray, Image Processing - Principles and Applications. Hoboken, New Jersey, USA: John Wiley & Sons, Inc., 2005.
[4] R. Lukac, B. Smolka, K. Plataniotis, and A. Venetsanopoulos, “Generalized adaptive vector sigma filters,” International Conference on
Multimedia and Expo. ICME ’03., vol. 1, pp. I–537–40 vol.1, July 2003.
[5] R. C. Gonzalez and R. E. Woods, Digital Image Processing. Boston,
MA, USA: Addison-Wesley Longman Publishing Co., Inc., 2001.
[6] C. Regis, D. Morais, M. Alencar, and M. Farias, “Objective and subjective assessment of space-transcoded videos for mobile receivers,” in
IEEE International Symposium on Broadband Multimedia Systems and
Broadcasting, 2009. BMSB ’09., May 2009, pp. 1–6.
[7] M. S. Alencar, Digital Television Systems. Cambridge Univ Press, 2009.
[8] F. M. Waslon T. A. Lopes, Wamberto J. L. Queiroz and M. S. Alencar,
“Exact Bit Error Probability of M-QAM Modulation Over Flat Rayleigh
Fading Channels,” IEEE International Microwave and Optoelectronics
Conference, 2007.
[9] A. O. Julián Cabrera and J. I. Ronda, “Stochastic rate-control of video
coders for wireless channels,” IEEE Transactions on Circuits and Systems
for Video Technology, vol. 12, no. 6, pp. 496–510, June 2002.