WirelessBR

WirelessBr é um site brasileiro, independente, sem vínculos com empresas ou organizações, sem finalidade  comercial,  feito por voluntários, para divulgação de tecnologia em telecomunicações 

MÉTODOS DE CODIFICAÇÃO DE VOZ - UMA INTRODUÇÃO   (4) 

José de Ribamar Smolka Ramos

Esta página contém duas figuras grandes. Aguarde a carga se a conexão estiver lenta.

Métodos de Codificação de Voz – Uma Introdução (4)

Repetindo o trecho final da página anterior:

Se a freqüência de amostragem for menor que este valor, ocorre perda de informação, e o sinal original não pode mais ser recuperado sem distorção. Este fenômeno é conhecido como aliasing.
Se a freqüência de amostragem for superior ao mínimo estabelecido pelo teorema de Nyquist, ocorre um "espalhamento" das cópias do espectro original. Esta situação de super-amostragem (oversampling) é útil, como veremos depois. A figura 5, na próxima página, representa estas situações.

 

Figura 5 - Aliasing e Oversampling
 

O segredo é determinar, de acordo com a natureza da aplicação, a freqüência limite ωc e a freqüência de amostragem ωa. Em sinais de voz existem muitas componentes de freqüência alta, mas estudos determinaram que, para as necessidades de inteligibilidade e discernibilidade em aplicações de telefonia, as componentes de freqüência importantes estão contidas na faixa de 500 Hz a 3,5 KHz.

Então, para este tipo de aplicação, vamos forçar o sinal original a ficar limitado em faixa na freqüência
fc=4 KHz (correspondente a ωc=8.p Krad/s). Isto pode ser feito passando o sinal de saída do microfone por um filtro passa-baixa, que corta todas as componentes acima de 4 KHz. Este filtro é denominado de anti-alias (porque ele vai prevenir a ocorrência de aliasing na amostragem). Como é difícil (e caro) construir um filtro analógico perfeito, com atenuação infinita em uma freqüência precisa, o que se faz é oversampling e depois descarte seletivo das amostras em excesso, num processo conhecido como dizimação (decimation). O efeito final é de um filtro anti-alias digital, com freqüência de corte exatamente em 4 KHz.

Resumindo o que vimos até aqui: na transmissão geramos um sinal PAM, e na recepção recuperamos o sinal original, por filtragem simples do sinal PAM. Mas o sinal PAM não é digital.
Ele é discreto no tempo, com cada amostra podendo assumir uma faixa contínua de valores. Para transformar o sinal PAM em um sinal digital, fazemos um processo chamado quantização.

Para quantizar, primeiro precisamos saber os limites de excursão do sinal PAM gerado na amostragem. Da mesma forma que usamos um filtro para limitar as freqüências do sinal a amostrar, usamos um filtro para limitar a amplitude do sinal analógico de entrada, o que torna a excursão máxima do sinal PAM conhecida (dica: não adianta gritar ao telefone, porque o volume máximo transmitido é limitado). Supondo que o sinal PAM nos dê amostras do valor da tensão elétrica na saída do microfone em função do tempo, e que estas amostras variam entre os valores mínimo (V
min) e máximo (Vmax), dividindo o intervalo de excursão do sinal PAM em n sub-intervalos iguais, montamos a tabela 1:
 

Tabela 1

Cada amostra do sinal PAM é comparada com esta tabela, para verificar em qual dos sub-intervalos ela se encaixa. Daí para a frente, a amostra passa a ser representada pelo número binário que identifica o sub-intervalo de quantização onde ela se encaixou. O valor de n (número de sub-intervalos) escolhido determina a quantidade de bits necessários para representar cada amostra do sinal PAM.

O problema deste método de representação ocorre na recepção. Tudo que o receptor conhece sobre uma determinada amostra é o número (binário) do sub-intervalo onde ela foi classificada pelo transmissor. O receptor não tem como determinar qual o valor exato da amostra dentro daquele sub-intervalo, então ele faz uma aproximação, assumindo que o valor da amostra recuperada é igual ao valor médio do sub-intervalo ao qual ela pertence. Isto causa uma distorção no sinal PAM recuperado, conhecido como erro de quantização (quantization error) ou ruído de quantização (quantization noise).

Para minimizar o erro de quantização basta utilizar um número n de sub-intervalos adequado à natureza da aplicação. Para aplicações de telefonia, n=256 (amostras representadas por números binários com 8 bits de tamanho) dá resultado satisfatório. Para aplicações de áudio de alta fidelidade (CDs) usa-se n=65536 (amostras representadas por números binários com 16 bits de tamanho).

A figura 6 , na próxima página, mostra um diagrama de blocos para o processo de conversão A/D (analógico/digital) e D/A (digital/analógico) que foi descrito.

 

Home WirelessBR                    Anterior                    Próxima