Utilização prática de ferramenta para análise de qualidade subjetiva de voz em redes de pacotes (VoIP)

October 3, 2017 | Autor: Victor Mota | Categoria: Voip, VoIP and Video over WLANs, VoIP Performance, Audio and Video Codecs
Share Embed


Descrição do Produto

Utilização prática de ferramenta para análise de qualidade subjetiva de voz em redes de pacotes (VoIP) Victor Ferreira Almeida Mota

Rinaldo Duarte Teixeira de Carvalho

Instituto Nacional de Telecomunicações - Inatel [email protected]

Instituto Nacional de Telecomunicações - Inatel [email protected]

Resumo – Este artigo contém informações e conhecimentos da tecnologia Voz sobre IP. Com ênfase na codificação do sinal de voz, no estudo dos parâmetros de QoS abordando os Serviços Diferenciados (DiffServ), e os tipos de Redes de Comutação. Métodos de avaliação de codec, dividindo em testes subjetivos e objetivos Palavras-chave – VoIP, Codec, QoS, Comutação, MOS, PSQM, PESQ.

Com essa evolução, a comutação por circuitos (rede telefônica) onde necessita de um meio dedicado está perdendo seu lugar e com o passar do tempo está dando lugar para a comutação por pacotes (voz sobre rede de dados) no qual não necessita de um caminho dedicado entre os usuários resultando em um melhor aproveitamento da capacidade da rede. A evolução também é vista a partir dos codecs onde a compreensão do sinal de voz é uma forma de codificar um certo conjunto de informações de maneira que o código gerado seja menor que o fonte.

I. Introdução II. Codificação do Sinal de Voz A. Necessidades e características A. Definição dos codificadores de áudio (codec) O Serviço VoIP foi desenvolvido ao longo da década de 90. Hoje, devido aos acessos de banda larga domésticos não só no Brasil mas também em outros países do mundo, esse novo meio de comunicação tem se expandido entre os usuários domésticos porém, o grande forte dessa tecnologia é a redução de custos que pode ser atingida por uma empresa de telecomunicações ou até mesmo empresas que não são desse ramo mas que precisam interligar seus escritórios espalhados geograficamente.

Um codec de áudio é um dispositivo que irá codificar/decodificar dados de áudio digital de acordo com um determinado tipo de arquivo de áudio. O objetivo do algoritmo de um codec é representar os sinais importantes do áudio com a quantidade mínima de bits (compressão). Isto pode efetivamente reduzir o espaço de armazenamento e a largura de banda exigidos para transmissão do arquivo de voz armazenado. B. Codificadores para o sinal de voz

Fig. 1. Integração Telefone/Computador por meio do VoIP. Artigo recebido em 02 de Abril de 2013; revisado em 02 de Abril de 2013. V. F. A. Mota ([email protected]) e R. D. T. Carvalho ([email protected]) pertencem ao Instituto Nacional de Telecomunicações - Inatel. Av. João de Camargo, 510 - Santa Rita do Sapucaí - MG - Brasil 37540-000.

As técnicas de codificação do sinal de voz são usadas tanto para a transmissão quanto para o armazenamento compacto de sinais de voz. Há vários tipos de codificadores para a voz e cada um com sua taxa de transmissão, nível de complexidade, tamanhos de amostras de voz (payload) resultando em um tempo de pacote. O codec PCM (G.711) define uma representação de voz não compactada cujo a taxa de transmissão será de 64Kb/s. O mais utilizado para voz com compressão será o CSACELP (G.829) cujo a taxa de transmissão será de 8Kb/s. O mesmo representa um resultado na escala do percentual de avaliação da qualidade da conversa (PESQ) próximo ao do sistema PCM onde a não há compactação da voz.

III. Qualidade de Serviço (QoS) A. Definição de QoS Define-se Qualidade de Serviço como a capacidade de transporte de informação pelos elementos da rede com um nível pré-estabelecido, previsível e consistente. Para que o protocolo IP possa ser usado para a integração de serviços existe a necessidade da garantia da QoS. O objetivo da garantia de QoS nas redes IP é fazer com que esta rede possa ser usada para o transporte das mais variadas informações, mas mantendo o comportamento esperado por cada cliente destes serviços.

B. Parâmetros de QoS A indicação dos parâmetros de Qualidade de Serviço necessários a uma aplicação de Voz sobre IP (VoIP) para que esta possa ser executada de forma satisfatória são indicados através de uma SLA (Service Level Agreement – Solicitação de Nível de Serviços). O SLA é definido em contrato da prestadora de serviços e o cliente para que os parâmetros de QoS sejam garantidos. Caso aconteçam falhas no serviço prestado (ou na qualidade do serviço) haverá uma penalidade para o contratante. Para que a prestadora de serviço possa garantir a QoS a todos os clientes (conforme especificado em contrato) ela devera definir uma série de procedimentos de gerencia de rede (Service Level Management).Os principais parâmetros de QoS são: •Largura de Banda ou Vazão – Indica a capacidade de transmissão de dados necessária. •Atraso – Indica o tempo gasto para que uma informação seja entregue pela rede ao destino final. •Jitter – É a parcela variável, principalmente em função do tráfego na rede, do atraso. •Taxa de Erros – Indica a incidência de erros nas informações transmitidas. •Disponibilidade – Capacidade da rede de transportar informações em um determinado instante. •Perda de pacotes – Durante as transmissões quando a rede estiver congestionada, alguns pacotes podem ser perdidos durante as transmissões. Atualmente qualquer serviço de comunicação precisa de um tipo de comutação para fazer a transmissão do sinal analógico ou do sinal digital. Cada modo explora a característica de cada transmissão para se ter uma transmissão de certo modo próximo a transmissão perfeita, (sem atraso, perdas, etc). No mínimo, as aplicações sempre precisam de vazão e no caso da tecnologia VoIP precisamos sempre ter um atraso mínimo, jitter baixo e perda de pacotes mínima para uma perfeita comunicação de voz. C.Técnicas de Implementação de QoS A solução de Serviços Diferenciados provê QoS em uma rede IP a partir de um mecanismos de priorização. Esta solução não faz uso de nenhum tipo de reserva de capacidade da rede, apenas prioriza determinados tráfegos. A priorização pode ser feita a partir de uma indicação no

cabeçalho IP no campo DSCP (Differentiaded Services Codepoint) que foi definida pelo IETF através da recomendação 2474. Na definição dos Serviços Diferenciados estão previstos 3 níveis de encaminhamento,sendo eles: •Encaminhamento Expresso – Mais adequado para aplicações ponta a ponta que necessitam de pouca perda,baixo atraso e taxa de transmissão garantida. •Encaminhamento Assegurado – Se aproxima ao de uma rede com pouco tráfego, mesmo nas situações de congestionamento. Esse mecanismo classifica as informações dentro de um conjunto de 4 classes e em cada uma dessas classes existem 3 níveis de prioridade. Podem ser usados vários parâmetros como referência para a classificação, como endereços de origem e destino, tipo de serviço, protocolo de transporte, etc. •Melhor Esforço – Este é o nível de QoS oferecido por uma rede IP sem que nenhum mecanismo de garantia de QoS seja implementado.É o comportamento observado pela internet e o possui o nível mais baixo de QoS. Vale ressaltar que em uma rede qualquer, existem roteadores que consegue distinguir a diferenciação da rede como também há roteadores que não conseguem fazer essa diferenciação no serviço resultando em um tratamento igual para qualquer dispositivo da rede.

IV. Redes de Comutação A. Definição de Redes de Comutação Atualmente qualquer serviço de comunicação precisa de um tipo de comutação para fazer a transmissão do sinal analógico ou do sinal digital. Cada modo explora a característica de cada transmissão para se ter uma transmissão de certo modo próximo a transmissão perfeita, (sem atraso, perdas, etc). B. Tipos de Redes de Comutação •Redes de Comutação de Circuitos – Após o estabelecimento da conexão, os recursos são alocados somente para esta ligação, tem como vantagem uma capacidade de transmissão sempre disponível e uma desvantagem como o desperdício da capacidade do meio se o tráfego não for constante. Como exemplo tem-se a rede telefônica que funciona através da comutação de circuitos. •Redes de Comutação de Mensagens – A comutação de mensagens trata cada mensagem como uma entidade independente. Cada mensagem contém informações de endereço que descrevem o destino da mensagem dentro da rede. A vantagem é que tem um melhor aproveitamento da capacidade da rede e sua desvantagem é que as grandes mensagens levam muito tempo para serem entregues. •Redes de Comutação de Pacotes – A comutação de pacotes seria a solução para a desvantagem da comutação de mensagens. As mensagens são divididas em pacotes menores e tem como vantagem a melhoria do desempenho da rede de comutação de mensagens.

C. Modos de Comutação de Pacotes B. Diferentes formas de qualificação •Datagrama – O modo datagrama, significa que o serviço trata cada pacote como uma mensagem independente. Cada pacote é roteado independentemente na inter-rede e cada roteador decide qual segmento da rede deve ser adotado na próxima etapa da rota de rede. Este modo é critico para aplicações em voz e tem como exemplo a ser dado a internet.

3

1 3

1

1

3

2

2

1

Não é criada nenhuma conexão entre emissor e receptor

Fig. 2. .Imagem ilustrativa do funcionamento do método datagrama.

Existem modelos subjetivos onde a partir da avaliação da percepção de qualidade de voz por pessoas obtêm-se um resultado, e modelos objetivos que a partir de algoritmos computacionais estimam a capacidade de percepção do áudio utilizando diversos fatores como, por exemplo, o conhecimento das características sonoras de diferentes línguas. O critério de qualidade varia de acordo com a aplicação pretendida e com o público usuário, que pode ser mais ou menos exigente, dependendo de suas características culturais além de que cada região tem sua língua, dialeto o que influência na análise de QoS. Com isso faz se o uso de medições subjetivas, especialmente em casos em a confiabilidade do sistema deve ser alta. O fato de ter um custo, complexidade e tempo demandado para poder ter um resultado por meio subjetivo faz-se mais o uso da realização de medidas objetivas que estimem a qualidade subjetiva de maneira eficiente. C. Análise Subjetiva

•Circuito virtual – O modo circuito virtual, significa que a rede se comporta como um circuito físico dedicado, estabelecido entre os dispositivos que estão se comunicando. Quando os dispositivos iniciam uma sessão, eles negociam os parâmetros do tamanho máximo de mensagens, janelas de comunicação, caminhos de rede, etc.

3

2

1

• MOS (Mean Opinion Score) A escala MOS faz-se uma analogia a um grau de satisfação do ouvinte o qual avalia parâmetros como inteligibilidade, conforto, identificação dos interlocutores. Esta avaliação é obtida a partir de pessoas isentas e tem como ponto negativo a questão de ser um processo caro e demorado.

3 1 2

2 1

3

Ruim

1 ...

...

... 5

Excelente

Escala MOS : Conexão criada entre emissor e receptor

Fig.4. .Classificação MOS. Fig.3. .Imagem ilustrativa do funcionamento do método circuito virtual.

No caso da transmissão de voz, o modo a ser utilizado será a comutação de pacotes por circuito virtual. Onde se estabelece uma rota fixa para a transmissão e a os pacotes irão chegar em ordem correta para não causar um erro na comunicação.

V. Avaliação dos Codecs A. Intenções da avaliação de codecs

O avanço das técnicas de processamento digital de sinais proporcionou um crescente interesse em métodos e dispositivos de codificação de voz mais eficientes. A avaliação da qualidade de codecs de voz é necessária para o desenvolvimento destes dispositivos e também para o projeto de redes digitais de telecomunicações [1].

Fig.5. .Comparativo da Escala MOS com o Grau de Satisfação.

D. Análise Objetiva • PSQM (Percentual Quality Measurement) O método PSQM (Perceptual Speech Quality Measure) foi desenvolvido por John G. Beerends e J.A. Stemerdinks do KPI Researches, em reposta a necessidade de haver um método objetivo que avaliasse a qualidade de fluxos de voz. Publicado pelo ITU como Recomendação P.861 [2] em 1996 tem grande aceitação como uma medida consistente e eficaz baseada em fatores de percepção humana. O PSQM é um processo matemático que provê a medição da qualidade subjetiva da fala. O objetivo é produzir scores confiáveis que predizem valores de testes subjetivos (MOS). No entanto os scores PSQM têm uma escala diferente e refletem a medida de distância perceptual, isto é, os scores PSQM refletem quantitativamente a divergência de um sinal original de um sinal distorcido, uma vez que este foi presumidamente processado por algum sistema de telefonia. Com isso o PSQM não considera as degradações provocadas pela rede ao sinal de voz, ele compara matematicamente o stream transmitido com o stream recebido.

Ruim

1 ...

...

... 6,5

Excelente

Escala PSQM Fig.5. .Classificação PSQM.

O valor PSQM pode ser convertido para a escala MOS de acordo com a equação abaixo, apesar de que existem outras fórmulas de relacionar ambas avaliações.

Fig.6. .Equação que relaciona PSQM e MOS.

• PSQM+ (Percentual Quality Measurement Plus) Apesar de ter se mostrado um método com alta correlação entre medidas subjetivas e objetivas, o PSQM não se mostrou eficaz nos casos em que os sinais de voz continham supressão de trechos de voz e/ou distorções provocadas por excesso de volume. Em outras palavras, PSQM poderia reportar uma melhor qualidade sobre estas

condições as quais um ouvinte poderia atribuir. Fez-se então necessário um aperfeiçoamento, tendo como resultado o PSQM+. A escala PSQM+ passa a considerar as degradações inseridas pela rede durante a transmissão do fluxo de bits. Degradações, como o jitter, passam a ser considerados. • PESQ (Perceptual Evaluation of Speech Quality)

O PESQ é o atual padrão da ITU-T para avaliação de Codecs de voz. (Recomendação P.862.1). Prevê avaliações de voz em faixa larga (8KHz) P.862.2. Diferentemente dos outros modelos de avaliação de codecs, como o PSQM e PSQM +, o PESQ é capaz de estimar a qualidade subjetiva da voz com uma boa correlação e considerando uma grande variedade de condições, que podem incluir desde distorções de codificação, erros, ruídos, filtragem, atraso e atraso variável. O PESQ reúne as melhores características do PAMS e PSQM, combinando a técnica robusta de time-alignment do PAMS com o eficiente modelo perceptual do PSQM, e adiciona novos métodos incluindo equalização de função transferência e novo método para cálculo da média da distorção sobre o tempo. O PESQ apresenta precisão aceitável em seus resultados, quando a clareza da voz é afetada pelos seguintes processos ou parâmetros [3]: • Codecs de forma de onda (por exemplo, G.711, G.726 e G.727); • Codecs híbridos (a partir de 4kbps) incluindo aqueles de múltiplas taxas de transmissão (exemplos: G.728, G.729 e G.723.1); • Transcodificações (conversão de um formato digital para outro); • Erros no canal de transmissão; • Efeitos da variação do atraso em testes apenas de escuta; • Perda de pacotes/células; • Ruído ambiente no lado transmissor; • Taxa de transmissão nos casos de codecs com mais de um modo de operação; • Deformações temporais do sinal de áudio.

Conclusão Pode-se concluir que testes de avaliação subjetiva da qualidade de serviço de voz representam claramente a sensibilidade do usuário quanto à qualidade, mas estes apresentam baixa escalabilidade e custo elevado, obrigando a procurar alternativas para que auxilie nesta avaliação. Os métodos subjetivos vão de encontro com esta necessidade, seja utilizando métodos perceptuais, que se baseiam nas características fisiológicas do ser humano, ou através de detalhes particulares de cada língua diferente. De acordo com o que foi verificado neste artigo, pode-se afirmar que entre os métodos de avaliação objetiva de qualidade de fluxo de voz baseados em modelos perceptuais, o PESQ apresenta maior correlação, com os resultados de testes subjetivos, sendo o mais indicado, apesar de sua eficácia está também relacionada com a rede em avaliação. Como o mundo hoje tende cada vez mais a convergir às pessoas terem telefones inteligentes com conexões de Internet sem fio, o VoIP vai oferecer aos consumidores muitas opções para chamadas de telefone sem fio. Chamadas de VoIP feitas de um smartphone habilitado para Internet custam muito menos do que chamadas de telefone celular normal e telefone fixo.

Referências Bibliográficas [1] Leandro Andrada Roda Marinho, Metodologias de Avaliação de Qualidade de Fluxos de Voz, Artigo, Universidade Federal Fluminense UFF, Niterói 2007; [2] ITU-T Recommendation P.861, Objective quality measurement of telephone-band speech codecs. Genève 1996; [3] Arthur Callado, Gabriel Fernandes, Auristela Silva, Rodrigo Barbosa, Djamel Sadok e Judith Kelner, Construção de Redes de Voz sobre IP, Minicurso VoIP SBRC – Pará, 2007; [4] Orientações de Mário Ferreira Especialista em Redes VoIP do Inatel Competence Center; [5] ITU-T Recommendation P.862, Perceptual evaluation of speech quality (PESQ): An objective method for end-to-end speech quality assessment of narrow-band telephone networks and speech codecs. 2001

Lihat lebih banyak...

Comentários

Copyright © 2017 DADOSPDF Inc.