Filtros Wavelets para Separação Cega de Sinais de Voz

June 8, 2017 | Autor: B. Rodrigues de O... | Categoria: Blind Source Separation, Speech Processing, Wavelets

Descrição do Produto

UNIVERSIDADE ESTADUAL PAULISTA “JÚLIO DE MESQUITA FILHO”

Campus de Ilha Solteira

Bruno Rodrigues de Oliveira

Filtros Wavelets para Separação Cega de Sinais de Voz

Ilha Solteira - SP Setembro-2014

UNIVERSIDADE ESTADUAL PAULISTA “JÚLIO DE MESQUITA FILHO”

Campus de Ilha Solteira

PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA

Filtros Wavelets para Separação Cega de Sinais de Voz

Bruno Rodrigues de Oliveira

Orientador: Prof. Dr. Jozué Vieira Filho Coorientador: Prof. Dr. Marco Ap. Queiroz Duarte

Dissertação apresentada ao Programa de Pós Graduação em Engenharia Elétrica - UNESP Campus de Ilha Solteira, para composição de nota de aprovação na disciplina Estudos Especiais II. Área de Conhecimento: Automação.

Ilha Solteira - SP Setembro-2014

RESUMO Neste trabalho um sistema de separação cega de fontes baseado num algoritmo de diagonalização, denominado AMUSE, será estudado. A intenção principal é introduzir uma etapa de pré-processamento, filtragem, utilizando a transformada Wavelet, e verificar como tal sistema se comporta e quais as vantagens e desvantagens da utilização desses filtros. Para avaliação da performance e comparação com métodos comuns, será utilizado o algoritmo BSS Evaluation. Palavras-chaves: Filtros Wavelets. Separação Cega de Fontes. AMUSE.

SUMÁRIO 1

INTRODUÇÃO

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

1.1

Estado da Arte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

1.2

Aplicações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

1.3

Organização do Trabalho . . . . . . . . . . . . . . . . . . . . . . . . . 13

2

SEPARAÇÃO CEGA DE FONTES . . . . . . . . . . . . . . . . . . . 15

2.1

Modelagem Matemática . . . . . . . . . . . . . . . . . . . . . . . . . . 15

2.2

Um Algoritmo para solução do problema BSS . . . . . . . . . . . . . 19

2.2.1

Decomposição em Valores Singulares . . . . . . . . . . . . . . . . . . . . . 19

2.2.2

AMUSE (Algorithm for Multiple Unknown Signal Extraction) . . . . . . . . 20

2.2.3

Definições Gerais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

2.2.4

Identificabilidade e Ortogonalidade . . . . . . . . . . . . . . . . . . . . . . 23

2.2.5

Algoritmo AMUSE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

3

FILTROS WAVELETS . . . . . . . . . . . . . . . . . . . . . . . . . . 29

3.1

Banco de Filtros de Dois Canais . . . . . . . . . . . . . . . . . . . . . 29

3.2

Representação Matricial de Sistemas de Filtros . . . . . . . . . . . . 32

4

AVALIAÇÃO DE ALGORITMO BSS . . . . . . . . . . . . . . . . . . 37

4.1

Interpretação das Medidas de Avaliação . . . . . . . . . . . . . . . . 40

5

FILTROS WAVELETS APLICADO AO PROBLEMA BSS . . . . . . 43

5.1

O Método Proposto . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

5.2

Resultados e Discussões dos Testes Realizados . . . . . . . . . . . . 45

5.2.1

Teste 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

5.2.2

Teste 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

5.2.3

Teste 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

5.2.4

Teste 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

5.3

Conclusão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

6

CONSIDERAÇÕES FINAIS . . . . . . . . . . . . . . . . . . . . . . . 55 Referências . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

LISTA DE ILUSTRAÇÕES Figura 1 – Exemplo de um problema BSS com duas fontes . . . . . . . . . . . . . 16 Figura 2 – Esquema de Banco de Filtros de Dois canais . . . . . . . . . . . . . . . 29 Figura 3 – Algoritmo Piramidal proposto por Mallat . . . . . . . . . . . . . . . . 36 Figura 4 – Forma de onda do canto de um pássaro . . . . . . . . . . . . . . . . . . 41 Figura 5 – Forma de onda de sirene de ambulância . . . . . . . . . . . . . . . . . 41 Figura 6 – Algoritmo BSS comum . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 Figura 7 – Filtragem Wavelet em algoritmo BSS . . . . . . . . . . . . . . . . . . . 44 Figura 8 – Formas de onda de sinais de voz masculino e feminino

. . . . . . . . . 45

Figura 9 – Sinais da figura 8 após processo de mistura . . . . . . . . . . . . . . . . 46 Figura 10 – Fontes Estimadas para o Teste 1 pelo método comum . . . . . . . . . . 47 Figura 11 – Fontes Estimadas para o Teste 1 pelo método proposto . . . . . . . . . 47 Figura 12 – Formas de onda da pronúncia das letras i e a

. . . . . . . . . . . . . . 48

Figura 13 – Sinais da figura 12 após processo de mistura . . . . . . . . . . . . . . . 48 Figura 14 – Sinais da figura 12 estimados pelo método proposto . . . . . . . . . . . 49 Figura 15 – Sinais da figura 8 após processo de mistura contaminados com ruído branco . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 Figura 16 – Sinais do Teste 1 estimados . . . . . . . . . . . . . . . . . . . . . . . . 51 Figura 17 – Sinais da figura 12 após processo de mistura contaminados com ruído branco . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 Figura 18 – Sinais do Teste 2, contaminados por ruído, estimados . . . . . . . . . . 52 Figura 19 – Diferença das Medidas de Performance para a fonte 1 dos Testes 1 e 3 . 53 Figura 20 – Diferença das Medidas de Performance para a fonte 2 dos Testes 1 e 3 . 54

LISTA DE TABELAS Tabela 1 – Tabela com os resultados do Teste 1 . . . . . . . . . . . . . . . . . . . 46 Tabela 2 – Tabela com os resultados do Teste 2 . . . . . . . . . . . . . . . . . . . 46 Tabela 3 – Tabela com os resultados do Teste 3 utilizando os sinais do Teste 1 contaminados por ruído branco . . . . . . . . . . . . . . . . . . . . . . 50 Tabela 4 – Tabela com os resultados do Teste 4 utilizando os sinais do Teste 2 contaminados por ruído branco . . . . . . . . . . . . . . . . . . . . . . 51

LISTA DE ABREVIATURAS E SIGLAS AMR

Análise Multirresolução

AMUSE

Algorithm for Multiple Unknown Signal Extraction

BSS

Blind Source Separation

CQF

Conjugate Quadrature Mirror

CWT

Continuous Wavelet Transform

DFT

Discrete Fourier Transform

DVS

Decomposição em Valores Singulares

FT

Fourier Transform

FIR

Finite Impulse Response

FPA

Filtro passa-alta

FPB

Filtro passa-baixa

FPF

Filtro passa-faixa

FRF

Filtro rejeita-faxa

ICA

Independent Component Analysis

HOS

High Ordem Statistical

IIR

Infinite Impulse Response

IP

Índice de Performance

LTI

Linear Time Invariant

QMF

Quadrature Mirror Filter

SAR

Source to Artifacts Ratio

SDR

Source to Distortion Ratio

SIR

Source to Ierteference Ratio

SNR

Source to Noise Ratio

SOS

Second Ordem Statistical

LISTA DE SÍMBOLOS A0

Matriz de Mistura real

s0 (t)

Vetor das fontes reais

s0 (t)

Vetor das fontes estimadas

ˆsn

Fonte Estimada

r(t)

Vetor de ruído branco

Rx

Matriz de covariância do vetor x

σ2

Variância

BSS

Modelo BSS

BSSo

Modelo BSS Ortogonal

Λ

Matriz de Escala

P

Matriz de Permutação

R

Relação de Equivalência

Ix,r

Espaço de identificação

T

Transformação de Ortogonalização

T†

Pseudo-inversa da Transformação de Ortogonalização

T

Operador Sistema

δ

Função Impulso Unitário

h

Resposta ao Impulso

F

Operador Transformada de Fourier

.T

Operação de Transposição para matrizes e vetores

↓2

Subamostrador por um fator de 2

↑2

Sobreamostrador por um fator de 2

ψ(t)

Função Wavelet

φ(t)

Função de Escala

cj,k

Coeficientes de aproximação da Transformada Wavelet

dj,k

Coeficientes de detalhes da Transformada Wavelet

12

1 INTRODUÇÃO Muitos problemas atuais na área de processamento digital de sinais são provocados pela necessidade de recuperação da informação. Em aplicações biomédicas, por exemplo, deseja-se obter dados de regiões específicas de determinados órgãos do corpo. Em processamento de áudio pretende-se separar cada instrumento musical de uma determinada gravação. É comum que tais informações sejam provenientes de diferentes fontes e cheguem ao seu destino sobrepostas. A simples análise dessa mistura de sinais geralmente não permite distinguir se certa porção da informação analisada pertence a uma ou outra fonte específica. Esses problema são denominados de Separação Cega de Fontes (BSS - Blind Source Separation). O termo "Cega"vem do fato de que não há dados suficiente para modelar o processo que realizou a mistura das fontes, e como somente essa mistura está disponível para análise, também não é possível obter dados das fontes antes de realizar a separação. Os algoritmos que resolvem este problema operam basicamente em três etapas: 1) recebem as fontes misturadas obtidas pelos sensores; 2) utilizando alguma informação suposta para as fontes, como descorrelação ou independência estatística, estimam uma matriz de separação; 3) as fontes são estimadas multiplicando-se os dados de observação pela matriz de separação obtida.

1.1 Estado da Arte Etapas de pré-processamento e pós-processamento são comuns em certas aplicações e até mesmo muitas vezes necessárias. Uma etapa de pós-processamento geralmente utilizada é a remoção de ruído após as fontes terem sido estimadas (HYVäRINEN; KARHUNEN; OJA, 2001). Outros autores (MARY; KUMAR; CHACKO, 2010) sugerem a remoção de ruído como uma etapa de pré-processamento. É comum também que a etapa de pré-processamento seja a aplicação de algum filtro seletivo para eliminar componentes indesejadas dos sinais de observação.

Capítulo 1. Introdução

13

Neste trabalho o objetivo é realizar esta etapa de pré-processamento utilizando filtros Wavelet ortogonais, numa abordagem experimental. Esta ideia não é nova. Alguns trabalhos semelhantes foram realizados por (MOUSSAOUI; ROUAT; LEFEBVRE, 2006) que utilizam Wavelet Packets e um algoritmo BSS denominado Independent Component Analysis (ICA) para encontrar a matriz de mistura e ainda a entropia de Shannon como medida para selecionar a melhor base da árvore de decomposição Wavelet. Do mesmo modo, (MISSAOUI; LACHIRI, 2011), variando apenas na utilização da banco de filtros perceptuais e também (TALBI et al., 2012) que utiliza Bionic Wavelet Transform. Outro que se diferencia destes, pela não utilização de Wavelet Packets, é o trabalho publicado pelos autores Mary, Kumar e Chacko (2010) no qual o algoritmo ICA é utilizado para obtenção da matriz de separação no domínio Wavelet, e após, os sinais estimados são transformados novamente para o domínio do tempo. A diferença primordial do método aqui proposto é que não será utilizada a decomposição Wavelet Packets, e diferentemente de (MARY; KUMAR; CHACKO, 2010) não será calculada a transformada Wavelet inversa. O que se faz é utilizar os coeficientes de aproximação dos dados de observação para estimar a matriz de separação e consequentemente as fontes, multiplicando essa matriz pelo vetor de mistura. E também o algoritmo utilizado para a obtenção dessa matriz é o AMUSE, que é um algoritmo que utiliza informações sobre a estrutura temporal das fontes para a estimação devida, realizando diagonalização simultânea da matriz de covariância do vetor de mistura e do vetor de mistura, atrasado no tempo, projetado em um espaço ortogonal.

1.2 Aplicações 1.3 Organização do Trabalho O capítulo 2 traz uma ideia geral do problema da separação cega de fontes, bem como várias definições e modelos matemáticos necessários ao entendimento do conteúdo aqui abordado. O terceiro capítulo aborda a transformada Wavelet do ponto de vista do banco de filtros e também da análise multirresolução, com o objetivo de introduzir a teoria necessária ao entendimento do algoritmo proposto para separação cega de fontes.

Capítulo 1. Introdução

14

No capítulo 4, um algoritmo denominado BSS Evaluation é estudado, pois este é utilizado para avaliação de algoritmos que implementam a separação cega de fontes, portanto será utilizado neste trabalho para comparar as medidas de performance do método proposto e do convencional. O capítulo 5 traz os resultados dos testes realizados com alguns sinais de exemplo e também mostra comparações entres os métodos utilizando as medidas definidas no capítulo 4. E, por fim, no capítulo 6, serão apresentadas as considerações finais sobre a proposta deste trabalho.

15

2 SEPARAÇÃO CEGA DE FONTES Em problemas BSS o objetivo é estimar as fontes (sinais) sobrepostas sem possuir informações de como estas foram misturadas e como são essas fontes; embora alguma suposição sobre elas seja sempre considerada nos algoritmos que tentam resolver este problema, como por exemplo se as fontes são descorrelacionadas ou estatisticamente independentes. Em relação aos algoritmos que utilizam propriedades estatísticas para resolução deste problema, pode-se dividí-los em duas categorias: Algoritmos HOS (High Ordem Statistical), que são aqueles que utilizam estatísticas de ordem superior como curtose, ou outras medidas derivada desta, e aqueles que são SOS (Second Ordem Statistical) que utilizam apenas as informações de correlação e covariância dos sinais, que são estatísticas de segunda ordem. Neste trabalho será estudado o algoritmo AMUSE que é do tipo SOS.

2.1 Modelagem Matemática Os modelos BSS geralmente estão subdivididos em dois tipos básicos, sendo que em um deles a mistura é convolutiva e no outro instantânea. No caso instantâneo, que será abordado neste trabalho, assume-se que os sinais das fontes são captados pelos sensores assim que são emitidos e todos ao mesmo tempo, não havendo atrasos, mesmo que as fontes em princípio estejam a distâncias diferentes dos sensores. Um sistema BSS é formado por dois subsistemas principais: sistema de mistura e sistema de separação. O sistema de mistura geralmente é desconhecido, ou sabe-se pouca informação sobre como as fontes são sobrepostas (misturadas). Os problemas BSS procuram encontrar um filtro que seja capaz de estimar as fontes desconhecidas, ou seja, eles atuam no subsistema correspondente a separação das fontes. Para se ter uma ideia geral, considera-se o problema de estimar os sinais de duas fontes independentes s1 e s2. Os valores recebidos pelos sensores são x1 e x2. Os sensores captam o sinal dessas fontes nos mesmos instantes no tempo e cada um deles recupera o sinal de ambas as fontes. Portanto pode-se escrever x1 = a11 s1+a12 s2 e x2 = a21 s1+a22 s2. Os termos aij ponderam o quanto de cada fonte o sensor captará e formam uma matriz

Capítulo 2. Separação Cega de Fontes

16

Figura 1 – Exemplo de um problema BSS com duas fontes

Fonte: Próprio Autor A = (aij ) que é um filtro de sobreposição para o sistema de mistura. A figura 1 permite visualizar este exemplo. Definição 1. Um modelo BSS é uma terna ordenada (A0 , S0 , V), tal que X(t) = A0 S0 (t) + V(t)

(2.1)

e as hipóteses são válidas: • (S1) Am×n tem posto completo; 0 • (S2) S0 (t) e V(t) são sinais estacionários com média nula; • (S3) V(t) é um processo ruidoso branco com matriz de covariância RV = σ 2 I; • (S4) S0 (t) e V(t) são mutuamente estatisticamente independentes; • (S5) Os sinais S0 (t) são descorrelacionados; • (S6) m ≤ n, ou seja, o número de sensores é maior ou igual ao número de fontes. As variáveis envolvidas nessa equação recebem as seguintes denominações: X(t) é a matriz de observação; S0 (t) é o matriz das fontes; V(t) a matriz de ruído e A0 a matriz de mistura, ou matriz de parâmetros ou canal de comunicação.

Capítulo 2. Separação Cega de Fontes

17

Se os sinais fontes tem p amostras, e a matriz A0 ∈ Rm×n , então as matrizes da equação 2.1 pertencem aos seguintes subespaços: X(t) ∈ Rm×p ; S0 (t) ∈ Rn×p e V(t) ∈ Rm×p , sendo que n ≤ m. Definição 2. Um espaço de observação é um subespaço em Rm×p , formado pelos vetores x(t) que são combinações lineares das fontes s0 (t), para diferentes matrizes A. Essa definição implica o fato que um sistema BSS com as mesmas fontes e os mesmos sensores, pode ter diferentes vetores de observação para variações no sistema de mistura e ainda assim a estimação das fontes será a mesma. Em outras palavras, se o filtro de mistura é realizado pela matriz A então x(t) = As(t), e por uma matriz B então x(t) = Bs(t), porém em ambos os casos o vetor de fontes estimadas será s0 (t), com alguma variação na amplitude e ordem das fontes conforme será visto a seguir. Definição 3. Dizer que uma dupla (A, s) ∈ BSS, significa que essa dupla satisfaz a equação 2.1 acima e as suposições (S1) a (S5) são válidas. Os termos A0 e s0 , na definição 1, representam os valores reais do sistema de mistura e das fontes, respectivamente. Qualquer outra matriz A e vetor s tal que a dupla formada por esses valores pertence ao modelo BSS, conforme definição anterior, representam uma estimação dos valores reais. Teoricamente uma matriz A0 pode ser qualquer matriz não-singular. No entanto em aplicações práticas estimar inadequadamente A0 ou sua pseudo-inversa, pode por consequência acarretar numa estimação precária dos sinais fontes, no sentido que estes não sejam inteligíveis. Por este fato as matrizes A0 e sua estimação A0 devem estar relacionadas por força de algum critério que garanta a inteligibilidade dos sinais fontes estimados. Em grande parte das aplicações, desde que a forma de onda de uma determinada fonte seja preservada, pois a informação mais relevante do sinal está presente nela e nem tanto na magnitude (TONG et al., 1991), multiplicar essa fonte por uma constante não afeta sua estimação, tampouco a ordem em que tais fontes são estimadas é realmente importante. Portanto para uma matriz de permutação P (composta de zeros e uns) a solução s(t) = Ps0 (t) ainda é aceitável (BUCCIGROSSI, 1997), assim como é também a solução s(t) = Λs0 (t), sendo Λ uma matriz diagonal e não singular.

Capítulo 2. Separação Cega de Fontes

18

Conforme apresentado por Tong et al. (1990) e Tong et al. (1991), segue a definição de uma relação entre a matriz de mistura e sua estimação, e também entre as fontes reais e as estimadas. Definição 4. Uma relação R que preserva a forma de onda de um sinal fonte, é uma duplas de pares ordenados (A0 , s0 ) e (A0 , s0 ), assim relacionados

A0 = A0 Λ−1 PT

(2.2)

s0 = PΛs0

(2.3)

Essa relação é representada pela simbologia: (A0 , s0 )R(A0 , s0 ). O par (A0 , s0 ) é uma estimação de (A0 , s0 ). A segunda relação, (2.3), da definição acima, foi discutida no parágrafo anterior e seu entendimento é claro. Mas a primeira relação não é evidente. Para obtê-la basta lembrar que pelo modelo BSS, considerando por simplicidade o caso sem ruído, tem-se s0 = (A0 )−1 x

(2.4)

x 0 = A0 s 0

(2.5)

e para uma determinada estimação

Dada a relação 2.3, substituindo s0 pelo seu valor na equação 2.4, obtêm-se s0 = PΛ(A0 )−1 x

(2.6)

Fazendo x0 = x, já que pretende-se encontrar a matriz de parâmetros e as fontes que produzam o mesmo espaço de observação, independente da ordem destas e da amplitude, e substituindo 2.5 em 2.6 resulta que s0 = PΛ(A0 )−1 A0 s0

(2.7)

1 = PΛ(A0 )−1 A0

(2.8)

que simplificando fornece

Multiplicando pela esquerda, ambos os lados da equação acima sucessivamente por PT , Λ−1 e A0 tem-se por fim a relação 2.2.

Capítulo 2. Separação Cega de Fontes

19

Definição 5. Resolver um problema BSS é encontrar um par (A0 , s0 ), tal que (A0 , s0 )R(A0 , s0 ). Em outras palavras, resolver um problema BSS é encontrar uma matriz que diz como o meio de comunicação misturou as fontes, e como é a forma de onda dessas fontes, não importando sua magnitude tampouco a ordem em que são estimadas. Por outra perspectiva, muitos algoritmos que encontram essa solução não fornecem diretamente a matriz A0 , mas sua pseudo-inversa W, denominada de matriz de separação, a qual é utilizada para estimar as fontes multiplicando esta matriz pelo vetor de observação.

2.2 Um Algoritmo para solução do problema BSS 2.2.1 Decomposição em Valores Singulares Antes de discutir propriamente o algoritmo utilizado para solução do problema BSS, uma técnica da Álgebra Linear denominada de Decomposição em Valores Singulares (DVS), deve ser introduzida. Definição 6. A DVS de uma matriz A ∈ Rm×n , onde r = rank(A), é uma fatoração em um produto de três matrizes U ∈ Rn×n e V ∈ Rm×m matrizes ortogonais e Ψ ∈ Rm×n uma matriz diagonal, da seguinte forma (ANTON, 2010): A = UΨVT

(2.9)

Definição 7. Os valores singulares ψi de A e os autovalores φ1 , . . . , φr não nulos e únicos de AAT e AT A satisfazem ψi =

q

φi

i = 1, . . . , r

(2.10)

sendo que ψ1 ≥ ψ2 ≥ . . . ≥ ψr ≥ 0. Definição 8. As matrizes da DVS são assim formadas • Ψ = diag(ψ1 , ψ2 , . . . , ψr ). • U = [u1 . . . un ] onde cada ui ∈ Rn é um autovetor associado aos autovalores de AAT . • V = [v1 . . . vm ] onde cada vi ∈ Rm é um autovetor associado aos autovalores de AT A.

Capítulo 2. Separação Cega de Fontes

20

2.2.2 AMUSE (Algorithm for Multiple Unknown Signal Extraction) AMUSE é um algoritmo utilizado para solução do problema BSS. Ele considera as estatísticas de segunda ordem das fontes (matriz de correlação) e sua estrutural temporal (CICHOCKI; AMARI, 2003), pois assume as fontes descorrelacionadas no tempo, para estimar a matriz de mistura, convertendo o problema de identificação das fontes em um de diagonalização simultânea utilizando a DVS.

2.2.3 Definições Gerais Domingues e Iezzi (1982) fornecem algumas definições da Álgebra que serão utilizadas no decorrer deste trabalho. Enuncia-se abaixo três dessas definições. Definição 9. Uma relação R sobre um conjunto E 6= ∅ é uma relação de equivalência sobre esse conjunto se, e somente se, R é reflexiva, simétrica e transitiva, ou seja: 1. ∀x, x ∈ E ⇒ xRx 2. ∀x e ∀y, xRy ⇒ yRx 3. ∀x, ∀y e ∀z, xRy e yRz ⇒ xRz Definição 10. Dado um elemento a ∈ E, uma classe de equivalência sobre a, módulo R, é o subconjunto a ¯ = {x ∈ E | xRa}

(2.11)

Definição 11. Seja E 6= ∅. Uma partição F desse conjunto é uma família de subconjuntos não vazios onde: 1. Se A, B ∈ F, ou A = B ou A e B são disjuntos. 2.

S

A∈F

A = E.

Dado um problema BSS, Tong et al. (1990), Tong et al. (1991) introduzem o conceito de espaço de identificação, sendo este um conjunto com todas as matrizes de mistura A e fontes s(t) que produzem as mesmas observações x(t) produzidas pelos valores reais A0 e s0 (t) quando ocorre o mesmo processo ruidoso r(t). Em outras palavras, esse conjunto contém todas as soluções potenciais dados o vetor de observação e o processo ruidoso.

Capítulo 2. Separação Cega de Fontes

21

Definição 12. Um Espaço de Identificação I(x,r) é definido como I(x,r) = {(A, s) ∈ BSS | x(t) = As(t) + r(t)}

(2.12)

Neste conjunto todo A e s(t) são candidatos legítimos a solução do problema BSS. Para entender este fato, basta considerar uma matriz N, não-singular. Então do modelo BSS tem-se x(t) = As(t) + r(t) ⇒ x(t) = ANN−1 s(t) + r(t) ⇒ x(t) = A0 s0 (t) + r(t), o que implica que qualquer matriz A0 com mesmo posto de A é candidata a solução, o mesmo valendo para s0 (t) (TONG et al., 1990). Pode-se por essa definição observar que uma dupla (A, s) pertence a I(x,r) se, e somente se, (A, s) ∈ BSS e (A, s)R(A0 , s0 ), ou seja, essa dupla é uma solução do problema BSS, e vale a condição As(t) ∼ = A0 s0 (t). A relação R definida em 4 pode ser redefinida em termos do espaço de identificação: Definição 13. Dado (A0 , s0 ) e (A0 , s0 ) ∈ I(x,r) , (A0 , s0 )R(A0 , s0 ) se e somente se as relações em 4 são satisfeitas. Outra maneira de representar a relação de equivalência é: a) A0 RA0 se a primeira relação é satisfeita e b) s0 Rs0 se a segunda relação é satisfeita. Também em termos do espaço de identificação, a definição 10 pode ser reformulada: Definição 14. Dado (A0 , s0 ) ∈ I(x,r) , uma classe de equivalência sobre (A0 , s0 ), módulo R, é o subconjunto n

o

(A0 , s0 ) = (A, s) ∈ I(x,r) | (A, s)R(A0 , s0 )

(2.13)

Cada (A, s) ∈ (A0 , s0 ) é dito um membro dessa classe de equivalência. Esta definição é extremamente importante, pois ela estabelece o principal objetivo do algoritmo AMUSE para solução do problema BSS: identificar as classes de equivalência contendo (A, s) no espaço de identificação I(x,r) (TONG et al., 1990). Isso é necessário porque a identificação do valor real (A0 , s0 ) é impossível diretamente, devido a indeterminação já evidenciada no parágrafo acima, onde se constatou que qualquer A0 com mesmo posto de A, logo também A0 , é candidata a solução. Teorema 1. A relação R definida em 4 é uma relação de equivalência sobre I(x,r) . Pela definição 9 uma relação de equivalência é reflexiva, simétrica e transitiva. Então dados os pares ordenados (A0 , s0 ) e (A, s) estimativas de (A0 , s0 ), logo soluções de um problema BSS, pode-se fazer as seguintes observações dado o teorema 1:

Capítulo 2. Separação Cega de Fontes

22

• Os pares ordenados soluções do problema BSS se relacionam consigo mesmas (propriedade reflexiva), o que implica neste caso que P = Λ = I. • Se uma dupla se relaciona com outra, esta segunda também se relaciona com a primeira (propriedade simétrica). Isso implica que nas equações 2.2 e 2.3 pode-se ter A0 ou s0 também do lado esquerdo da igualdade sem ocasionar alterações na forma de onda das fontes estimadas s0 . • Como os pares ordenados (A0 , s0 ) e (A, s) se relacionam com (A0 , s0 ) então elas se relacionam consigo mesmas (propriedade transitiva). A proposição abaixo destaca as propriedades estatísticas e algébricas dos membros (A, s) das classes de equivalência. Ela evidencia que se um membro de uma classe de equivalência satisfaz essas propriedades algébricas e estatísticas, então qualquer membro desta mesma classe também satisfaz esse mesmo conjunto de propriedades (TONG et al., 1990). Proposição 1. Se (A0 , s0 )R(A0 , s0 ) então 1. Os elementos de s0 (t) são mutuamente independentes se, e somente se, os elementos de s0 (t) também o são; 2. A matriz de covariância Rs0 (τ ) = E(s0 (t)s0 (t − τ )T ) é diagonal se, e somente se, Rs0 (τ ) = E(s0 (t)s0 (t − τ )T ) é diagonal. 3. As colunas de A0 são ortogonais se, e somente se, as colunas de A0 são ortogonais. Em outras palavras, isso quer dizer que se s0 (t) é uma estimação de s(t) então esses vetores tem as mesmas propriedades estatísticas. Se A0 é uma estimação de A então essas matrizes compartilham as mesmas propriedades algébricas. Proposição 2. Se a dupla (A, s) ∈ BSS, então qualquer dupla (A0 , s0 ), da mesma classe de equivalência, também pertence ao modelo BSS. ⊥

Definição 15. Uma classe de equivalência (A0 , s0 ) é ortogonal, (A0 , s0 ) , se as matrizes de mistura dos membros dessa classe de equivalência tem suas colunas ortogonais.

Capítulo 2. Separação Cega de Fontes

23

2.2.4 Identificabilidade e Ortogonalidade Viu-se até aqui que R induz uma classe de equivalência dada a dupla (A0 , s0 ) ∈ I(x, r). Tong et al. (1990) questionam sobre quantas seriam as classes de equivalência nesse espaço de identificação que satisfazem as propriedades (S1) a (S5) em 2.1, dados o vetor de observação e o processo ruidoso. Para responder essa questão utiliza-se a definição dada abaixo. Definição 16. (A0 , s0 ) é identificável, com respeito ao modelo BSS, se para algum (A0 , s0 ) ∈ I(x,r) , (A0 , s0 )R(A0 , s0 ). Em termos gerais, a noção de identificabilidade envolve uma dupla (A0 , s0 ) ∈ BSS, onde esta é identificável se a forma de onda dos sinais fontes é preservada e há uma relação de equivalência entre essa dupla e a dupla (A0 , s0 ) solução do problema BSS. Em outros termos, tem-se uma explanação dada por Buccigrossi (1997), onde o autor diz que o conjunto de propriedades de A0 e s0 mitigam os pares ordenados (A0 , s0 ) ∈ I(x,r) que são soluções aceitáveis. Então deve-se procurar um conjunto de propriedades (modelo) que, além de reduzir as soluções ainda preserve as formas de onda das fontes. Este modelo, quando existir, faz (A0 , s0 ) ser identificável. Respondendo a questão anterior, pode-se dizer que se existe apenas uma classe de equivalência, então (A0 , s0 ) pertence a esta e então, a dupla (A0 , s0 ) correspondente é identificável. Caso exista mais que uma, essa dupla não é identificável em relação ao modelo BSS. Teorema 2. Dado Rx (matriz de covariância do vetor de observação), se (A0 , s0 ) é identificável, então os m maiores valores singulares de Rx são distintos e (A0 , s0 ) pertence a uma classe de equivalência ortogonal. O teorema abaixo fornece um resultado que permite chegar à solução do problema BSS, pois conforme já mencionado esta é encontrada quando for possível identificar uma classe de equivalência contendo (A0 , s0 ), e por este teorema quando existir uma certa quantidade de valores singulares da matriz de covariância distintos, então existirá uma única classe de equivalência.

Capítulo 2. Separação Cega de Fontes

24

Teorema 3. Se os m maiores valores singulares de Rx são distintos, existe uma, e somente uma, classe de equivalência ortogonal sobre I(x,r) que satisfaz as suposições (S1) a (S5) em 2.1. Em resumo ambos os teoremas permitem a conclusão que se (A0 , s0 ) é identificável ⊥

então (A0 , s0 ) ∈ (A0 , s0 ) e os valores singulares de Rx são distintos, dai então existe uma, e somente uma, classe de equivalência ortogonal (TONG et al., 1990). Como não se pode inferir sobre a ortogonalidade das colunas de A, visto ser latente no problema BSS, deve-se buscar uma transformação no espaço de observação que seja capaz de ortogonalizá-las, onde se garanta que (A, s) pertença a uma classe de equivalência ortogonal. Uma transformação desse tipo reduz a complexidade do algoritmo para solução do problema BSS (TONG et al., 1991). A matriz de covariância do vetor de observação pode ser decomposta da seguinte T

T

forma, considerando as suposições feitas em 2.1: Rx = E(xxT ) = E((A0 s0 + r)(s0 A0 + T

T

T

nT )) = A0 E(s0 s0 )A0 + E(nnT ) = A0 Rs0 A0 + σ 2 I, portanto T

Rx = A0 Rs0 A0 + σ 2 I

(2.14)

Se as fontes forem consideradas com potência unitária e pela hipótese (S5) em 1, Rs0 = I. Logo a matriz de mistura pode ser determinada computando Rx se ruído puder ser subtraído do sistema, pois T

R x = A0 A0 + σ 2 I

(2.15)

Calculando a DVS da matriz A0 e sua transposta da equação 2.14, já que a DVS de Rs0 é ela mesma visto que assumiu-se anteriormente que as fontes são descorrelacionadas temporalmente e portanto Rs0 = I, obtém-se: A0 = UΨVT T

A0 = VΨT UT

(2.16) (2.17)

Substituindo 2.16 e 2.17 no primeiro termo do lado direito da equação 2.14 tem-se T

A0 Rs0 A0 = UΨVT Rs0 VΨT UT = UΨ2 UT 2 sendo Ψ2 = diag(ψ12 , . . . , ψm ).

(2.18)

Capítulo 2. Separação Cega de Fontes

25

2 Considerando Φ = diag(ψ12 + σ 2 , . . . , ψm + σ 2 , σ 2 , . . . , σ 2 ), tem-se a seguinte de-

composição em valores singulares da matriz de autocovariância do vetor de observação Rx = UΨ2 UT + σ 2 I = UΦUT

(2.19)

Define-se então a transformação de ortogonalização como T = Ψ−1 UT

(2.20)

Para verificar que esta transformação é ortogonal, considera-se a DVS da matriz A0 : A0 = UΨVT . Multiplicando a matriz de transformação T por A0 obtém-se T A0 = Ψ−1 UT UΨVT = VT

(2.21)

Portanto, pela definição da DVS, em 6, conclui-se que T é ortogonal. Aplicando essa transformação a cada elemento do modelo BSS, tem-se um modelo ortogonal equivalente, explicitado pelo símbolo BSSO , com equações a seguir definidas. Definição 17. Um problema (modelo) BSS ortogonal, BSSO são dois pares ordenados (B0 , s0 ) e (y, n) nos moldes do problema BSS, sendo que suas variáveis se relacionam da seguinte maneira, dada a transformação ortogonal em 2.20: y(t) = T x(t)

(2.22)

B0 = T A0

(2.23)

n(t) = T r(t)

(2.24)

Como pode-se notar, a transformação definida em 2.20, sobre o espaço de observação, induz um mapeamento do espaço de identificação definido pelo modelo BSS no espaço de identificação definido pelo modelo BSSO :

F : I(x,r) → I(y,n)

(2.25)

(A, s) 7→ (T A, s)

(2.26)

Dado então esse mapeamento, o problema da identificação de (A0 , s0 ) no espaço de observação de x(t) torna-se um problema de identificação da dupla (B0 , s0 ) no espaço de observação de y(t), sendo que B0 tem a característica de ter sua colunas ortogonais, pelo que ficou evidenciado na equação 2.21.

Capítulo 2. Separação Cega de Fontes

26

É claro que tal mapeamento não pode alterar a relação de equivalência induzida por R sobre I(y,n) , no sentido que B0 e s0 ainda devem estar relacionados conforme explicitado em 4, e portanto as imagens em I(x,r) devem ser equivalentes em I(y,n) (TONG et al., 1991). O resultado abaixo dá essa garantia a F. Proposição 3. O mapeamento F preserva a relação de equivalência R, ou seja, se (A0 , s0 )R(A0 , s0 ) então F((A0 , s0 ))RF((A0 , s0 )). Em outras palavras isso significa que uma solução do problema BSS no espaço de observação de x(t) terá uma solução correspondente no espaço de observação ortogonal de y(t). O teorema a seguir certifica essa afirmação, mostrando que para uma solução do modelo ortogonal existe outra para o modelo real, onde a matriz de mistura ortogonal é solução quando multiplicada pela pseudo-inversa da transformação definida em 2.20. Teorema 4. Se (B, s)R(B0 , s0 ), então (T † B, s)R(A0 , s0 ), onde T † é a pseudo-inversa de T . A definição 16 estabeleceu que (A0 , s0 ) é identificável quando existir outro par ordenado com o qual vale R. No entanto, não se pode certificar que (A0 , s0 ) seja identificável em relação ao modelo BSS, pelo que foi mencionado no parágrafo sobre o espaço de identificação I(x,r) . Por outro lado, a identificabilidade pode ser garantida para outros modelos que sejam extensões do modelo BSS. Quando as fontes são consideradas descorrelacionas e com autocorrelações diferentes para determinado τ > 0, tem-se o modelo a seguir. Definição 18. Um modelo BSS1 é um modelo BSS que satisfaz as seguintes condições: 1. as fontes s são descorrelacionadas 2. existe τ > 0 tal que, para i 6= j E(sj (t)sj (t − τ )) E(si (t)si (t − τ )) 6= 2 E(si ) E(s2j ) Teorema 5. (A0 , s0 ) é identificável em relação ao modelo BSS1 .

(2.27)

Capítulo 2. Separação Cega de Fontes

27

2.2.5 Algoritmo AMUSE Como foi visto anteriormente, para estimar (A0 , s0 ) primeiro deve ser encontrado um mapeamento de I(x,r) em I(y,n) que é dado por uma transformação ortogonal que depende da matriz de covariância do vetor x(t). Assim, o primeiro passo é calcular Rx e sua DVS, ou seja, Rx = UΦUT , onde Φ = Ψ2 + σ 2 I, conforme equação 2.19, que é uma matriz diagonal da forma: 

Φ=

        

φ21

0

0 .. .

φ22 . . . .. . . . .

0

0

...

0



0   0    ..  .   φ2n

(2.28)



onde φ2i = ψi2 − σ 2 , para 1 ≤ i ≤ n, sendo n os valores singulares mais significantes na decomposição e σ 2 a variância do ruído. A matriz diagonal Φ é então obtida resolvendo φi =

q

ψi2 − σ 2 . Após essa etapa, o espaço de observação de x(t) então é transformado, por T ,

em um espaço de observação ortogonal de y(t), conforme equação 2.22, e sua matriz de covariância é calculada para algum parâmetro de atraso τ > 0, pois pelo Teorema 5, já que as fontes foram descorrelacionadas pela transformação T , pode-se afirmar que (A0 , s0 ) é identificável em relação ao modelo BSS1 . Isso implica, pelos Teoremas 2 e 3, que os n valores singulares, na decomposição anterior, serão distintos e existirá uma, e somente uma, classe de equivalência ortogonal sobre I(x,r) . Portanto a matriz de covariância de y(t), considerando um atraso τ , é dada por: Ry (τ ) = E(y(t)y(t − τ )T )

(2.29)

Segundo Tong et al. (1990) dado que o ruído considerado no sistema é branco, essa matriz admite a seguinte decomposição em autovalores: T

Ry (τ ) = B0 E(s(t)s(t − τ )T )B0 = B0 diag(γ1 (τ ), . . . , γn (τ )B0

T

(2.30)

onde γi (τ ) = E(si (t)si (t − τ )T ), para i = 1, . . . , n. No entanto, na prática Rx e Ry (τ ) não podem ser simétricas já que são estimadas, o que implica que a solução de 2.30 não é realizável Tong et al. (1990). Portanto, toma-se uma decomposição simétrica: Rysym =

Ry (τ ) + Ry (τ )T 2

(2.31)

Capítulo 2. Separação Cega de Fontes

28

Agora é possível encontrar uma solução para o problema BSSO , já que a decomposição em autovalores de Rysym fornece uma estimação B de B0 . Já s(t) pode ser por sua vez encontrado resolvendo s(t) = BT y(t) = B−1 y(t). Pelo Teorema 4 esse par ordenado, (B, s) solução do problema ortogonal, também é solução do problema real, se B for multiplicado pela pseudo-inversa da transformação de ortogonalização. Esse par também é membro da classe de equivalência ortogonal (B, s), e portanto (B, s) ∈ I(y,n) . Dai então os autovetores obtidos da decomposição de Rysym formam as colunas da matriz B que é utilizada para obter uma estimação tanto da matriz de mistura como das fontes, como anteriormente observado. Portanto A0 = T † B

(2.32)

s0 (t) = BT y(t)

(2.33)

Em situações práticas as identidades acima nunca se verificarão já que calculam-se estimativas dos valores reais. Por isso as relações a seguir representam melhor o que ocorre, ˆ e ˆs(t) são as estimativas de A0 e s0 (t), e portanto (A, ˆ ˆs)R(A0 , s0 ). considerando que A ˆ = T †B A

(2.34)

ˆs(t) = BT y(t)

(2.35)

Resume-se o algoritmo AMUSE nos passo abaixo: 1. Estimar a matriz de covariância Rx ; 2. Computar a DVS de Rx ; 3. Estimar o número de fontes e a variância do ruído; 4. Obter a transformação de ortogonalização T ; 5. Obter o espaço de observação ortogonal, y(t), utilizando a transformação T ; 6. Calcular a decomposição em autovalores da equação 2.31 e formar a matriz B de autovetores; 7. Estimar enfim a matriz de mistura e as fontes.

29

3 FILTROS WAVELETS Neste capítulo pretende-se mostrar de forma bem resumida, já que não é objetivo deste trabalho um tratado sobre Wavelet, como sua teoria se conecta a dos Bancos de Filtro de dois canais.

3.1 Banco de Filtros de Dois Canais Um banco de filtros é capaz de decompor um sinal em várias faixas de frequência, o que é desejável em numerosas aplicações (DINIZ; SILVA; NETTO, 2010). Nesta seção serão abordados banco de filtros de dois canais, denominados de Filtro Espelhado em Quadratura (QMF - quadrature mirror filter) e Filtro em Quadratura Conjugada (CQF - conjugate quadrature mirror). A leitura de Weeks (2012), permite elaborar a seguinte definição. Definição 19. Um banco de filtros de dois canais é definido como um sistema que submete uma entrada x[n] a dois canais de filtros do tipo FIR, um FPB e um FPA, produzindo as saídas wl [n] e wh [n], respectivamente, aplicando à essas saídas o processo de filtragem inverso FPBI e um FPAI, que por sua vez produz as saídas w¯l [n] e wh¯ [n] produzindo por fim a saída y[n] = w¯l [n] + wh¯ [n]. A figura 2 ilustra o sistema de bancos de filtros de dois canais. Figura 2 – Esquema de Banco de Filtros de Dois canais

Como já dito, bancos de filtros de dois canais podem ser de dois tipo: QMF e CQF. Estes possuem a mesma estrutura vista acima, diferindo apenas na composição dos coeficientes dos filtros (WEEKS, 2012). ¯ = Considera-se então os seguintes coeficientes para o filtro FPA, h = {a, b}, h {b, a} e FPB, l = {b, −a} ¯l = {−a, b}.

Capítulo 3. Filtros Wavelets

30

¯ e ¯l = −l. Para um banco de Definição 20. Em um banco de filtros QMF l = h, h = h ¯ e ¯l são filtros CQF l é uma versão invertida de h com os valores negativados, enquanto h versões invertidas de h e l respectivamente (WEEKS, 2012). Considera-se uma versão invertida de [a, b, c, d] os coeficientes [d, c, b, a]. Pode-se notar pela definição 19 e figura 2, que o sinal y[n] deve ser idêntico a x[n], exceto por algum atraso no tempo, se os coeficientes dos filtros forem escolhidos adequadamente e não houver nenhuma alteração dos sinais filtrados no processo. Outra observação é que o sinal y[n] terá mais amostras que o sinal original, resultado que é indesejável. Para que isso não ocorra as operações de subamostragem/sobreamostragem que atuam sobre os índices dos sinais, devem ser utilizadas. Na subamostragem, por uma fator de 2, representado pelo símbolo (↓ 2), somente os índices pares são mantidos. Portanto um dado sinal após a subamostragem terá apenas a metade de suas amostras. Na operação de sobreamostragem, representada como (↑ 2), geralmente, insere-se zeros entre os pares de amostras (WEEKS, 2012). Um banco de filtros é comumente dividido em duas partes: A primeira, que engloba os processos de filtragem em alta e baixa frequência, seguido da subamostragem do sinal, é denominada de análise. A segunda parte, que corresponde a sobreamostragem, seguida do processo de filtragem inverso, é conhecida como síntese. Os filtros que estão localizados nestas partes do processo recebem a mesma denominação. Como exemplo, considere um banco de filtros CQF com coeficiente h = {a, b} e os demais como na definição 20. Após o processo de filtragem do sinal de entrada x[n] em ambos os canais, a operação de subamostragem é realizada. Os sinais subamostrados são então sobreamostrados e os filtros inversos são aplicados a estes. Após, a última etapa é realizada e os sinais de saída de cada canal são somados produzindo y[n]. Este exemplo é abaixo exibido em maiores detalhes. A saída de ambos os canais após a filtragem é:   

wh [n] = ax[n] + bx[n − 1]

 

wl [n] = bx[n] − ax[n − 1]

(3.1)

Depois, wh [n] e wl [n] são subamostrados produzindo   

whsub [n] = wh [n]

 

wlsub [n] = wl [n]

(3.2)

Capítulo 3. Filtros Wavelets

31

quando n é par. Então as saídas de cada canal (whsub [n] e wlsub [n]) são sobreamostradas, o que fornece

  

whsob [n] = whsub [n]

 

wlsob [n] = wlsub [n]

(3.3)

quando n é par, e   

whsob [n] = 0

 

wlsob [n] = 0

(3.4)

quando n é ímpar. ¯ são utilizados na filtragem, o que fornece Na penúltima etapa, os coeficientes ¯l e h   

wh¯ [n] = bwhsob [n]

 

w¯l [n] = −awlsob [n]

(3.5)

quando n é par, e   

wh¯ [n] = bwhsob [n − 1]

 

w¯l [n] = awlsob [n − 1]

(3.6)

quando n é ímpar. Enfim as saídas wh¯ [n] e w¯l [n] são somadas para obter y[n] como segue y[n] = bw¯lsob [n] − awh¯ sob [n]

(3.7)

y[n] = bwh¯ sob [n − 1] + aw¯lsob [n − 1]

(3.8)

quando n é par, e

quando n é ímpar. Note-se que quando n é par então w¯lsob [n] = whsub [n] = wl [n]. Utilizando raciocínio análogo para os demais sinais que determinam y[n] acima, pode-se reescrevê-lo como em Weeks (2012): y[n] = b(ax[n] + bx[n − 1]) − a(bx[n] − ax[n − 1])

(3.9)

y[n] = a(ax[n − 1] + bx[n − 2]) + b(bx[n − 1] − abx[n − 2])

(3.10)

quando n é par, e

quando n é ímpar. Simplificando essas expressões conclui-se que y[n] = (a2 + b2 )x[n − 1]

(3.11)

Capítulo 3. Filtros Wavelets

32

independente do índice ser par ou ímpar. Ou seja, a escolha adequada dos coeficientes dos filtros faz de y[n] uma versão atrasada de x[n] como já dito anteriormente.

3.2 Representação Matricial de Sistemas de Filtros A operação de filtragem, como visto, atrasa um sinal no tempo. Portanto pode ser representada por uma multiplicação matricial, onde a matriz de filtragem D (atraso) tem sua diagonal abaixo da principal igual a 1 e todos os elementos restantes iguais a zero, ou seja 

D=

            



0 0 ... 0 0   

1 0 ... 0 0    0 1 ... 0 0     .. .. . . . 0 0  . . 0 0 ... 1 0

(3.12)

 

Portando para atrasar um sinal x[n], com 4 elementos, por exemplo, basta realizar a multiplicação 









 

 

 

 

    

    

    

    

 0 

 0 0 0 0 0   x[0] 

Dx[n] =

           

 x[0]   x[1]  1 0 0 0 0              0 1 0 0 0   x[2]  =  x[1]   = x[n − 1]

0 0 1 0 0 0 0 0 1 0

x[3] 0

x[2] x[3]

(3.13)

Então para atrasar um sinal l vezes, basta multiplicar Dl pelo sinal ao qual se deseja atrasar. Isso conduz a seguinte generalização para a operação de atraso representada na forma matricial Dl x[n] = x[n − l]

(3.14)

Pode-se então reescrever a saída y[n] após o processo de filtragem da entrada x[n], dada a generalização em 3.14, como y[n] =

k X l=0

l

h[l]D x[n] =

k X

!

h[l]D

l

x[n]

(3.15)

l=0

Assim sendo, um filtro FIR (Finite Impulse Response) realiza a operação de multiplicação do termo F =

Pk

l=0

h[l]Dl pelo sinal de entrada, portanto pode-se representar

Capítulo 3. Filtros Wavelets

33

por outra relação um processo de filtragem: y[n] = F x[n]

(3.16)

Para entender a Teoria Wavelet, algumas definições são necessárias. Definição 21. L2 (R) é o espaço das funções de quadrado integrável a Lesbegue. Definição 22. Uma função ψ(t) ∈ L2 (R) é uma wavelet se (DAUBECHIES, 1992) Cψ = 2π

Z ∞ −∞

2 ˆ |Ψ(ω)| dω < ∞ |ω|

(3.17)

ˆ onde Ψ(ω) é a transformada de Fourier de ψ(t), sendo essa condição denominada de "condição de admissibilidade". Tais funções tem média zero (MALLAT, 2009), ou seja: Z ∞

ψ(t)dt = 0

(3.18)

−∞

ˆ o que garante que a equação 3.17 seja satisfeita e que ainda implica em Ψ(0) = 0 (DAUBECHIES, 1992). Uma função wavelet pode gerar uma família de funções realizando dilatações (compressões) e translações de tamanhos u e s, respectivamente. Portanto a seguinte definição pode ser enunciada (MALLAT, 2009). Definição 23. Uma função ψ(t) ∈ L2 (R) é uma Wavelet-mãe quando para u, s ∈ R(u 6= 0) e kψu,s (t)k = kψ(t)k ela gera uma família de funções pela equação 1 t−s ψu,s (t) = √ ψ u u

(3.19)

De acordo com Morettin (1999), essa família de funções podem gerar bases ortonormais. Considera-se então a seguinte base gerada por ψ: ψj,k (t) = 2j/2 ψ(2j t − k) j, k ∈ Z

(3.20)

Então qualquer função f (t) ∈ L2 (R) é uma série de wavelets e pode ser escrita como f (t) =

∞ X

∞ X

cj,k ψj,k (t)

(3.21)

j=−∞ k=−∞

onde k denota uma posição no tempo e j a escala (posição na frequência). Uma forma de gerar uma wavelet é através de uma função de escala, ou wavelet pai, φ, também chamada de equação de dilatação que é definida em termos dos coeficientes de um filtro passa-baixa lk (MORETTIN, 1999).

Capítulo 3. Filtros Wavelets

34

Definição 24. Uma função φ(t) é uma função de escala, se ela é solução da equação φ(t) =

√ X 2 lk φ(2t − k)

(3.22)

k

Ela gera uma família de funções ortonormais no espaço L2 (R), como na equação 3.20 trocando-se ψ por φ (MORETTIN, 1999). Isto permite encontrar a equação wavelet, ψ(t), através da wavelet-pai, em termos dos coeficientes dos filtros passa-alta (STRANG; NGUYEN, 1997). Definição 25. Uma função wavelet é uma função ψ(t) tal que ψ(t) =

√ X 2 hk φ(2t − k)

(3.23)

k

Os coeficientes passa-alta hk e passa-baixa lk , são obtidos pelas expressões (MORETTIN, 1999) √ Z∞ cj,k = lk = 2 φ(t)φ(2t − k)dt −∞ Z √ ∞ ψ(t)φ(2t − k)dt dj,k = hk = 2

(3.24) (3.25)

−∞

Os coeficientes lk do filtro passa-baixa geralmente são denotados por cj,k ou c(k); e os passa-alta, hk , por dj,k ou d(k) sendo estes denominados de coeficientes de detalhe, e podem ser obtidos através dos coeficientes de aproximação cj,k pela expressão (STRANG; NGUYEN, 1997): d(k) = (−1)k c(N − k)

(3.26)

se φ(t) é suportada no intervalo [0, N ]. Em resumo os coeficientes do FPB, c(k), produzem as funções de escala φ(t) e os do FPA, d(k), as wavelets. Definição 26. A transformada Wavelet contínua (CWT - Continuous Wavelet Transform) de um sinal f (t), para uma escala s e tempo u, é dada, conforme Mallat (2009), por t−u 1 dt CW T f (u, s) = hf, ψu,s i = f (t) √ ψ ∗ s s −∞ Z ∞

onde ψ ∗ é o conjugado complexo de ψ.

(3.27)

Capítulo 3. Filtros Wavelets

35

Essa transformada é utilizada para propósitos teóricos e para deduções de suas propriedades, sendo que na prática sua utilização geraria muita redundância além de exigir mais tempo e recursos computacionais (OLIVEIRA, 2007). A transformada discreta é mais indicada para propósitos práticos sendo ela obtida modificando os parâmetros da função wavelet e da CWT. m A modificação da função 3.19 numa escala s = sm 0 e translação u = nu0 s0 discretos,

fornece a função wavelet no domínio discreto: ψm,n

1 t − nu0 sm 0 = √ mψ m u0 s0

!

(3.28)

onde m, n ∈ N, s0 e u0 são parâmetros fixos, de dilatação e translação, respectivamente. Então no domínio discreto tem-se a seguinte modificação da equação 3.27: Definição 27. A transformada Wavelet discreta (DWT - Discrete Wavelet Transform) é dada por (OLIVEIRA, 2007) 1 t − nu0 sm 0 f (t) √ m ψ ∗ DW T f (m, n) = dt s0 sm −∞ 0 Z ∞

!

(3.29)

Na Análise de Multirresolução (AMR) é possível olhar para os dados em escalas distintas de resolução. Quando a análise passa de uma resolução j para outra j + 1, mais detalhes são adicionados, o que gera ganho de informação (MORETTIN, 1999). Então pode-se relacionar as definições de banco de filtros, Transformada Wavelet e AMR. Se pretende-se processar de alguma forma um sinal x[n] realizando compressão, codificação, etc., pela Transformada Wavelet, este sinal é então filtrado em ambos os canais do banco de filtros, utilizando os coeficientes cj,k e dj,k e após as saídas dos canais são subamostradas. Se deseja-se mais níveis de resolução, então a saída do canal que implementa os filtro passa-baixa, ou seja, aquela que utiliza os coeficientes de aproximação, novamente é submetida a outros dois canais do banco de filtros, com coeficientes cj,k = P

n ln−2k cj+1,n

e dj,k =

P

n

hn−2k cj+1,n (MORETTIN, 1999), e assim sucessivamente até

que se atinja o nível desejado. Isto pode ser visualizado na imagem 3, onde L e H são os filtros passa-baixa e passa-alta, respectivamente. Aqui não é abordada a reconstrução do sinal no domínio Wavelet (síntese), pois conforme será mencionada, interessa ao método aqui proposto somente a transformada direta.

Capítulo 3. Filtros Wavelets

36

Figura 3 – Algoritmo Piramidal proposto por Mallat

Fonte: Adaptado de Morettin (1999)

37

4 AVALIAÇÃO DE ALGORITMO BSS Um forma simples para avaliar a eficiência de um algoritmo BSS é comparar as matrizes de separação e mistura. Embora em situações reais a matriz de mistura não seja conhecida, este critério de comparação pode ser utilizado para avaliar um algoritmo que considere misturas instantâneas em um ambiente experimental. Uma medida de avaliação desse tipo, foi apresentada por Amari, Cichocki e Yang (1996) e consiste no valor obtido na expressão abaixo definida. Definição 28. O Índice de Performance (IP) de um algoritmo BSS é o valor resultante da expressão IP =

n X i=1

Pn

n n X |qij | i=1 |qij | −1 + −1 maxj |qij | j=1 maxi |qij |

!

j=1

P

!

(4.1)

sendo Q = (qij ) = A0 A0 e A0 uma estimação da matriz de mistura. Esta medida compara as matrizes e retorna um escalar positivo, que quanto mais próximo de zero estiver indica que mais próximos estarão os elementos das matrizes comparadas, ou seja, o erro na estimação das fontes será menor. Portanto quando E1 = 0 as fontes estimadas são iguais às originais, ou proporcionais, cujas contantes de proporcionalidade são os elementos da matriz Λ definida em 4. A medida MSE (Mean Squared Error) mede a média do quadrado do erro obtida da diferença entre a fonte verdadeira e a estimada, sendo que quanto mais próximo de zero melhor a estimação. É assim definida: Definição 29. O Erro Quadrático Médio (MSE) para uma fonte s0 , com k amostras, e sua estimativa s0 é M SE =

k 1X [s0 (i) − s0 (i)]2 k i=1

(4.2)

Outras medidas que podem ser utilizadas para essa avaliação são as medidas de distorção definidas por Gribonval et al. (2003). Os autores consideram o produto interno entre dois sinais hf, gi =

PT −1 t=0

¯ onde g(t) ¯ é o conjugado complexo de g(t), como a f (t)g(t),

correlação entre estes sinais, e hf, f i = kf k2 como sua energia. Do que ficou estabelecido

Capítulo 4. Avaliação de Algoritmo BSS

38

na definição 4 vê-se que a estimação ˆsn de uma determinada fonte sn é igual a esta fonte multiplicada por algum ganho α mais um erro e devido a estimação, ou seja, ˆsn = αsn + e

(4.3)

Sendo assim os autores definem uma medida de distorção relativa D1 := kˆsn − sn k/kˆsn k2 . Portanto quando se considera uma estimação perfeita, ou seja, ˆsn = αsn 2

então D1 = |1 − α−1 | , e quando a estimação não tem nenhuma contribuição da fonte verdadeira, quando ˆsn = e e α = 0 então D1 = ∞. Neste último caso, pelo que foi dito sobre o produto interno no parágrafo anterior, não há correlação entre os sinais (fonte verdadeira e estimada) portanto as fontes são ditas ortogonais, e isso implica que hˆsn , sn i = 0 = α. No caso anterior (estimação perfeita) tem-se α = 1. Pensando nesses extremos vê-se que o produto interno entre uma fonte e sua estimação dirá o quando estas fontes estão próximas, logo pode-se escrever hˆsn , sn i = α. Portanto a equação 4.3 pode ser reescrita como ˆsn = hˆsn , sn i sn + e

(4.4)

O erro e na equação 4.4 pode ainda segundo os autores Gribonval et al. (2003), ser decomposto em três outros termos de erros: X

hˆsn , sl i sl

(4.5)

hˆsn , rk i rk

(4.6)

eartif = ˆsn − hˆsn , sn i sn − einterf − enoise

(4.7)

einterf =

l6=n

enoise =

N X k=1

referentes, respectivamente, ao erro devido a interferência de outras fontes , ao erro devido ao ruído e ao erro devido a artefatos algorítmicos. Portanto a equação 4.4 é escrita substituindo e pelos termos acima. ˆsn = hˆsn , sn i sn + einterf + enoise + eartif

(4.8)

Então pode-se definir as medidas de distorção segundo os autores Gribonval et al. (2003), considerando a fonte sn normalizada, ou seja, hsn , sn i = 1 e ˆsn sua estimação. Definição 30. A distorção relativa total é definida como Dtotal =

kˆsn k − | hˆsn , sn i |2 | hˆsn , sn i |2

(4.9)

Capítulo 4. Avaliação de Algoritmo BSS

39

Definição 31. A distorção relativa devido as interferências é Dinterf =

keinterf k2 | hˆsn , sn i |2

(4.10)

Definição 32. A distorção relativa devido ao ruído aditivo é Dnoise =

kenoise k2 | hˆsn , sn i sn + einterf |2

(4.11)

Definição 33. A distorção relativa devido aos artefatos é Dartif =

keartif k2 | hˆsn , sn i sn + einterf + enoise |2

(4.12)

Baseados ainda nessas medidas e em seus termos, Gribonval et al. (2003) listam outros quatro critérios de performance numérica, inspirados na definição de SNR, com algumas modificações, todos medidos em decibels (dB). Definição 34. A razão de distorção da fonte é dada por −1 SDR = 10 log10 Dtotal

(4.13)

Definição 35. A razão de interferência da fonte é definida como −1 SIR = 10 log10 Dinterf

(4.14)

Definição 36. A razão de ruído da fonte é −1 SN R1 = 10 log10 Dnoise

(4.15)

Definição 37. A razão de artefatos da fonte é −1 SAR = 10 log10 Dartif

(4.16)

Além da SN R1 conforme acima definido, também será utilizada a SNR clássica dada abaixo. Esta medida será utilizada quando não for considerado ruído adicionado aos sensores. Seu uso se restringirá apenas para verificar se a SNR da fonte aumenta ou diminui após a estimação. Isto é necessário pois para calcular a SN R1 , é preciso conhecer o ruído do sensor. Definição 38. A SNR de um sinal x(t) contaminado por ruído r(t) é definida por Deller, Proakins e Hansen (1993) como SN R = 10 log10

PN −1 2 ! i=0 xi PN −1 2 i=0

ri

(4.17)

Capítulo 4. Avaliação de Algoritmo BSS

40

Para computar as medidas de distorção acima, segundo Gribonval et al. (2003), considera-se dois projetores ortogonais, a saber: Ps que é um projetor ortogonal sobre o próprio espaço das fontes e Ps,r sobre o subespaço gerado pelas fontes ruidosas, onde para o caso de fontes mutuamente ortogonais tem-se Psˆsn =

N X

hˆsn , sl i sl

(4.18)

l=1

e se as fontes são correlacionadas então computa-se Psˆsn =

N X

cl sl

(4.19)

l=1

onde c = conj(G)−1 (hˆsn , sk i)N k=1 e G = [hsl , sk i]l,k é a matriz de Gram. O outro projetor é definido da seguinte forma Ps,rˆsn = Psˆsn +

M X

hˆsn , rk i rk krk k2 k=1

(4.20)

Os termos de erro acima são escritos então em função dos projetores ortogonais da seguinte forma: einterf = Psˆsn − hˆsn , sn i sn

(4.21)

enoise = Ps,rˆsn − Psˆsn

(4.22)

eartif = ˆsn − Ps,rˆsn

(4.23)

4.1 Interpretação das Medidas de Avaliação Para melhor entendimento dessas medidas considera-se o experimento com dois sinais, um sinal de canto de pássaro e um sinal de sirene de ambulância, ambos amostrados a 16.000Hz com 111.000 amostras, exibidos nas figuras 4 e 5. Se considerar que a fonte 1 (canto de pássaro) tem interferência da fonte 2 (sirene de ambulância), e vice-versa, sem considerar ruído nos sensores, então SDR u SIR. Quanto maior a interferência de uma fonte sobre outra menor os valores da SDR e SIR. Como exemplo, seja s01 = s1 + 0, 2s2 , ou seja, a estimação da fonte s1 tem 20% de interferência da fonte s2 , neste contexto as medidas são SDR = SIR = 6, 84dB e a SAR = 279, 36dB. Agora se s01 = s1 + 0, 8s2 então SDR = SIR = −5, 27dB e SAR = 275, 66dB. Para estes valores a SAR não sofreu grande variação, no entanto quando se tem s01 = s1 + s2 , a fonte

Capítulo 4. Avaliação de Algoritmo BSS

41

Figura 4 – Forma de onda do canto de um pássaro

Fonte: Próprio Autor Figura 5 – Forma de onda de sirene de ambulância

Fonte: Próprio Autor

1 com 100% de interferência da fonte 2, SAR = ∞. Este resultado já era esperado, pois quando s01 = s1 + s2 então hs01 , s1 + s2 i ≈ 1, dai pela equação 4.9 Dtotal = 0. Isto implica, pela equação 4.16, que SAR = ∞. Em outro exemplo, se considerar ruído aditivo branco, as medidas acima fornecem outros valores. Inclui-se também agora a SN R1 . Então se s01 = s1 + 0, 2s2 + ruido, tem-se SN R1 = 20, 09dB, SIR = 6, 85dB, SDR = 6, 60dB e SAR = 285, 02dB. Se aumentar a interferência da fonte 2, s01 = s1 + 0, 8s2 + ruido, então, SN R1 = 25, 63dB, SIR = −5, 26dB, SDR = −5, 28dB e SAR = 276, 59dB. Como era de se esperar a SIR e a SDR continuam com valores próximos, não sendo iguais apenas devido a distorção

Capítulo 4. Avaliação de Algoritmo BSS

42

causada pelo ruído. A SAR, assim como no caso sem ruído, diminuiu seu valor quando aumentou a interferência da outra fonte, enquanto a SN R−1 aumentou seu valor indicando que o ruído foi menos significativo. A medida SAR talvez seja aquela cujo significado não fique tão evidente. Analisando a equação 4.7 pode-se concluir que todo o erro que não seja devido ao ruído ou a interferência de outras fontes, será considerado um erro de artefato. Ela é independente das medidas SN R1 e SIR, visto que no numerador da equação 4.16 são incluídos os termos einterf e enoise (VINCENT; GRIBONVAL; FEVOTTE, 2005). Pelo mesmo motivo SN R1 é independente da SIR. Em resumo analisando estes testes simplificativos e as equações 4.16, 4.13, 4.14 e 4.15, pode-se concluir que: • SDR u SIR quando as fontes têm interferência, mesmo na presença de ruído. • A SN R1 é maior quanto maior for a interferência de outras fontes. • As medidas SDR, SIR e SAR são menores quando a interferência de outras fontes é maior.

43

5 FILTROS WAVELETS APLICADO AO PROBLEMA BSS Em um sistema BSS comumente os sinais de mistura são fornecidos como entrada para o algoritmo solucionador do problema BSS. Este algoritmo retorna então a matriz de separação, que por sua vez irá multiplicar o vetor de mistura resultando enfim nas fontes estimadas. O diagrama de blocos da figura 6 ilustra o funcionamento de tais algoritmos. Figura 6 – Algoritmo BSS comum

Fonte: Próprio Autor

5.1 O Método Proposto Da definição 1 o vetor de mistura x(t) = A0 s0 (t) se desprezar o ruído. Pela equação 3.12 viu-se que o processo de filtragem pode ser realizado pela multiplicação por uma matriz adequada. Portanto se Df é a matriz de filtragem, então x(t)Df = A0 s0 (t)Df = A0 s0 (t)∗

(5.1)

o que mostra que o modelo ainda é consistente. "Os componentes independentes foram filtrados pela mesmo processo que foi aplicada sobre as misturas"(HYVäRINEN; KARHUNEN; OJA, 2001), ou seja, s0 (t)∗ são as fontes estimadas filtradas.

Capítulo 5. Filtros Wavelets aplicado ao problema BSS

44

No método proposto neste trabalho a ideia é introduzir uma etapa de pré-processamento utilizando a transformada Wavelet como um processo de filtragem. Os sinais de mistura, após serem filtrados por algum filtro Wavelet previamente escolhido, utilizando apenas o primeiro nível de resolução, são então dados como entrada ao algoritmo AMUSE, mas apenas os coeficientes de aproximação da transformada. Neste método, como pode ser observado na figura 7, não é necessário calcular a transformada inversa do vetor de mistura, pois os coeficientes de aproximação são utilizados somente para obter a matriz de separação. Portanto implementa-se apenas a síntese do banco de filtro de dois canais e apenas o canal que executa a filtragem passa-baixa é utilizado. A figura 5.1 abaixo ilustra o método proposto. Figura 7 – Filtragem Wavelet em algoritmo BSS

Fonte: Próprio Autor

Para testar a eficiência deste método, serão utilizadas as medidas definidas no Capítulo 4, mais especificamente IP , SDR, SIR, SN R1 , SN R, e SAR. Alguns sinais de teste serão fornecidos ao algoritmo BSS com e sem a etapa de pré-processamento proposta, e os valores das medidas serão comparados. A Wavelet utilizada foi a Daubechies com vinte coeficientes (db10), pois testes preliminares mostraram que com ela se obtêm resultados melhores, embora a diferença não seja significativa. Apenas 1 nível de decomposição foi estabelecido, pois quantos mais níveis pior a estimação das fontes, aumentando a interferência de outras fontes a medida que aumenta-se os níveis de resolução.

Capítulo 5. Filtros Wavelets aplicado ao problema BSS

45

5.2 Resultados e Discussões dos Testes Realizados 5.2.1 Teste 1 Neste primeiro teste foram considerados dois sinais de voz, masculino (fonte 1) e feminino (fonte 2), ambos amostrados a taxa de 16.000Hz, cada um com 115.914 amostras, com SN R no valor de 42, 51dB e 45, 93dB, respectivamente. A figura 8 ilustra as duas formas de onda destes sinais. Figura 8 – Formas de onda de sinais de voz masculino e feminino

Para o processo de mistura considera-se uma matriz aleatória A ∈ R2×2 gerada R O sinais misturados estão exibidos na figura 9. pela função rand() do MATLAB .

Os sinais de mistura são então dados de entradas para o algoritmo AMUSE e para o algoritmo do método aqui proposto. A tabela abaixo resume os resultados obtidos para os sinais em análise, e as figuras 10 e 11 mostram os sinais estimados utilizando o método comum e o proposto, respectivamente.

5.2.2 Teste 2 Para o segundo teste foram considerados novamente dois sinais, mas desta vez do mesmo locutor, a pronúncia da letra "i"(fonte 1) e da "a"(fonte 2), ambos amostrados

Capítulo 5. Filtros Wavelets aplicado ao problema BSS

46

Figura 9 – Sinais da figura 8 após processo de mistura

Tabela 1 – Tabela com os resultados do Teste 1 IP SAR SDR SIR SN R M SE

Método Comum 0,01 Fonte 1 Fonte 2 280,20 279,80 37,72 32,93 37,72 32,93 46,00 42,51 1,29 0,72

Método Proposto 0,01 Fonte 1 Fonte 2 288,74 277,53 40,38 34,38 40,38 34,38 45,99 42,51 0,42 0,12

a taxa de 16.000Hz tendo 6.128 amostras, com SN R no valor de 31, 10dB e 48, 53dB, respectivamente. O processo de mistura novamente foi realizado com uma matriz gerada aleatoriamente. As figuras abaixo exibem os sinais originais e estimados, suas misturas, e a tabela com os resultados obtidos comparando os métodos em questão. Tabela 2 – Tabela com os resultados do Teste 2 IP SAR SDR SIR SN R M SE

Método Comum 0,01 Fonte 1 Fonte 2 296,95 305,42 37,99 39,29 37,99 39,29 31,09 48,30 1,43 0,77

Método Proposto 0,00 Fonte 1 Fonte 2 296,16 312,07 53,54 44,01 53,54 44,01 31,11 48,38 0,49 0,15

Capítulo 5. Filtros Wavelets aplicado ao problema BSS

47

Figura 10 – Fontes Estimadas para o Teste 1 pelo método comum

Figura 11 – Fontes Estimadas para o Teste 1 pelo método proposto

Os resultados exibidos nas tabelas 1 e 2, mostram que a medida SAR devida aos artefatos algorítmicos é ora maior, ora menor, para ambas as fontes no método proposto em comparação ao comum, não ocorrendo diferença significativa em nenhum dos testes. As outras medidas SIR e SDR tiveram valores maiores para o método proposto,

Capítulo 5. Filtros Wavelets aplicado ao problema BSS

Figura 12 – Formas de onda da pronúncia das letras i e a

Fonte: Próprio Autor Figura 13 – Sinais da figura 12 após processo de mistura

Fonte: Próprio Autor

48

Capítulo 5. Filtros Wavelets aplicado ao problema BSS

49

Figura 14 – Sinais da figura 12 estimados pelo método proposto

Fonte: Próprio Autor

o que indica que a interferência de outras fontes foi menor e a distorção também, o que implica que a estimação foi melhor. Já a medida IP não teve variação significativa, até a segunda casa decimal, para concluir entre qual método seja mais eficiente. Por outro lado a medida M SE apresentou valores menores para ambas as fontes, o que significa uma estimação melhor. Um fato que deve ser ressaltado é que as medidas citadas apresentaram valores iguais, até duas casas decimais, para as mesmas fontes, e isso significa que o erro na estimação é dominado pela interferência das fontes (VINCENT; GRIBONVAL; FEVOTTE, 2005) e não pela distorção. Tal fato já havia sido observado no capítulo anterior, na seção 4.1. Já no Teste 3 abaixo, como será observado, este valores não mais coincidirão, devido ao ruído adicionada aos sensores.

5.2.3 Teste 3 Os sinais do Testes 1 novamente serão utilizados para avaliação, no entanto neste teste o vetor de mistura estará contaminado por ruído branco aditivo, portanto serão considerados ruídos nos sensores que captam as fontes. As SNR’s das fontes continuam

Capítulo 5. Filtros Wavelets aplicado ao problema BSS

50

as mesmas já que o ruído é adicionado na mistura e não nas fontes. A figura 15 exibe os sinais do Teste 1 com ruído adicionado. Após a separação as fontes são estimadas no entanto estão contaminadas pelo ruído, já que o processo de separação das fontes não elimina o ruído. A figura 16 exibe os sinais estimados e a tabela 3 mostra os resultados obtidos com acréscimo da medida SN R1 não utilizada no testes anteriores. Figura 15 – Sinais da figura 8 após processo de mistura contaminados com ruído branco

Fonte: Próprio Autor

Tabela 3 – Tabela com os resultados do Teste 3 utilizando os sinais do Teste 1 contaminados por ruído branco IP SAR SDR SIR SN R1 SN R M SE

Método Comum 0,07 Fonte 1 Fonte 2 280,31 296,29 21,00 20,82 22,63 21,78 26,08 27,87 30,25 28,36 0,79 0,77

Método Proposto 0,01 Fonte 1 Fonte 2 272,25 286,02 25,46 27,39 38,68 33,72 25,68 28,55 29,81 29,13 0,14 0,13

Capítulo 5. Filtros Wavelets aplicado ao problema BSS

51

Figura 16 – Sinais do Teste 1 estimados

Fonte: Próprio Autor

5.2.4 Teste 4 Agora os sinais utilizados no Teste 2 são considerados, no entanto os sensores foram contaminados por ruído. As figuras 17 e 18 exibem as formas de onda dos sinais do Teste 2 com ruído no processo de mistura. Pode-se ver na tabela 4 as medições obtidas para os sinais em questão. Tabela 4 – Tabela com os resultados do Teste 4 utilizando os sinais do Teste 2 contaminados por ruído branco IP SAR SDR SIR SN R1 SN R M SE

Método Comum 0,01 Fonte 1 Fonte 2 294,13 293,87 32,50 37,11 36,77 37,91 34,54 44,88 45,91 30,36 0,64 1,25

Método Proposto 0,00 Fonte 1 Fonte 2 292,25 294,82 34,53 44,38 63,12 53,03 34,53 45,02 46,34 30,36 0,09 0,39

A análise dos resultados para o terceiro e quarto testes, deixa claro a melhora das medidas SDR e SIR utilizando o método proposto, em ambos os testes, atingindo uma

Capítulo 5. Filtros Wavelets aplicado ao problema BSS

52

Figura 17 – Sinais da figura 12 após processo de mistura contaminados com ruído branco

Fonte: Próprio Autor Figura 18 – Sinais do Teste 2, contaminados por ruído, estimados

Fonte: Próprio Autor

Capítulo 5. Filtros Wavelets aplicado ao problema BSS

53

diferença máxima de até aproximadamente 27dB (medida SIR da Tabela 4). A medida SN R1 , como pode ser observado na Tabela 3, teve melhor resultado para a fonte 2, no entanto para a fonte 1 não, o mesmo não ocorrendo para o resultado exibido na Tabela 4, onde constata-se que o método proposto apresenta melhor resultado para ambas as fontes. As medidas IP e M SE, nos dois últimos testes realizados, foram também melhores. A medida SDR, assim como para os testes 1 e 2, teve comportamento semelhante, sendo ora melhor, ora pior. Como era esperado a medida SN R das fontes estimadas teve valores menores que a SN R das fontes originais. Isso se deve ao fato do sistema de separação não eliminar ruído. Como foi adicionado ruído aos sensores, as fontes foram estimadas juntamente com uma combinação linear do ruído de cada sensor.

5.3 Conclusão O método proposto apresentou vantagens em relação ao comum, tendo atingido valores melhores para as métricas utilizadas. Em ambiente ruidoso as medidas SDR, SIR e M SE apresentaram valores melhores ainda, que em outro ambiente. Veja por exemplo, a diferença entre o valor do método proposto pelo comum das medidas de performance para cada fonte, nos Testes 1 e 3, exibidos nas figuras 19 e 20. Figura 19 – Diferença das Medidas de Performance para a fonte 1 dos Testes 1 e 3

Fonte: Próprio Autor

Capítulo 5. Filtros Wavelets aplicado ao problema BSS

Figura 20 – Diferença das Medidas de Performance para a fonte 2 dos Testes 1 e 3

Fonte: Próprio Autor

54

55

6 CONSIDERAÇÕES FINAIS Foi proposto neste trabalho a inserção de uma camada de pré-processamento antes da utilização do algoritmo AMUSE. Para isto utilizou-se filtragem por meio de filtros Wavelet com o objetivo de verificar quais as vantagens e desvantagens desta mudança numa abordagem experimental. Os resultados obtidos no capítulo anterior mostraram que houve melhora significativa nas medidas SDR e SIR pelo método proposto, atingindo aproximadamente 27dB a diferença, se comparada ao método somente utilizando AMUSE. Também houve aumento na medida SN R, o que indica menos ruído nas fontes estimadas. A medida IP também foi melhor, embora não tão discrepante, se comparada a performance obtida pelo método usual. Já a medida SN R1 e SAR foi ora melhor, ora pior, dependendo da fonte, o que torna a utilização dessas medidas não conclusiva para avaliar a melhora de performance, pelo menos para os experimentos realizados aqui. Enfim, como o objetivo primordial era apenas uma análise superficial dessa etapa de pré-processamento utilizando filtros Wavelets, pode-se concluir, em linhas gerais, que o método proposto é vantajoso, mesmo se considerar aplicações com algum ruído captado pelos sensores. Na verdade em ambiente ruidoso o método proposto se mostrou mais vantajoso ainda do que quando não foi adicionado ruído aos sensores.

56

REFERÊNCIAS AMARI, S.; CICHOCKI, A.; YANG, H. H. A new learning algorithm for blind signal separation. MIT Press, p. 757–763, 1996. ANTON, H. Elementary Linear Algebra. 10o . ed. [S.l.]: John Wiley, 2010. BUCCIGROSSI, R. Breaking up is hard to do: Blind signal separation. 1997. CICHOCKI, A.; AMARI, S. Adaptative Blind Signal e Image Processing. New York: Wiley, 2003. DAUBECHIES, I. Ten Lectures on Wavelets. Philadelphia: SIAM Books, 1992. DELLER, J. L.; PROAKINS, J. G.; HANSEN, J. H. L. Discrete-time processing of speech signals. New York: Macmillam, 1993. DINIZ, P. S. R.; SILVA, E. A. B. d.; NETTO, S. L. Processamento Digital de Sinais: Projeto e Análise de Sistemas. 2a . ed. Porto Alegre: Bookman, 2010. DOMINGUES, H. H.; IEZZI, G. Álgebra Moderna. 3a . ed. São Paulo: Atual Editora, 1982. GRIBONVAL, R.; BENAROYA, L.; VINCENT, E.; FÉVOTTE, C. Proposals for performance measurement in source separation. Nara, Japan, p. 763–768, abr. 2003. HYVäRINEN, A.; KARHUNEN, J.; OJA, E. Independent Component Analysis. New York: Wiley, 2001. MALLAT, S. A Wavelet Tour of Signal Processing: The Sparse Way. 3o . ed. Burlington: Elsevier, 2009. MARY, A. W. M.; KUMAR, A. P.; CHACKO, A. A. Blind source separation using wavelets. IEEE International Conference on Computational Intelligence and Computing Research, 2010. MISSAOUI, I.; LACHIRI, Z. Blind speech separation based on undecimated wavelet packetperceptual filterbanks and independent component analysis. IJCSI International Journal of Computer Science Issues, v. 8, n. 1, 2011. MORETTIN, P. A. Ondas e Ondaletas: Da Análise de Fourier à Análise de Ondaletas. São Paulo: Editora da Universidade de São Paulo, 1999. MOUSSAOUI, R.; ROUAT, J.; LEFEBVRE, R. Wavelet based independent component analysis for multi-channel source separation. v. 5, p. V–V, May 2006. ISSN 1520-6149. OLIVEIRA, H. M. Análise de Sinais para Engenheiros: Uma abordagem via Wavelets. Rio de Janeiro: Brasport, 2007. STRANG, G.; NGUYEN, T. Wavelets and Filter Banks. Cambridge: Wellesley, 1997.

Referências

57

TALBI, M.; AICHA, A. B.; SALHI, L.; CHERIF, A. Bionic wavelet based denoising using source separation. INT J COMPUT COMMUN, v. 7, n. 3, p. 574–585, September 2012. TONG, L.; LIU, R.; SOON, V.; HUANG, Y. Indeterminacy and identifiability of blind identification. Circuits and Systems, IEEE Transactions on, v. 38, n. 5, p. 499–509, May 1991. ISSN 0098-4094. TONG, L.; SOON, V.; HUANG, Y.; LIU, R. Amuse: a new blind identification algorithm. p. 1784–1787 vol.3, May 1990. VINCENT, E.; GRIBONVAL, R.; FEVOTTE, C. Performance measurement in blind audio source separation. IEEE Trans. Speech and Audio Proc., 2005. To appear. R e Wavelets. 2a . ed. WEEKS, M. Processamento Digital de Sinais Utilizando MATLAB Rio de Janeiro: LTC, 2012.

Lihat lebih banyak...

Filtros Wavelets para Separação Cega de Sinais de Voz

Descrição do Produto

Comentários