ANÁLISE COMPARATIVA DA APLICAÇÃO DE REDES NEURAIS E SISTEMAS DE INFERÊNCIA DIFUSA NA PREVISÃO DE NÍVEL DO RIO QUARAÍ UTILIZANDO PREVISÃO DE CHUVA

June 13, 2017 | Autor: Fernando Dornelles | Categoria: Neural Network, Numerical Model, Fuzzy Inference System, Water Level, Stream Flow
Share Embed


Descrição do Produto

ANÁLISE COMPARATIVA DA APLICAÇÃO DE REDES NEURAIS E SISTEMAS DE INFERÊNCIA DIFUSA NA PREVISÃO DE NÍVEL DO RIO QUARAÍ UTILIZANDO PREVISÃO DE CHUVA Fernando Dornelles1; Olavo C. Pedrollo2 & Joel A. Goldenfum3 RESUMO --- Bacias hidrográficas com pequenas dimensões, com características de coeficiente de escoamento alto e tempo de pico curto formam cenários que dificultam a utilização de técnicas tradicionais de previsão de nível. A utilização de previsões hidrometeorologicas permite uma ampliação do tempo disponível entre a previsão e a ocorrência do nível previsto, porém acrescentam muita incerteza nos dados de entrada para os modelos. Ferramentas como Redes Neurais (RNs) e Sistemas de Inferência Difusa (SIDs) possuem capacidades de assimilação de incertezas e generalização de resultados, sendo portanto modelos indicados para estes casos. A análise, para o caso do Rio Quarai, mostrou vantagens do uso de RNs para antecedências pequenas (1 e 2 dias) e vantagens dos SIDs para as maiores antecedências (3 e 4 dias). As previsões hidrometeorológicas foram fornecidas pelo modelo ETA-CPTEC de forma numérica para uma malha de 40 x 40km, enquanto que os níveis observados provêm de um linígrafo operante na secção de interesse para previsão de nível do Rio Quaraí. ABSTRACT--- Wathersheds with little dimensions, high stream flow coefficient and short peak time are features which cause problems to the usage of traditional techniques in water level forecast. The appliance of rain forecast allows the enlargement of the time between the moment of forecast and the flood event. However, this procedure adds inaccuracy to the model’s input data. Tools as Neural Networks (NN) and Fuzzy Inference Systems (FIS) have ability to assimilate the inaccuracy and generalization of the results, therefore being a suitable model for these cases. The analysis, in case of the Quarai river, has shown advantages for the usage of NN for 1 and 2 days forecast, and FIS for 3 and 4 days forecast. Rain forecast was provided by ETA-CPTEC numeric model for a 40 x 40Km mesh, and the observed levels are supplied by the water-level recorder located in the forecast section of the Quarai river which concerns this study.

Palavras-chave: Sistemas inteligentes, previsão numérica de chuvas, previsão de nível.

1

Mestrando do PPGRHSA do Instituto de Pesquisas Hidráulicas – Universidade Federal do Rio Grande do Sul – Caixa Postal 15029 CEP 91501-970 – Porto Alegre, RS. E-mail: [email protected] 2 IPH/UFRGS : Ave Bento Gonçalves, 9500, prédio 44301. Bairro Agronomia. Porto Alegre – RS. CEP : 91501-970. Fone : 3316 7500; Fax : 3316 6565; e-mail : [email protected] 3 IPH/UFRGS : Ave Bento Gonçalves, 9500, prédio 44301. Bairro Agronomia. Porto Alegre – RS. CEP : 91501-970. Fone : 3316 6621; Fax : 3316 7509; e-mail : [email protected]

INTRODUÇÃO Justificativa Prever o comportamento de uma variável natural, com antecedência e precisão necessária, movimenta uma grande parcela da comunidade científica e gera benefícios para a sociedade em geral. A previsão de níveis em rios freqüentemente utiliza modelos conceituais determinísticos, que têm embasamento físico em suas formulações e respondem com valores exatos. Esses modelos apresentam a desvantagem de utilizar valores constantes para parâmetros que variam espacial e temporalmente, além de, em geral, não terem seus parâmetros automaticamente atualizados para processos com mudança de comportamento. Devido às limitações conhecidas dos modelos conceituais, modelos empíricos também são utilizados, porém, métodos tradicionais, como regressão e ajuste de funções, por vezes não permitem a representação de fenômenos com grande complexidade. Em particular, a previsão em tempo atual para bacias pequenas é um caso complexo, pois, para fornecer a antecedência suficiente para uso em sistemas de alerta de cheias, o uso das previsões de precipitação é requerida, acrescentando ao modelo, assim, uma incerteza a mais ─ o erro da previsão hidrometeorológica. Ferramentas com maior poder de adaptação às situações complexas têm sido estudadas e desenvolvidas. Modelos que “aprendem” com os próprios dados observados do fenômeno fornecem a capacidade de adaptação exigida. Modelagens que utilizam técnicas de redes neurais e lógica fuzzy são exemplos clássicos de ferramentas que extraem conhecimento da amostra de dados observados.

Objetivo Avaliar a qualidade relativa entre a aplicação de um modelo de redes neurais e um modelo de inferência difusa, para prever níveis no Rio Quaraí, na fronteira entre Brasil e Uruguai.

OS SISTEMAS DE INFERÊNCIA DIFUSA Apresentação e Descrição Os sistemas de inferência difusa (SID) utilizam princípios de lógica fuzzy, de modo que as informações são tratadas com suas incertezas naturais, fornecendo respostas ponderadas pelos graus de pertinência das variáveis independentes de entrada do sistema. Esses sistemas são modelos empíricos, nos quais o conhecimento é adquirido através das experiências passadas, assim como um prático (piloto de navio local, que conhece as peculiaridades I Simpósio de Recursos Hídricos do Sul-Sudeste

2

da região), que sabe que atitudes tomar, tais como velocidade, direção e posição, em função das condições atuais, para conduzir uma embarcação com segurança por uma região já percorrida por ele diversas vezes. O conhecimento de um sistema de inferência difusa pode ser armazenado em forma matricial (figura 1) chamada de matriz cognitiva (Pedrollo, 2000). Essa matriz contém uma coleção de regras que indicam qual resposta é mais significativa para um dado vetor de entrada com os valores das variáveis independentes fornecidos.

Figura 1 – Exemplo de matriz cognitiva e regras associativas

Fundamentos Teóricos A lógica fuzzy distingue-se da lógica clássica (Booleana) por permitir graus de pertinências diferentes de 0 e 1. Para um conjunto difuso existem graus intermediários de pertinência, uma vez que elementos podem pertencer a mais de um conjunto, competitivo ou adjacente, do mesmo universo de discurso. O conceito de pertinência é diferente do de probabilidade, uma vez que, enquanto a probabilidade indica a chance de ocorrência de um evento, o grau de pertinência indica o quanto o evento pertence a uma classe considerada (figura 2).

Figura 2 – Exemplo da pertinência de um dado x1 a um conjunto O acionamento da função de pertinência por um elemento resulta no grau correspondente de pertinência, o qual representa a ambigüidade e a incerteza de pertencer a um ou a mais conjuntos. As formas mais comuns para as funções de pertinência são a sigmóide (A) (em forma de sino), a triangular (B) e a trapezoidal (C) (figura 3).

I Simpósio de Recursos Hídricos do Sul-Sudeste

3

Figura 3 – Exemplos de funções de pertinência A sobreposição dos domínios dos conjuntos, em uma variável particionada (ou quantizada), permite que um elemento acione mais de um conjunto ao mesmo tempo, com graus de pertinência entre 0 e 1. Excesso de sobreposição reduz a relevância dos conjuntos e torna imprecisa a atribuição a estes. Por outro lado, superposição reduzida tende para a bivalência , ou seja, conjuntos não difusos (Pedrollo, 2000). Após o acionamento dos conjuntos difusos da variável de saída, como conseqüência dos mecanismos internos de inferência, é realizada a desquantização (ou “defuzzificação”), para a qual os dois métodos mais recomendados são o do centróide (a) e das alturas (b) (figura 4).

Figura 4 – Métodos de desquantização

Aprendizado Difuso O aprendizado de um SID é o estabelecimento de regras difusas que

associa a cada

configuração de conjuntos de entrada, uma saída representada pelo conjunto difuso correspondente. Este aprendizado pode ser criado a partir da experiência ou da introspecção, constituindo-se da quantização dos universos de discurso, atribuição dos conceitos lingüísticos apropriados, escolha das funções de pertinência adequadas e articulação conveniente das regras. Muitas vezes, porém, mesmo em sistemas moderadamente complexos, são necessários procedimentos automáticos para estabelecer o conhecimento. Métodos de aprendizado automáticos, que utilizam dados amostrais no estabelecimento de regras associativas, são comumente empregados quando o grau de complexidade e o número de dimensões extrapolam a capacidade humana de relacionar causas e efeitos. O método de aprendizado organizativo consiste, basicamente, em uma pesquisa dos agrupamentos dos dados amostrais, com contagem das ocorrências de combinações dos agrupamentos de entrada aos de saída. As regras são armazenadas em uma matriz cognitiva I Simpósio de Recursos Hídricos do Sul-Sudeste

4

multidimensional, onde cada dimensão é uma variável do sistema, e o valor armazenado é o peso da conexão, resultante dos produtos das pertinências respectivas. A utilização de número elevado de conjuntos e de variáveis de entrada resulta em sistemas com dimensionalidade excessiva. Se a amostra de dados para o aprendizado não possuir situações suficientes para a geração das regras correspondentes, pode ocorrer falta de conhecimento disponível para a generalização do modelo, o que é uma forma da chamada “maldição da dimensionalidade”.

AS REDES NEURAIS Apresentação e Descrição As redes neurais são modelos computacionais inspirados no funcionamento dos neurônios biológicos. Estas redes são compostas por camadas de processamento, podendo ter em cada camada vários neurônios. O dado é apresentado aos neurônios da primeira camada (ou camada de entrada), produzindo sinais em sua saída que, por sua vez, irão estimular os neurônios da camada subseqüente, até atingir a última camada (camada de saída). A estrutura da rede é esquematizada na figura 5.

Figura 5 – Exemplo da estrutura de uma Rede Neural As redes neurais apresentam como principais características o aprendizado e a generalização. O aprendizado diz respeito à capacidade de extrair informações de uma amostra de dados observados, com vetores de entrada e suas respectivas saídas. A generalização é a capacidade de responder a situações que não foram apresentadas à rede neural na etapa de aprendizado (Pedrollo, 2005).

Fundamentos Teóricos O processo realizado em cada neurônio é uma operação matricial da forma:  n  y = F  ∑ wi p i − b   i =1 

I Simpósio de Recursos Hídricos do Sul-Sudeste

5

Onde : y é a resposta do neurônio; F é a função de ativação; w são os pesos sinápticos de entrada de cada neurônio; p são as entradas a serem processadas no neurônio; b é a tendência de saída para cada neurônio. O treinamento de uma rede neural consiste em ajustar os pesos w de forma que a reposta de saída da última camada da rede fique o mais próximo possível da desejada.

Treinamento das Redes Neurais O método de treinamento para uma rede multicamada mais difundido é o da retropropagação do erro (backpropagation). Os pesos de cada neurônio são atualizados aplicando-se a Regra Delta (Kovács, 1996) isoladamente a cada neurônio, sendo que suas entradas são as saídas da camada anterior e o seu erro são os pesos da camada posterior multiplicado pela derivada da função de ativação para os valores de saída da camada posterior também (figura 6). Regra Delta :

wk +1 = wk − η∇( E (wk )) ,

Onde: η é o tamanho do passo de aprendizado no sentido oposto; w são os pesos sinápticos do neurônio; E é o erro quadrático da saída da rede.

1 wh

H

2

wo

wh

T

dados desejados

O

dados calculados E =O-T

i

∆1= (f(H))’ * WoT*∆2 Wh(i+1)=Wh(i)+2*η*∆1*H

∆2= (f(O))’ * E Wo(i+1)=Wo(i)+2*η*∆2*H

Figura 6 – Esquema do treinamento por Backpropagation A convergência deste método pode ser acelerada usando um termo que aumenta o tamanho do passo de treinamento, caso o erro da iteração anterior tenha sido menor que o atual, e diminuída quando o erro anterior é maior que o atual. Este termo é chamado de momentun. Quando o treinamento utiliza amostras com resultados desejados, ele é dito “supervisionado”. Se os pesos de cada neurônio são atualizados somente a cada ciclo, onde todas amostras são apresentadas à rede, o treinamento é por “batelada”. Este é o tipo de treinamento mais utilizado para redes progressivas de camadas múltiplas.

I Simpósio de Recursos Hídricos do Sul-Sudeste

6

O problema do superajustamento (overfiting) ocorre quando a rede reproduz pequenos ruídos da amostra de treinamento, gerando resultados destoantes para uma nova amostra não-utilizada no treinamento (amostra de verificação). Este problema pode ser contornado, utilizando-se uma amostra de validação, que é empregada para responder em paralelo, ao mesmo tempo em que a rede é treinada. Para a amostra de treinamento, o erro médio sempre diminui com o número de iterações, porém, para a amostra de validação, existirá um número de iterações onde o erro será mínimo (figura 7).

Figura 7 - Função do Erro Quadrático da amostra de Treinamento e de Validação

APLICAÇÃO Características do sistema A bacia hidrográfica à montante das cidades de Quarai (Br) e Artigas (Uy) ocupa uma área de aproximadamente 4.500km². Seu solo apresenta pequena espessura (~50cm), o que gera um coeficiente médio de escoamento alto (~ 46) para uma bacia rural. Seu tempo de concentração é de aproximadamente 28h, e o tempo entre os picos de chuva e o pico de vazão observado na secção entre as duas cidades. Estas características corroboram para escoar em 30% do tempo 90% da vazão total anual produzida na bacia. Em ambas as cidades, existem habitantes ocupando zonas de inundação do rio, que são sistematicamente removidos quando ocorrem inundações. As autoridades responsáveis pelo auxílio à população não contam com um sistema de alerta que forneça antecedência suficiente para sua ação em caso de enchentes, pois a previsão de nível baseada apenas em níveis observados à montante não fornece a antecedência adequada. Neste caso, espera-se que a utilização de previsões hidrometeorológicas proporcione uma previsão de nível com antecedência adequada para a ação da Defesa Civil local.

Dados Disponíveis A região é monitorada com um linígrafo da DNH (Dirección Nacional de Hidrologia del Uruguay) na secção onde se deseja prever o nível, que fornece por telemetria a informação continuamente atualizada do nível do rio.

I Simpósio de Recursos Hídricos do Sul-Sudeste

7

A previsão hidrometeorológica é obtida via rede internacional de computadores (Internet), disponibilizados pelo CPTEC (Centro de Previsão do Tempo e Estudos Climáticos), duas vezes por dia (às 0h e às 12h). Esta previsão é gerada de forma numérica para uma malha espaçada de 40km e para um horizonte de até 5 dias. Desta malha, foram selecionados 4 pontos que cobrem a área da bacia, sendo calculada a previsão de chuva diária através da ponderação por polígonos de Thiesen.

Amostras O total de dados possui 490 amostras, e cada amostra é composta por 12 atributos (tabela 1). Tabela 1 – Uma amostra de treinamento. Entradas

Saídas

Nível antes de ontem

Nível ontem

Prev. chuva 1°dia

Prev. chuva 2°dia

Prev. chuva 3°dia

Prev. chuva 4°dia

Prev. chuva 5°dia

Nível 1° dia

Nível 2° dia

Nível 3° dia

Nível 4° dia

Nível 5° dia

N(i-2)

N(i-1)

P(i)

P(i+1)

P(i+2)

P(i+3)

P(i+4)

N(i+1)

N(i+2)

N(i+3)

N(i+4)

N(i+5)

Assim, cada amostra contém as informações de níveis observados nos 2 dias anteriores ((i-2) e (i-1)) do dia da previsão, as previsões diárias de chuva para os 5 dias à frente ((i), (i+1)...(i+4)) e os níveis observados para o 2º até o 6º dia ((i+1), (i+2)...(i+5)). A previsão de nível para o dia (i) é feita no dia anterior, pois, em função do tempo de concentração da bacia (~28h), a chuva ocorrida no dia (i) irá influenciar mais significativamente o nível do rio no dia (i+1).

Particionamento da amostra A amostra foi particionada em 3 conjuntos; um para treinamento com 50% dos dados, um para validação com 25%, e outro para verificação com 25%. A separação foi executada tirando-se de cada 4 amostras, a 1ª e 2ª para treinamento,a 3ª para validação e a 4ª para a verificação (figura 8).

Figura 8 –Esquema do particionamento da amostra A forma adotada de particionamento teve por objetivo a obtenção de amostras mais representativas do conjunto total dos dados, visto que o período total de amostragem não abrange nem ao menos um ano hidrológico completo, o que acarretaria, com a forma tradicional de partição por períodos, amostras muito heterogêneas devido à forte sazonalidade dos regimes hidrológicos. I Simpósio de Recursos Hídricos do Sul-Sudeste

8

Características dos Sistemas de Inferência Difusa (SIDs) utilizados Os SIDs utilizaram funções de pertinência do tipo triangulares e sigmóides isoladamente. O número de entradas foi em função do horizonte de previsão, a saber: para previsão de nível do 1º dia, o número de entradas foi de 3 (níveis do rio para 2 dias anteriores e a previsão hidrometeorológica para o 1° dia), e o número de saídas foi de 1 para todos horizontes. Foram adotados 3 níveis de complexidade (número de conjuntos difusos) para os SIDs, conforme a tabela 2. Tabela 2 – Número de conjuntos difusos dos SIDs.

SID 1 SID 2 SID 3

Nº de conjuntos de níveis 6 7 8

Nº de conjuntos de chuvas 3 5 7

Nº de conjuntos de níveis 8 8 8

A sobreposição dos conjuntos difusos foi de 50%, ou seja, o mínimo de uma certa função corresponde ao máximo das funções adjacentes. A utilização de SIDs mais complexos normalmente responde mais precisamente, porém requer um número maior de regras associativas a serem extraídas da amostra de aprendizado, o que depende de uma amostra representativa de qualidade. Em SIDs mais complexos, pode ocorrer a falta de regras para determinadas configurações dos dados de entrada. Para atender às situações de falha, foi adotado um sistema encadeado que utiliza um SID auxiliar menos complexo. O aprendizado dos SIDs foi do tipo organizativo, com a parcela da amostra de aprendizado. Os resultados de desempenho utilizaram a amostra de verificação. A outra parcela de dados de validação não foi utilizada no modelo de previsão por SID, pois esta parcela será usada apenas para a validação cruzada do modelo por Redes Neurais. Para cada horizonte de previsão, foram submetidos ao processo de aprendizagem 6 SIDs distintos, com os 3 níveis de complexidade para funções triangulares e para funções sigmóides, totalizando para os 5 horizontes de previsão 30 processos de aprendizagem. A rotina de aprendizado foi implementada com o software “MatLab5.3 for Windows”, com o uso do recurso “FIS Editor” do pacote de ferramentas.

Características das Redes Neurais (RNs) utilizadas As redes neurais permitem várias configurações diferentes, combinando seus parâmetros de ajuste. Para fins de especulação inicial da aplicação, foram utilizadas funções de ativação, bem como parâmetros de treinamento (passos, número de iterações, critérios de parada, erro e gradiente de decaimento mínimos) fixos, sendo somente experimentadas alternativas para o número de neurônios na camada intermediária. I Simpósio de Recursos Hídricos do Sul-Sudeste

9

As funções de ativação foram a TANSIG (sigmóide com valores de resposta entre -1 e 1) para a camada de entrada e a POSLIN (linear com valores de resposta maior ou igual a zero) para a camada de saída. A função adota para a saída impede que tenhamos valores de níveis negativos e não limita superiormente os valores de previsão de nível, não impedindo assim, que para amostras de verificação sejam feitas previsões com níveis superiores aos existentes na amostra de treinamento (figura 9).

Figura 9 – Representação gráfica das funções de ativação TANSIG (esq.) e POSLIN (dir.) A sensibilidade destas funções existe apenas no intervalo de suas magnitudes. Para tanto, as amostras devem ser escalonadas de forma que fiquem dentro destes intervalos também. Como critérios de parada, foram adotados o erro médio quadrático mínimo de 0,001 e o número máximo de iterações de 20.000. Este limite foi adotado em função do monitoramento do decaimento do erro médio quadrático, que é praticamente desprezível para este número de iterações. Outro critério de parada foi o valor do gradiente mínimo, de 1x10-10, indicando uma convergência praticamente nula. O valor do passo de treinamento (momentun) foi de 0,02. A fim de impedir o superajustamento, foi utilizada uma amostra para a validação cruzada. O número máximo permitido de inflexões devido ao aumento do erro calculado na amostra de validação foi de 50. Este valor foi adotado em função de oscilações que foram observadas logo no início do treinamento, que provocam a interrupção do processo com os erros médios quadráticos ainda muito altos (figura 10).

Figura 10 – Decaimento do erro durante treinamento e sua oscilação inicial I Simpósio de Recursos Hídricos do Sul-Sudeste

10

O algoritmo usado no treinamento foi o do gradiente descendente com momentun, que é uma variação do método de retropropagação do erro. Este algoritmo está incorporado no pacote de ferramentas do software MatLab com nome de comando “TRAINGDM”. Foi utilizada somente uma camada intermediária, pois o teorema de Kolmogorov (1957) apud Kovács (1996) mostra que sempre há uma implementação exata com uma rede neural de 3 camadas (camada de entrada, intermediária e de saída). O número de neurônios na camada intermediária foi a única variação adotada para os parâmetros de configuração e de treinamento do modelo. Foram utilizadas redes com 3, 5 e 7 neurônios nesta camada. O treinamento utiliza pesos iniciais arbitrários entre -1 e 1. Por vezes, estes valores direcionam a uma convergência prematura para mínimos locais da função de erro. Cada treinamento foi repedido 3 vezes, e o melhor dos resultados foi armazenado e utilizado para a análise dos resultados. O número de treinamentos realizados foi de 9 para cada horizonte, sendo o número de horizontes de previsão de 5 dias, totalizando 45 treinamentos.

Critérios de avaliação de desempenho A avaliação de desempenho comparativa utilizou a mesma amostra de verificação para obter os resultados para os dois modelos em análise neste trabalho. A amostra de verificação conta com 122 registros, sendo obtidos desta amostra os seguintes parâmetros: o erro médio absoluto (EmA) e relativo (EmR), seus erros padrões (EpA e EpR), coeficiente de eficiência (Ce) e índices de freqüência de erro para 10%, 50%, 75%, 80%, 85%, 90%, 95% e 97,5%. O índice de freqüência de erro indica o valor numérico que não foi superado pelos erros do modelo em uma determinada porcentagem de ocorrências, informando de maneira mais intuitiva a qualidade da previsão (Pedrollo, 2005). O coeficiente de eficiência é a proporção com que o modelo explica a variância da variável observada. EmA = 1/k Σt ||ût – ut|| EmR = 1/k Σt ||ût – ut / ut|| EpA = [1/k Σt (ût – ut)2]1/2 EpR = [1/k Σt ((ût – ut) / ut)2]1/2 Ce = 1 - Σt(ût – ut)2/ Σt (uµ – ut)2 onde: ut = observação, no intervalo t, da variável a ser prevista; uµ = média dos valores amostrais de u; ût = valor previsto de u para o intervalo de tempo t; k = número de observações. I Simpósio de Recursos Hídricos do Sul-Sudeste

11

Com a análise de todos estes parâmetros, obtém-se um resultado sinérgico, no qual todos parâmetros são utilizados, permitindo uma avaliação mais completa para a eleição do melhor modelo.

RESULTADOS E ANÁLISES O processo organizativo de aprendizado para os SIDs foi muito lento para os sistemas mais complexos (SID-2 e SID-3), especialmente para os horizontes maiores (4 e 5 dias), quando o número de variáveis de entrada é maior (6 e 7 entradas). O tempo de processamento, bem como a redução da qualidade dos resultados com o alcance, contribuiu para a limitação dos horizontes de previsão analisados. O aprendizado para o horizonte de 5 dias, por exemplo, apresentou elevado número de horas de processamento, acima de 8h, não tendo sido concluído. Optou-se pela análise, por hora, de no máximo 4 dias de antecedência para as previsões. As repostas de ambos os recursos (SIDs e RNs) apresentaram erros crescentes em função do aumento do horizonte de previsão de nível no rio. Apesar de não ter sido feito neste trabalho uma avaliação da qualidade de previsão pluviométrica, sabe-se do aumento de incerteza para horizontes maiores, contido nas próprias especificações dos modelos de previsão de chuva, apresentadas na tabela 4.

Análise dos resultados por horizonte de previsão As previsões com antecedência de 1 dia tiveram melhores resultados com o uso de RNs, sendo que os SIDs foram superados, para este alcance, segundo os critérios utilizados para comparação (tabela 3). De fato, a diferença, por exemplo, do valor que não foi superado pelos erros da rede neural em 95% das ocorrências, de 0,72m, é significativa em relação ao valor que não foi superado pelos erros correspondentes do sistema difuso, de 0,87m. Tabela 3 – Resultados comparativos de previsão para o 1° dia 10% 50% 75% 80% 85% 90% 95%

97,5%

FIS2T1D

EmA(m) 0,306

EpA(m) EmR EpR 0,463

19% 29% 0,894

0

0,03 0,22 0,40 0,46 0,49 0,61 0,87

1,10

RN7N1D

0,223

0,320

9%

-

0,02 0,14 0,29 0,31 0,44 0,56 0,72

0,89

8%

Ce

N_Falhas

0,947

Na figura 11, observa-se que as redes neurais acompanham melhor, não apenas as recessões, mas também os picos do desenvolvimento do gráfico, o que confirma as estatísticas obtidas.

I Simpósio de Recursos Hídricos do Sul-Sudeste

12

Tabela 4 – Resultados dos treinamentos para os 4 horizontes Valores de Erro na Previsão que não foram superados em percentuais de vezes EmA(m) Funções Sigmóide Prev. 1 dia

Funções Triangular Prev. 1 dia

Rede Neural 1 dia

Funções Sigmóide Prev. 2 dia

Funções Triangular Prev. 2 dia

Rede Neural 2 dia

Funções Sigmóide Prev. 3 dia

Funções Triangular Prev. 3 dia

Rede Neural 3 dia

Funções Sigmóide Prev. 4 dia

Funções Triangular Prev. 4 dia

Rede Neural 4 dia

EpA(m)

EmR

EpR

Ce

N_Falhas

SID1

0,395

0,537

21,0%

23,2%

0,850

0

10% 50% 75% 80% 85% 90% 95% 97,5% 0,06 0,31 0,46 0,53 0,64 0,78 1,08

1,32

SID2

0,322

0,480

17,8%

21,2%

0,886

0

0,06 0,24 0,37 0,42 0,49 0,64 0,99

1,26

SID3

0,395

0,613

21,6%

27,3%

0,809

0

0,06 0,21 0,46 0,54 0,77 1,03 1,32

1,66

Encad

0,395

0,613

21,6%

27,3%

0,809

0

0,06 0,21 0,46 0,54 0,77 1,03 1,32

1,66

SID1

0,406

0,596

25,1%

41,5%

0,824

0

0,04 0,25 0,52 0,68 0,80 0,89 1,31

1,48

SID2

0,306

0,463

18,8%

29,4%

0,894

0

0,03 0,22 0,40 0,46 0,49 0,61 0,87

1,10

SID3

0,394

0,604

22,9%

33,0%

0,811

0

0,04 0,23 0,51 0,62 0,78 0,91 1,30

1,65

Encad

0,394

0,604

22,9%

33,0%

0,811

0

0,04 0,23 0,51 0,62 0,78 0,91 1,30

1,65

3 Neurônios

0,233

0,335

11,0%

10,1%

0,943

-

0,03 0,14 0,27 0,32 0,39 0,57 0,79

0,90

5 Neurônios

0,252

0,385

12,1%

12,9%

0,927

-

0,04 0,13 0,30 0,39 0,44 0,66 0,94

1,20

7 Neurônios

0,223

0,320

9,1%

7,8%

0,947

-

0,02 0,14 0,29 0,31 0,44 0,56 0,72

0,89 1,96

SID1

0,531

0,791

27,2%

33,4%

0,662

0

0,06 0,33 0,60 0,72 0,83 1,43 1,79

SID2

0,482

0,753

23,0%

29,6%

0,705

0

0,06 0,29 0,51 0,70 0,84 1,13 1,71

1,96

SID3

0,529

0,819

30,0%

42,0%

0,653

1

0,06 0,28 0,66 0,87 1,11 1,24 1,70

2,51

Encad

0,540

0,833

30,2%

41,9%

0,641

0

0,06 0,28 0,69 0,88 1,12 1,31 1,71

2,51

SID1

0,531

0,801

30,9%

49,1%

0,665

0

0,05 0,33 0,62 0,85 1,05 1,31 1,80

1,99

SID2

0,868

1,326

54,8%

98,4%

-0,019

31

0,06 0,35 1,16 1,55 1,96 2,79 3,54

3,71

SID3

0,897

1,317

60,7%

115,5%

-0,083

32

0,08 0,35 1,16 1,63 2,25 2,86 3,62

3,71

Encad

0,517

0,833

33,1%

74,7%

0,642

0

0,05 0,28 0,59 0,75 1,03 1,17 1,83

2,65

3 Neurônios

0,433551

0,692

21,1%

25,9%

0,753

-

0,06 0,21 0,53 0,75 0,93 1,08 1,42

1,95

5 Neurônios

0,439605

0,691

21,9%

41,2%

0,754

-

0,03 0,27 0,57 0,69 0,83 1,14 1,51

1,76

7 Neurônios

0,446934

0,698

22,6%

28,1%

0,749

-

0,06 0,26 0,54 0,68 0,80 1,26 1,48

1,78

SID1

0,536

0,830

26,6%

34,7%

0,645

0

0,06 0,31 0,59 0,82 0,91 1,16 1,95

2,20

SID2

0,615

0,939

29,5%

34,8%

0,559

0

0,07 0,33 0,78 0,89 1,26 1,52 2,23

2,58

SID3

0,615

0,923

31,7%

39,1%

0,575

2

0,06 0,40 0,71 0,86 1,05 1,51 1,96

2,90

Encad

0,613

0,921

31,6%

39,1%

0,577

0

0,06 0,40 0,71 0,86 1,05 1,37 1,96

2,90

SID1

0,546

0,825

28%

44%

0,661

0

0,06 0,33 0,69 0,82 1,05 1,29 1,83

2,17

SID2

0,967

1,422

60,9%

113,7%

-0,119

32

0,07 0,41 1,51 1,74 2,23 2,91 3,57

3,82

SID3

0,986

1,415

63,2%

115,2%

-0,161

33

0,07 0,43 1,56 1,90 2,34 3,08 3,63

3,82

Encad

0,600

0,947

32,7%

50,2%

0,555

0

0,06 0,39 0,65 0,75 1,03 1,60 2,34

2,84

3 Neurônios

0,640

0,927

32%

39%

0,572

-

0,04 0,39 0,93 1,03 1,24 1,62 2,09

2,57

5 Neurônios

0,568

0,872

24%

39%

0,622

-

0,02 0,33 0,73 0,91 1,12 1,39 2,22

2,58

7 Neurônios

0,561

0,886

27%

37%

0,611

-

0,04 0,31 0,71 0,83 0,98 1,42 2,33

2,66

SID1

0,576

0,911

31,8%

53,8%

0,595

0

0,04 0,35 0,63 0,85 0,98 1,48 1,88

2,94

SID2

0,659

0,992

38,6%

61,0%

0,524

3

0,07 0,40 0,93 1,10 1,28 1,57 1,95

2,59

SID3

0,683

1,007

39,9%

64,1%

0,507

6

0,05 0,45 0,84 1,07 1,38 1,60 2,14

2,84

Encad

0,660

0,974

37,1%

58,2%

0,543

0

0,05 0,45 0,83 1,05 1,22 1,50 2,02

2,84

SID1

0,605

0,908

27,1%

43,8%

0,601

0

0,06 0,38 0,77 1,00 1,17 1,43 1,77

2,89

SID2

1,057

1,489

72,6%

133,0%

-0,208

33

0,08 0,44 1,59 2,02 2,59 2,97 3,77

3,97

SID3

1,124

1,445

78,6%

134,5%

-0,263

35

0,10 0,63 1,65 2,06 2,60 3,10 3,77

3,97

Encad

0,750

1,080

44,8%

74,5%

0,434

0

0,09 0,47 1,08 1,25 1,43 1,65 2,63

3,02

3 Neurônios

0,636

0,928

27,1%

38,0%

0,585

-

0,04 0,40 0,90 1,06 1,23 1,56 1,97

2,24

5 Neurônios

0,663

0,971

33,4%

43,5%

0,546

-

0,03 0,43 0,86 0,99 1,43 1,73 2,19

2,48

7 Neurônios

0,673

0,996

33,2%

41,6%

0,520

-

0,05 0,45 0,85 1,14 1,36 1,63 2,07

2,64

I Simpósio de Recursos Hídricos do Sul-Sudeste

13

8

Previsão - Horizonte 1º dia 7

Observado 6

FIS2T1D RN7N1D

Nível

5 4 3 2 1 0 0

20

40

60

80

100

120

Amostras

Figura 11 – Resultados dos modelos de previsão para o 1° dia Os dois modelos tiveram, para alcance de 2 dias, diferenças menores de desempenho médio, porém com diferença de comportamento em função da magnitude dos níveis e dos erros correspondentes. Na tabela 5, observa-se que, tanto o erro médio quanto o coeficiente de eficiência, mais sensível a erros maiores, favorecem a rede neural. Os erros associados às freqüências de ocorrências, por sua vez, são menores com uso da rede neural, com exceção da freqüência de 75%. Para exemplificar, o valor que não foi superado pelos erros de previsão da rede neural, em 95% das ocorrências (1,51m), é menor do que o valor (1,71m) que não foi superado pelos erros de previsão, nas mesmas circunstâncias, pelo sistema difuso. Tabela 5 – Resultados comparativos da previsão para o 2° dia EmA(m)

EpA(m) EmR EpR

Ce

N_Falhas

10% 50% 75% 80% 85% 90% 95%

97,5%

FIS2S2D

0,482

0,753

23% 30% 0,705

0

0,06 0,29 0,51 0,70 0,84 1,13 1,71

1,96

RN5N2D

0,440

0,691

22% 41% 0,754

-

0,03 0,27 0,57 0,69 0,83 1,14 1,51

1,76

De fato, observa-se, na figura 12, que, enquanto a rede neural parece acompanhar melhor as observações, para níveis menores, os dois modelos apresentam dificuldades para acompanhamento dos picos das ocorrências. Embora haja ligeira vantagem aparente no acompanhamento dos picos, para os sistemas especialistas é difícil decidir, a partir da visualização gráfica, pelo melhor modelo para os níveis mais altos.

I Simpósio de Recursos Hídricos do Sul-Sudeste

14

8

Previsão - Horizonte 2° dia 7

Observado 6

FIS2S2D RN5N2D

Nível

5

4

3

2

1

0 0

20

40

60

80

100

120

Am ostras

Figura 12 – Resultados dos modelos SIDs e RNs da previsão para o 2° dia Para alcance de 3 dias, há uma degradação sensível dos resultados de ambos os modelos, sendo que o sistema difuso apresenta estatísticas mais favoráveis que a rede neural (tabela 6). Os erros associados às freqüências favorecem os sistemas especialistas difusos em todas as faixas do espectro das freqüências, acima de 50%. Por exemplo, os erros do sistema difuso não foram maiores do que 1,83m em 95% das ocorrências, enquanto que o valor não superado pelos erros da rede neural nestas circunstâncias chegou a 2,22m. Tabela 6 – Resultados comparativos da previsão para o 3° dia 10% 50% 75% 80% 85% 90% 95%

97,5%

FIS1T3D

EmA(m) 0,546

EpA(m) EmR EpR 0,825

28% 44% 0,661

Ce

N_Falhas 0

0,06 0,33 0,69 0,82 1,05 1,29 1,83

2,17

RN5N3D

0,568

0,872

24% 39% 0,622

-

0,02 0,33 0,73 0,91 1,12 1,39 2,22

2,58

As diferenças de qualidade entre os modelos, porém, não são aparentes de forma gráfica, conforme a figura 13, embora se perceba dificuldade do sistema especialista de acompanhar as ocorrências de níveis baixos. 8

Previsão - Horizonte 3° dia 7

Observado 6

FIS1T3D RN5N3D

Nível

5

4

3

2

1

0 0

20

40

60

80

100

120

Am ostras

Figura 13 – Resultados dos modelos SIDs e RNs da previsão para o 3° dia I Simpósio de Recursos Hídricos do Sul-Sudeste

15

Para previsões de níveis com 4 dias de antecedência, o sistema especialista difuso apresentou desempenho superior em todas as faixas de níveis, conforme as estatísticas analisadas (tabela 7). Assim, tanto o erro médio quanto o coeficiente de eficiência lhe foram favoráveis. Da mesma forma, os valores não-superados pelos erros, em todas porcentagens de ocorrências verificadas, foram menores para estes modelos do que para as redes neurais. Tabela 7 – Resultados comparativos da previsão para o 4° dia 10% 50% 75% 80% 85% 90% 95%

97,5%

FIS1T4D

EmA(m) 0,605

EpA(m) EmR EpR 0,908

27% 44% 0,601

Ce

N_Falhas 0

0,06 0,38 0,77 1,00 1,17 1,43 1,77

2,89

RN3N4D

0,636

0,928

27% 38% 0,585

-

0,04 0,40 0,90 1,06 1,23 1,56 1,97

2,24

Observa-se, porém, na figura 14, que os sistemas especialistas difusos apresentam dificuldades para previsão de níveis muito baixos, bem como de picos, enquanto que, aparentemente, apresentam comportamento qualitativo equivalente a outros aspectos às redes neurais. 8

Previsão - Horizonte 4° dia 7

Observado 6

FIS1T4D RN3N4D

Nível

5

4

3

2

1

0 0

20

40

60

80

100

120

Am ostras

Figura 14 – Resultados dos modelos SIDs e RNs de previsão para o 4° dia

Análise dos resultados por magnitude do nível a ser previsto Esta análise mostra o comportamento da resposta dos modelos em função do nível a ser previsto. Procura-se saber se a resposta tem mudança significativa. A disposição gráfica ordenada pela magnitude do nível permite a identificação de previsões super e subestimadas nas diferentes faixas de níveis. A previsão para o horizonte de 1 dia com RNs mostrou-se bastante confiável, sem apresentar fortes disparidades com os dados observados. O modelo por SIDs obteve pior desempenho para este horizonte, apresentando duas ocorrências de subestimação marcantes quando o nível a ser previsto estava na faixa entre 4,50 e 5,50m, conforme figura 15. Observa-se também que este modelo superestima os níveis mais baixos. I Simpósio de Recursos Hídricos do Sul-Sudeste

16

8

Previsão - Horizonte 1º dia 7

Observado FIS2T1D

6

RN7N1D

Nível

5

4

3

2

1

0 0

20

40

60

80

100

120

Am ostras

Figura 15 – Resultados ordenados dos modelos SIDs e RNs de previsão para o 1° dia Nos horizontes de previsão de 2, 3 e 4 dias o comportamento dos dois modelos foi semelhante (figuras 16, 17 e 18). 8

Previsão - Horizonte 2° dia 7

Observado FIS2S2D

6

RN5N2D

Nível

5

4

3

2

1

0 0

20

40

60

80

100

120

Am ostras

Figura 16 – Resultados ordenados dos modelos SIDs e RNs de previsão para o 2° dia 8

Previsão - Horizonte 3° dia 7

Observado FIS1T3D

6

RN5N3D

Nível

5

4

3

2

1

0 0

20

40

60

80

100

120

Am ostras

Figura 17 – Resultados ordenados dos modelos SIDs e RNs de previsão para o 3° dia I Simpósio de Recursos Hídricos do Sul-Sudeste

17

8

Previsão - Horizonte 4° dia

Observado FIS1T4D

7

RN3N4D 6

Nível

5

4

3

2

1

0 0

20

40

60

80

100

120

Am ostras

Figura 18 – Resultados ordenados dos modelos SIDs e RNs de previsão para o 4° dia Os modelos apresentaram bom desempenho somente quando o nível a ser previsto estava na faixa entre 1,50 e 2,50m. Acima desta faixa e até aproximadamente 4m, os resultados apresentaram forte variabilidade sem tendências de superestimação nem de subestimação. Para valores a serem previstos acima de 4m, a variabilidade permaneceu elevada, com a agravante de uma tendência de subestimação. Na faixa de níveis a serem previstos inferior a 1,50m, os SIDs tiveram respostas superestimadas sem “alertas falsos”, enquanto que as RNs mostraram um comportamento nesta faixa com uma tendência menor, em termos médios, de superestimação, porém com fortes picos neste sentido, o que pode corresponder, em situações práticas, a “alertas falsos” de cheias.

I Simpósio de Recursos Hídricos do Sul-Sudeste

18

CONCLUSÕES A proposta de prever o nível d’água em uma bacia de resposta rápida, como a do rio Quaraí, a partir da previsão hidrometeorológica é um grande desafio, pois o modelo a ser empregado deve apresentar características que possibilitem trabalhar as incertezas envolvidas e tenha capacidade de generalização. Os modelos empregados neste trabalho (RNs e SIDs) apresentam estas características, apesar de seus processamentos internos trabalharem de forma distinta. A análise comparativa dos dois modelos demonstrou que as RNs respondem com maior eficiência quando as incertezas são menores, ou seja, quando as previsões de precipitação são mais precisas, o que ocorre para os horizontes de 1 e 2 dias. Sua configuração para estes horizontes foi constituída por 5 e 7 neurônios na camada intermediária. Estas foram as duas configurações mais complexas selecionadas para este estudo, sendo estas as alternativas de maior capacidade de ajuste entre as experimentadas. Os SIDs, por sua vez, apresentaram resultados melhores quando as incertezas eram maiores, presentes nos dados de entrada para horizontes de 3 e 4 dias. Nestes casos, os resultados foram melhores com os SIDs, especialmente os modelos mais simples. Uma vez que os melhores resultados foram os dos modelos mais simples, o recurso de encadeamento de modelos, com o objetivo de suprir falta de conhecimento, não foi importante. Embora seja normal a superestimação para níveis baixos e a subestimação para níveis altos com uso de modelos empíricos, como ocorre com redes neurais, observou-se uma tendência marcante para os sistemas difusos, no caso dos níveis baixos, da ocorrência de um padrão diferente, mais estável do que ocorre com as redes neurais, o que sugere que os erros de níveis baixos destes sistemas podem ter origem sistemática. Pode ser possível, portanto, a correção, pelo menos parcial, com treinamento adaptativo dos conjuntos difusos extremos, uma possibilidade para estudos futuros.

AGRADECIMENTOS Este trabalho está associado ao Projeto OMM-IPH-DNH (“Quarai Basin Integrated Flood Management Research Pilot Project”). À DNH – Dirección Nacional de Hidrologia del Uruguay, pela disponibilização dos dados de nível utilizados. Ao CPTEC – Centro de Previsão do Tempo e Estudos Climáticos, pela disponibilização dos dados de previsão meteorológica.

I Simpósio de Recursos Hídricos do Sul-Sudeste

19

BIBLIOGRAFIA KOVACS, Z. L. (1996). Redes Neurais Artificiais: fundamentos e aplicações: um texto básico. 3ª Edição. São Paulo: Editora Livraria da Física, 2002. NEURAL NETWORK TOOLBOX – User’s Guide Version 5.3 (1999) (Manual de Usuário do MatLab) PEDROLLO, O. C. (2000). “Previsão em Tempo Atual de Cheias com uso de Sistema Especialista Difuso” . Porto Alegre: IPH/UFRGS, tese de doutorado. PEDROLLO, O. C. (2005). “Previsão de Níveis Fluviais com Redes Neurais: Aplicação para Rosário do Sul” - RS. In : ÁGUASUL – 1o Simpósio de Recursos Hídricos do sul e 1o Simpósio de Águas da AUGM, 2005, Santa Maria, RS, v. 1.

I Simpósio de Recursos Hídricos do Sul-Sudeste

20

Lihat lebih banyak...

Comentários

Copyright © 2017 DADOSPDF Inc.