Desenvolvimento de um classificador de padrões para determinar susceptibilidade ao fungo H em folhas de café baseado em inteligência artificial

June 7, 2017 | Autor: Juan Pablo Ochoa | Categoria: Digital Image Processing, Inteligencia artificial, Redes Neuronales Artificiales, Lógica Fuzzy
Share Embed


Descrição do Produto

Desenvolvimento de um classificador de padrões para determinar susceptibilidade ao fungo H em folhas de café baseado em inteligência artificial OCHOA, J. P.

BONATO, L.

UFSJ – Universidade Federal de São João del Rei - Departamento de Engenharia Elétrica – DEPEL PPGEL – Programa de Pós-Graduação em Engenharia Elétrica - São João del Rei/MG, Brasil [email protected], [email protected]

Resumo – A pesquisa desenvolvida neste estudo detalha uma ferramenta computacional para obter uma classificação das plantas do café, considerando a resistência ou susceptibilidade da mesma ao fungo H (HEMILEIA VASTATRIX), que produz uma doença foliar, causando, inicialmente, manchas translúcidas cloróticas na face inferior do limbo, com 1 a 3 mm de diâmetro. Em pouco tempo, alcançam 1 a 2 cm de diâmetro, e desenvolve massas pulverulentas de coloração amarelo-laranja, envolvidas por uma auréola mais ou menos descolorida. Com o tempo, o centro da lesão fica necrótico, tornando-se visível na face superior da folha. A doença avança por grande extensão do limbo foliar. O fungo pode atacar a extremidade dos ramos em desenvolvimento e frutos verdes. Através das ferramentas de inteligência computacional, desenvolveu-se uma rede neural que analisa imagens de folhas de café e a partir de um processamento digital da imagem, obtém-se uma classificação baseada na escala de Tamayo [1], para o cafeeiro. Palavras-Chave –Fungo H, rede neural, inoculação, classificação de padrões, processamento digital de imagens.

I.

INTRODUÇÃO

O café ocupa o segundo lugar na lista de produtos naturais mais importantes no mercado internacional, logo depois do petróleo, e representa uma importante fonte de receitas para a economia dos países produtores. O cultivo, processamento, transporte e comercialização do café são responsáveis por milhões de postos de trabalho em todo o mundo. Desta forma, a produção de café ajuda ao crescimento da economia de países em desenvolvimento e pode servir para lançar a economia de outras regiões. No séc. XX, verificou-se um aumento da produção e consumo do café, destacando-se como principal área de produção a América do Sul, em grande parte devido ao Brasil e à Colômbia, que são os principais produtores mundiais de café.

Uma das doenças mais importantes que afeta a principal espécie de cafeeiro cultivado (Coffea arábica L.) é a ferrugem alaranjada, provocada pelo fungo Hemileia vastatrix Berkeley & Broome. Na ausência de medidas de controle da doença, a ferrugem alaranjada pode ser responsável por grandes perdas de produção, podendo afetar plantações inteiras, limitando o crescimento e desenvolvimento dos cafeeiros. As quebras na produção de café podem atingir valores entre os 10-40% e os prejuízos na economia global são estimados entre 1 a 2 bilhões de dólares anualmente [2]. Com as premissas expostas, é muito importante implementar uma ferramenta baseada em inteligência computacional capaz de analisar imagens de folhas de café e determinar a susceptibilidade das mesmas à ação erosiva do fungo Hemileia vastatrix. II.

DESCRIÇÃO DOS PROCESOS ENVOLVIDOS

Processamento digital da Imagem: As imagens digitais das folhas de café contém 16 discos de 1,5 cm de diâmetro cada uma, dispostos em uma tela de nylon branca, tendo aproximadamente uma resolução de 1200 x 1080 pixels, figura (1), requerendo um elevado custo computacional para obter os dados necessários para a identificação do padrão.

Fig.1 Formato da Imagem Coletada 1200 x 1080 pixels

O primeiro passo é atenuar a resolução da imagem, sendo reduzido em até 11.000 pixels (100 x 110). É sabido que o formato padrão das imagens digitalizadas é RGB, sendo representado por uma matriz tridimensional (100x110x3), formada pelas componentes vermelha, verde e azul, respectivamente. Optou-se pela transformação da base da cor para o formato CIE L*a*b [3], já que nesta base a cor é somente representada pelos valores contido nas variáveis “a” e “b”, sendo que a variável “L” determina a luminosidade de cada pixel. Figura (2)

Obtenção do histograma da imagem: Este ponto do trabalho é a parte que envolve a inteligência computacional propriamente. A maneira mais simples de determinar a característica da imagem é obtendo seu histograma da cor, onde é possível quantificar a presença de cada uma das cores pré-estabelecidas, sabendo que, para o caso específico, tem importância as cores amarela, verde e marrom.

O histograma das imagens foi obtido através de lógica fuzzy, sendo desenvolvido na tolbox do MATLAB®. Para o propósito, foram declaradas três variáveis de entrada: LabL, Laba, Labb, para cada uma das magnitudes do CIE L*a*b, respectivamente. As funções de pertinência para cada uma das variáveis de entrada se detalha na figura 4.

Fig.2 Imagem na Base CIE L*a*b 100 x 110 pixels

Após a estandardização das imagens para o formato CIE L*a*b, é preciso a supressão do fundo das mesmas, etapa muito importante, pois assim consegue-se discriminar muita informação irrelevante, pois o background é igual para todas as imagens. O objetivo da eliminação do background foi conseguido através da segmentação da cor usando agrupamento pelo algoritmo K-means [4]. O objetivo do algoritmo é classificar um conjunto de dados em um certo número de agrupamentos (K), definido, a priori, através da análise de suas similaridades. O algoritmo utiliza um método estatístico não-supervisionado para a classificação, que trabalha geralmente com dados gerados de distribuições Gaussianas.

Fig.4a Funções de pertinência para a variável L

A representação obtida da etapa de processamento digital da imagem é apresentada na figura 3. É simples observar que contém só a informação necessária para a identificação da variável analisada, que são, exclusivamente, as folhas de café.

Fig.4b Funções de pertinência para a variável a

Existem diversas áreas que utilizam o classificador KMeans, como por exemplo, aplicações de aprendizagem nãosupervisionada, reconhecimento de padrões, análises classificatórias, inteligência artificial, processamento de imagens, visão computacional, entre outras. [5].

Fig.3 Imagem sem background 100 x 110 pixels

Fig.4c Funções de pertinência para a variável c

De modo similar, foram estabelecidas as funções de pertinência para a saída que foi nomeada histograma, considerando uma gama de 10 cores, como se observa na figura 5. Fig.7 Estrutura da Rede Neural

Sabendo-se que 60% das amostras foram para a etapa de treino, 20% para a etapa de teste e o restante para a etapa de avaliação, a resposta da rede, após o melhor desempenho conseguido, é armazenada em uma função nomeada net_cafe.mat. III.

Fig.5 Funções de pertinência para a saída

A função de inferência utilizada foi MAMANDI, e o método de defuzzificação que obteve um melhor desempenho foi o do centroide. Finalmente a etapa Fuzzy entregou uma matriz bidimensional que contém o histograma de cada imagem, graficamente observado na figura 6.

RESULTADOS

Uma interface gráfica para a avaliação dos resultados foi implementada no GUIDE de MATLAB ®, figura 8. O usuário tem que selecionar a imagem e esperar que o programa defina se a amostra é ou não susceptível ao fungo.

8000 7000 6000 5000 4000 3000 2000 1000 0

preto

cinza

vermelho marrom amarelo verde

azul

ciano

Fig.6 Histograma da cor da imagem da figura 3

O eixo horizontal representa as cores, sendo as estabelecidas nas funções de pertinência da saída.

O modelo FUZZY desenvolvido tem 70 regras declaradas para cada uma das combinações possíveis nas entradas, e que foram definidas pelos operadores lógicos and e not.

Rede Neural multicamada para o reconhecimento de padrões: Com os dados do histograma das imagens e suas respectivas saídas, foi treinada uma rede neural utilizando a tolbox de MATLAB ®. A configuração da rede multicamada para o reconhecimento de padrões é observada na figura 7, sendo que possui uma camada escondida com 10 neurônios e uma saída que determina a susceptibilidade ou a resistência ao fungo Hemileia vastatrix.

Fig.7 Estrutura da Rede Neural

A partir do desempenho da rede neural, formam obtidos os gráficos da confusão e performance, apresentados nas figuras 8a e 8b, respectivamente. Além disso, foram selecionadas 6 imagens aleatórias que não foram consideradas para o treino, conseguindo, assim, uma estimativa do rendimento da rede.

O resultado obtido para as imagens aleatoriamente selecionadas foi 100% satisfatório, conseguindo um alto desempenho da rede, sabendo-se que existe uma faixa de confusão que gera respostas erradas na saída, principalmente entre as imagens com nota 3 e nota 4.

0

30 48.4%

0 0.0%

100% 0.0%

1

0 0.0%

32 51.6%

100% 0.0%

100% 0.0%

100% 0.0%

100% 0.0%

0

Validation Confusion Matrix

Output Class

Output Class

Training Confusion Matrix 0

8 40.0%

3 15.0%

72.7% 27.3%

1

1 5.0%

8 40.0%

88.9% 11.1%

88.9% 11.1%

72.7% 27.3%

80.0% 20.0%

1

0

Target Class

All Confusion Matrix

0

3 15.0%

4 20.0%

42.9% 57.1%

1

9 45.0%

4 20.0%

30.8% 69.2%

25.0% 75.0%

50.0% 50.0%

35.0% 65.0%

0

Output Class

Output Class

Test Confusion Matrix

1

Target Class

0

41 40.2%

7 6.9%

85.4% 14.6%

1

10 9.8%

44 43.1%

81.5% 18.5%

80.4% 19.6%

86.3% 13.7%

83.3% 16.7%

1

0

Target Class

1

Target Class

Fig.8a Indicadores de confusão da rede

Best Validation Performance is 0.19617 at epoch 16

0

Mean Squared Error (mse)

10

-1

10

-2

10

-3

10

Train Validation Test Best 0

2

4

6

8

10

12

22 Epochs

14

16

Fig.8b Indicadores de desempenho da rede

18

20

22







IV.

CONCLUSÃO

O objetivo principal do método proposto é segmentar regiões com diferentes cores e identificar padrões nas folhas de café. Porém, apresenta uma média de acertos de 83.3%, o que não é considerado satisfatório para definir com exatidão regiões que apresentam alterações pelo fungo H. As limitações do método encontram-se no processo de aquisição das imagens e no processamento digital, pois perde-se a qualidade da imagem, o que complica o trabalho atingido pela etapa de Inteligência Computacional.

Foi criado um método de segmentação nãoparametrizado que considera apenas informações de cores dos pixels. O método utiliza o algoritmo de classificação K-Means, que utiliza em seu espaço de características os valores dos pixels das imagens, que são convertidas nos componentes do modelo da cor CIE LAB. Apenas o uso destes valores como características foi insuficiente para classificar as regiões das imagens, pois apresentou resultados com descontinuidades de pixels. As descontinuidades foram notadas principalmente em regiões com diferentes cores em pontos próximos. Estas descontinuidades são justificadas pela ausência de informações no espaço de características referentes às posições espaciais e relacionamentos de vizinhança dos pixels. Porém, são justificadas principalmente pelo fato de agrupar valores de frequências muito próximas, fazendo com que regiões com pigmentos diferentes tenham a mesma representação no histograma de cores. O método proposto apresenta resultados que não são suficientes para serem utilizados na prática. Porém, como o método proposto não requer parâmetros, os resultados obtidos indicam que o caminho seguido é promissor, possibilitando a continuidade das pesquisas para aperfeiçoamento do mesmo. V.

AGRADECIMENTOS

O autor agradece à CAPES (Coordenação de Aperfeiçoamento de Pessoal de Nível Superior) e à UFSJ pelo auxílio financeiro concedido na forma de bolsas de mestrado ao PPGEL. [1]

VI.

REFERÊNCIAS

Alexandre Sandri CAPUCHO. Método de inoculação de Hemileia vastarix Berk. Et. Br. Em

[2] [3] [4] [5] [6] [7]

folhas destacadas de cafeeiro. Universidade Federal de Viçosa/MG. Braz Opinião ANA ISABEL. Caracterização cariológica do fungo Hemileia Vastatrix responsável pela ferrugem alaranjada do cafeeiro. Universidade de Nova Lisboa. Lisboa/Pt.2012. http://www.gusgsm.com/espacio_color_cie_lab http://www.mathworks.com/help/images/example s/color-based-segmentation-using-k-meansclustering.html KRISTIAN CAPELINE. Análise de tintas de canetas utilizando segmentação por cor. Pontifícia Universidade Católica do Paraná. Curitiba 2005. Patrick Marchand. Graphics and GUIs with MATLAB. 1999 USA. Rafael C. Gonzalez. Richard E. Woods. Digital Image Processing. 2008 Pearson Education Inc. USA

Lihat lebih banyak...

Comentários

Copyright © 2017 DADOSPDF Inc.