Caracterização De Grupos Homogêneos De Propriedades Rurais Do Estado De Santa Catarina Utilizando Redes Neurais Artificiais

June 6, 2017 | Autor: Marcos Antonio | Categoria: Santa Catarina
Share Embed


Descrição do Produto

CONGRESSO E MOSTRA DE AGROINFORMÁTICA 18 a 20 de outubro de 2000 – Vila Velha Palace Hotel Ponta Grossa – Paraná

CARACTERIZAÇÃO DE GRUPOS HOMOGÊNEOS DE PROPRIEDADES RURAIS DO ESTADO DE SANTA CATARINA UTILIZANDO REDES NEURAIS ARTIFICIAIS Autores Marcos Antônio Antonello Scremin [email protected] UFSM-RS - Colégio Agrícola de Frederico Westhpalen Victor Konder, 54/101 - Florianópolis, SC - 88015-400 Telefone: (048) 224-6260

Rogério Cid Bastos [email protected] UFSC-SC - Departamento de Informática e Estatística Campus Universitário - Trindade - CEP 88040-900 Telefone: (048) 331-7747 Fax (048) 331-9030

Resumo Os agrupamentos de propriedades rurais são importantes para análise de suas características por agricultores, técnicos, pesquisadores e empresas ou órgãos governamentais responsáveis pela assistência técnica e extensão rural. A caracterização em grupos homogêneos pode auxiliar na definição de medidas que conduzam ao sucesso do empreendimento agrícola. Neste trabalho caracterizou-se grupos homogêneos de propriedades rurais do Estado de Santa Catarina, utilizandose variáveis contábeis, visando a extração de informações que possam contribuir para um melhor gerenciamento das propriedades rurais. No banco de dados da Empresa de Pesquisa Agropecuária e Extensão Rural de Santa Catarina (EPAGRI), utilizou-se a técnica de Análise de Componentes Principais para identificar as variáveis mais representativas da variabilidade dos dados. Posteriormente estabeleceu-se grupos homogêneos utilizando uma rede neural SOM(Self-Organizing Maps). Identificou-se as seis variáveis mais representativas e caracterizou-se quatro grupos homogêneos. Estes grupos podem, também, serem utilizados como Benchmarking.

Abstract The groupings of the farm are important for the analysis of their characteristics by farmers, technicians, researchers and enterprises or state offices in charge of the technical assistance and rural extension. The characterization into homogeneous groups can help on the definition of measurements which lead to the success of the agricultural undertaking. In this work, homogeneous groups of farm within Santa Catarina State, were characterized by the use of accountant variable, viewing to

Departamento de Informática

Universidade Estadual de Ponta Grossa http://www.infoagro2000.deinfo.uepg.br

Fundação ABC

CONGRESSO E MOSTRA DE AGROINFORMÁTICA 18 a 20 de outubro de 2000 – Vila Velha Palace Hotel Ponta Grossa – Paraná

extract information which can contribute to an improved management of farm. At the data bank of the Enterprise of Empresa de Pesquisa Agropecuária e Extensão Rural de Santa Catarina (EPAGRI), the technique of Principal Component Analysis was used to identify the most representative variables of the data. Afterwards homogeneous groups were established by the use of a neural network SOM (SelfOrganizing Maps). The six most representative variables were identified and four groups were organized. These groups may, as well, be used as Benchmarking.

Palavras Chaves Propriedades Rurais, Agrupamentos Homogêneos, Componentes Principais e Redes Neurais.

1. INTRODUÇÃO Os agrupamentos de propriedades rurais são importantes para análise de suas características por parte de agricultores, técnicos, pesquisadores e empresas ou órgãos governamentais responsáveis pela assistência técnica e extensão rural. Assim a caracterização em grupos homogêneos pode auxiliar na definição de medidas que conduzam ao sucesso do empreendimento agrícola. Este trabalho tem como objetivo caracterizar grupos homogêneos de propriedades rurais do Estado de Santa Catarina, considerando variáveis contábeis, visando a extração de informações que possam contribuir para um melhor gerenciamento das propriedades rurais. Utilizou-se o banco de dados da Empresa de Pesquisa Agropecuária e Extensão Rural de Santa Catarina (EPAGRI, 1998). Aplicou-se a técnica de Análise de Componentes Principais para identificar as variáveis mais representativas da variabilidade dos dados e reduzir sua dimensionalidade. Posteriormente estabeleceuse grupos homogêneos utilizando-se uma rede neural SOM(Self-Organizing Maps).

2. ANÁLISE DE COMPONENTES PRINCIPAIS - ACP A ACP é um método da Estatística Multivariada que tem como objetivos gerais a redução e a interpretação de dados (Johson & Wichern, 1998). As Componentes Principais(CP) constituem-se em um número reduzido de combinações lineares de um conjunto de variáveis que retém o máximo de informação(variabilidade) das variáveis originais.

Departamento de Informática

Universidade Estadual de Ponta Grossa http://www.infoagro2000.deinfo.uepg.br

Fundação ABC

CONGRESSO E MOSTRA DE AGROINFORMÁTICA 18 a 20 de outubro de 2000 – Vila Velha Palace Hotel Ponta Grossa – Paraná

Descreve-se o modelo matemático a partir de uma tabela cujas linhas (i = 1, 2, ..., n) representam os casos (ou indivíduos), as colunas (j = 1, 2, .... , m), as variáveis e xij representa o valor da variável j associada ao caso i. Partindo-se das n variáveis originais x1, x2, x3, ... , xn obtém-se as componentes principais y1, y2, y3, ... ym, fazendo-se as combinações lineares dos dados originais xi da seguinte forma: Var(yj) = máxima n

y j = ∑ e ,ji xi , com j = 1, 2, ... , n , tal que i =1

∑e

,2 ji

=1

COV(yj,yj') = 0, com j≠j' Os valores característicos(autovalores-λi) representam o grau com que a componente principal explica a variabilidade dos dados originais e são obtidos por R − λI = 0 , onde R é a matriz de correlação. Os vetores característicos(autovetores- ei, ) correspondem ao grau de contribuição de cada variável nas componentes principais e são obtidos pela relação

e'ij =

ryz

λi

. A seleção das componentes principais pode ser feita pelos autovalores

superiores a 1 (Kaiser apud Lieberman, 1980) que, geralmente, acumulam uma variância explicada de aproximadamente 70%.

3. REDES NEURAIS ARTIFICIAIS As Redes Neurais Artificiais são modelos computacionais inspirados no cérebro humano. Uma rede neural é um processo distribuído totalmente em paralelo e, tem uma propensão natural para armazenar conhecimento experimental e torná-lo disponível para uso. (Haykin, 1994). Vários problemas têm sido solucionados utilizando-se Redes Neurais, como reconhecimento de padrões, classificação, mapeamentos, agrupamentos, controle robótico, reconhecimento da fala e otimização (Fausett,1994). Cada tipo de problema exige uma arquitetura de rede diferente, sendo que para agrupamento de padrões semelhantes uma das redes utilizadas é a rede Neural Kohonen. A rede Neural Kohonen possui aprendizado não supervisionado e competitivo, ou seja há uma competição entre os neurônios na camada de saída. Vence o neurônio cujo vetor de pesos gerar menor distância com o vetor de entrada, assim cada padrão de entrada possui apenas um neurônio que será ativado. Esta rede, quando utiliza conexões laterais inibitórias entre os neurônios de saída é chamada de rede SOM(Self Organizing Map), tornando-se mais semelhante as estruturas neurobiológicas do que as de aprendizado supervisionado. Neste caso, o ajuste dos pesos também é feito para os neurônios vizinhos do neurônio vencedor, podendo a topologia da rede assumir

Departamento de Informática

Universidade Estadual de Ponta Grossa http://www.infoagro2000.deinfo.uepg.br

Fundação ABC

CONGRESSO E MOSTRA DE AGROINFORMÁTICA 18 a 20 de outubro de 2000 – Vila Velha Palace Hotel Ponta Grossa – Paraná

qualquer formato. O algoritmo básico de treinamento desta rede está disponível em Fausett (1994).

4. APLICAÇÃO A aplicação consiste em caracterizar grupos homogêneos, do Estado de Santa Catarina, utilizando análise de componentes principais e redes neurais artificiais.

4.1 - DEFINIÇÃO DAS VARIÁVEIS Utilizou-se o banco de dados da EPAGRI, composto de 380 propriedades distribuídas em 10 regiões (Florianópolis, Itajaí, Rio do Sul, Videira, Campos Novos, Concórdia, Lages, Canoinhas, São Miguel do Oeste e Sul) no período de junho/97 à julho/98. A unidade utilizada foi o dólar comercial de venda por Superfície Agrícola Útil (SAU). Escolheu-se aleatoriamente 27 variáveis do banco de dados, assim distribuídas: Custos Variáveis: Adubos/SAU, Agrotóxicos/SAU, Sementes/SAU , Sanidade Animal/SAU, Alimentos/SAU, Outros Insumos/SAU, Máquinas/SAU e Gerais/SAU. Custos Fixos: Máquinas/SAU, Construções/SAU, Terra/SAU, Pessoal/SAU e Gerais/SAU. Renda Bruta: Cereais/SAU, Olericultura/SAU e Animais/SAU. Intensidade: Unidade Animal/SAU (UA). Estrutura: Unidade de Trabalho Homem-familiar/SAU (UTH) e Unidade de Tração Mecânica/SAU (UT). Capital: Terra/SAU, Animais/SAU, Máquinas/SAU, Construções/SAU e Giro/SAU. Grau de Interação no Sistema: Cessões Internas/SAU, Autoconsumo/SAU e Variação de Estoques/SAU.

4.2 - APLICAÇÃO DA ANÁLISE DE COMPONENTES PRINCIPAIS Com a ACP obteve-se os autovalores e as variâncias das Componentes Principais, apresentados na Tabela 1, onde observa-se que as seis primeiras possuem autovalores superiores a unidade, explicando 72,5% da variabilidade dos dados originais.

Departamento de Informática

Universidade Estadual de Ponta Grossa http://www.infoagro2000.deinfo.uepg.br

Fundação ABC

CONGRESSO E MOSTRA DE AGROINFORMÁTICA 18 a 20 de outubro de 2000 – Vila Velha Palace Hotel Ponta Grossa – Paraná

Componente

Autovalor % Variância

Autovalor % Variância Acumulado Acumulada 1 8,70054 32,22422 8,70054 32,22422 2 4,18638 15,50513 12,88692 47,72935 3 2,59047 9,59432 15,47739 57,32367 4 1,83275 6,78797 17,31014 64,11164 5 1,17456 4,35024 18,48471 68,46188 6 1,08727 4,02693 19,57198 72,48881 7 0,98849 3,66108 20,56047 76,14990 8 0,88025 3,26018 21,44072 79,41008 9 0,83093 3,07751 22,27165 82,48759 10 0,73347 2,71657 23,00512 85,20416 11 0,70429 2,60848 23,70941 87,81264 12 0,60667 2,24694 24,31609 90,05958 Tabela 1 - Autovalores e Variância das Componentes Principais.

As seis primeiras Componentes Principais e as contribuições das variáveis na formação destas, apresentadas no Quadro 1, são suficientes para a análise dos dados ou formação dos agrupamentos, com uma perda de informação de 27,5%. No entanto, com o objetivo de reduzir a perda de informação, optou-se por utilizar as doze primeiras componentes principais que explicam 90,06% da variabilidade dos dados originais. Componente Variáveis

1 2 3 4 5 6 Capital Variação de Receita Bruta Custos Variáveis Capital de Cessões de Giro Estoques de Cereais Adubos Terra Internas Contribuição 32% 41% 47% 48% 50% 74% Quadro 1 - Contribuições das variáveis nas seis primeiras componentes principais.

4.3 - APLICAÇÃO DA REDE NEURAL Na aplicação da Rede Neural SOM utilizou-se 12 neurônios na camada de entrada, representados pelas doze primeiras componentes principais, interconectados com 4 neurônios na camada de saída, dispostos em um mapa quadrado e representados pelo número de agrupamentos. Para o treinamento da rede escolheu-se aleatoriamente 139 das 380 propriedades rurais, sendo a taxa inicial de aprendizagem de 0,8 e o raio de vizinhança igual a 1. Estipulou-se como condição de parada 8 000 épocas, obtendose a convergência da rede. A rede neural, após o treinamento, gerou uma matriz de pesos utilizada na formação dos agrupamentos. A Tabela 2 apresenta as quantidades e porcentagens de propriedades rurais de cada grupo formado. Grupo 1 Grupo 2 Grupo 3 Grupo 4 Quantidade 45 2 22 311 % 11,8 0,5 5,8 81,9 Tabela 2. Quantidade e percentual de Propriedades Rurais em cada grupo.

Departamento de Informática

Universidade Estadual de Ponta Grossa http://www.infoagro2000.deinfo.uepg.br

Fundação ABC

CONGRESSO E MOSTRA DE AGROINFORMÁTICA 18 a 20 de outubro de 2000 – Vila Velha Palace Hotel Ponta Grossa – Paraná

5. RESULTADOS E DISCUSSÃO Na Análise de Componentes Principais verificou-se que as seis primeiras componentes explicam 72,5% da variabilidade dos dados originais, mostrados na Tabela 1. Ainda, as variáveis que mais contribuíram na formação destas componentes, conforme o Quadro 1, foram o Capital de Giro/SAU com 32% na 1a CP , a Variação de Estoques/SAU com 41% na 2a CP, a Receita Bruta de Cereais/SAU com 47% na 3a CP, os Custos Variáveis-Adubos/SAU com 48% na 4a CP, o Capital Terra/SAU com 50% na 5a CP e as Cessões Internas/SAU com 74% na 6a CP. Estes resultados sugerem uma análise contábil mais aprofundada dessas variáveis por conterem uma maior representatividade dos dados. Com a aplicação da rede neural, conforme a Tabela 2, formou-se 4 grupos homogêneos de propriedade rurais, cada um com características diferenciadas. Na análise dos grupos utilizou-se um conjunto de variáveis que continham informações sobre o tipo de atividade agrícola, a área, o lucro, o resultado financeiro e os custos. A distribuição dos valores médios das variáveis em cada grupo constam na Tabela 3 e os percentuais das variáveis em cada grupo estão representados na Figura 1. Grupo 1 Custos Variáveis/SAU 352,37 B Custos Fixos/SAU 617,52 C Receita Bruta - Cereais/SAU. 1351,96 D Receita Bruta - Olericultura/SAU. 4,03 E Receita Bruta - Fruticultura/SAU. 27,76 F Receita Bruta - Silvicultura-Jardinagem/SAU. 3,60 G Receita Bruta - Animais/SAU. 102,07 H Capital Terra/SAU 1280,38 I Capital de Giro/SAU 257,53 J UTH Familiar/SAU. 1,50 K UTH Assalariada/SAU. 0,95 L UT Mecanica/SAU. 22,96 M Cessoes Internas/SAU. 3,26 N Variacao de Estoques/SAU 81,54 O Lucro/SAU. 550,60 P Resultado Financeiro 33972,02 Q Área Total 61,70 R Superfície Agrícola Útil 58,72 Tabela 3 - Valores médios das variáveis nos grupos. A

Departamento de Informática

Grupo 2 Grupo 3 Grupo 4 34381,89 1140,60 668,75 7821,83 1461,03 667,63 0,00 185,17 247,13 0,00 673,88 33,13 0,00 1236,45 61,83 0,00 1228,81 11,90 43578,52 163,54 793,79 1072,90 2186,93 1736,24 23034,36 1118,33 408,74 0,75 2,45 2,46 1,08 0,77 0,29 0,93 9,23 5,40 0,00 32,73 78,88 -4109,37 902,68 51,01 1374,80 1557,74 66,30 3299,52 25640,40 3219,53 2,40 16,46 48,56 1,75 12,08 33,28

Universidade Estadual de Ponta Grossa http://www.infoagro2000.deinfo.uepg.br

Fundação ABC

CONGRESSO E MOSTRA DE AGROINFORMÁTICA 18 a 20 de outubro de 2000 – Vila Velha Palace Hotel Ponta Grossa – Paraná

Porcentagens

G1

G2

G3

G4

100 75 50 25 0 A

B

C

D

E

F

G

H

I

J

K

L

M

N

O

P

Q

R

Variáveis

Figura 1. Percentual das variáveis em cada grupo.

Observou-se, conforme a Tabela 3 e a Figura 1, que o Grupo1 caracteriza-se por propriedades mecanizadas com cultivo de cereais, com menores custos/SAU, pouca diversificação de atividades, maior SAU, menores recursos de geração de produção e lucro/SAU baixo em relação aos grupos 2 e 3, mas com maior resultado financeiro. A atividade de criação de animais é a característica principal do Grupo 2, com maiores custos/SAU, maiores recursos de geração de produção, menor SAU e alto lucro/SAU, porém baixo resultado financeiro. As atividades de olericultura e fruticultura foram mais representativas no Grupo 3, com alta utilização de mão-de-obra familiar/SAU, maior capacidade de investimento/SAU e produção/SAU, maior lucro/SAU e alto resultado financeiro. O Grupo 4 caracterizou-se por propriedades com atividades altamente diversificadas, pouca mecanização, maior utilização de mão-de-obra familiar/SAU, menor lucro/SAU e menor resultado financeiro no período. Torna-se importante salientar que o tamanho da propriedade e o lucro/SAU, em alguns grupos não influíram diretamente no resultado financeiro.

6. CONSIDERAÇÕES FINAIS A caracterização de grupos homogêneos de propriedades rurais, traz uma melhor qualidade de informações facilitando o gerenciamento das mesmas. Este procedimento pode ser utilizado para descrever e caracterizar sistemas de produção para pesquisas e implantação de políticas agrícolas diferenciadas em cada grupo. Os resultados serão utilizados como parâmetros de referência de melhores práticas (Benchmarking), dando suporte a agricultores, técnicos, pesquisadores e empresas ou órgãos governamentais responsáveis pela assistência técnica e extensão rural. Sugere-se a inclusão de variáveis como o tipo de solo, a região e as variações climáticas para identificar sistemas de produção.

Departamento de Informática

Universidade Estadual de Ponta Grossa http://www.infoagro2000.deinfo.uepg.br

Fundação ABC

CONGRESSO E MOSTRA DE AGROINFORMÁTICA 18 a 20 de outubro de 2000 – Vila Velha Palace Hotel Ponta Grossa – Paraná

7. REFERÊNCIAS BIBLIOGRÁFICAS Linderman, Richard H.; Merenda, Peter F.; Gold, Ruth Z.(1980) Introduction to bivariate and multivariate analysis. Scott, Foresman and Company, Chicago. Fausett, L. V.(1994) Fundamentals of neural networks: architectures, algorithms, and applications. Prentice-Hall, New Jersey. Haykin, S. (1994) Neural networks: a comprehensive foundation. Canada, Macmillan. EPAGRI.(1998) Rede Contábil de Propriedades Rurais. Florianópolis. Johson, Richard A.; Wichern, Dean W.(1998) Applied Multivariate Statistical Analysis. 4th ed. Printice Hall, Upper Saddle River, New Jersey.

Departamento de Informática

Universidade Estadual de Ponta Grossa http://www.infoagro2000.deinfo.uepg.br

Fundação ABC

Lihat lebih banyak...

Comentários

Copyright © 2017 DADOSPDF Inc.