Tutorial de análises de estatística circular aplicadas à ecologia - segunda versão

October 16, 2017 | Autor: Julia Sfair | Categoria: Plant Ecology, Animal Behavior, Phenology, Plant Physiology
Share Embed


Descrição do Produto

Estatística Circular Principais análises utilizando o R Versão 2.0

Elaborado por: Julia Caram Sfair ([email protected]) (que gosta de receber críticas e sugestões)

Sumário Introdução.............................................................................................................................. 2 1.Preparando os dados no Excel............................................................................................. 4 2. Importando os dados no R.................................................................................................. 5 3. Abrindo o pacote “circular”................................................................................................ 6 4. Manipulando e visualizando os dados.................................................................................7 5. Estatística descritiva......................................................................................................... 10 6. Distribuição dos dados..................................................................................................... 13 7. Comparando amostras..................................................................................................... 17 8. Relações entre variáveis................................................................................................... 19 9. Gráficos............................................................................................................................ 21 10. Epílogo............................................................................................................................ 26

1

Introdução Esse pequeno tutorial tem por objetivo ajudar nas análises mais comuns em estatística circular. A estatística circular vem sendo bastante utilizada em estudos com dados fenológicos, mas também pode ser utilizada para dados direcionais no espaço. O principal software de análises circulares é o Oriana (http://www.kovcomp.co.uk/oriana/ ). Entretanto, o programa possui o código fechado e não é gratuito. Além do Oriana, a versão 5 do Biostat (http://www.mamiraua.org.br/download/) também trabalha com algumas análises circulares. Esse software possui duas vantagens: é gratuito e totalmente em português. Entretanto, ele costuma ter alguns bugs e não possui capítulo para estatística circular em seu arquivo de ajuda. Há ainda um pacote para Matlab para estatística circular (http://www.mathworks.com/matlabcentral/fileexchange/10676) e um programa chamado Axis (http://www.pisces-conservation.com/index.html? softaxis.html$softwaremenu.html ). Vale lembrar que tanto o pacote para Matlab quanto o Axis são pagos. Devido a essas limitações de programas estatísticos com interface amigável, este tutorial apresenta os principais testes estatísticos circulares para ambiente de programação R (http://cran.r-project.org/). Esse ambiente tem sido cada vez mais utilizado para análises estatísticas, pois (1) é totalmente gratuito, (2) o código é aberto e constantemente corrigido, (3) permite que o usuário escreva as suas próprias funções, dando maior liberdade em relação a softwares de interface amigável. Esse ambiente possui inúmeros pacotes com funções estatísticas específicas. Neste tutorial usaremos os pacotes “circular”, específico para estatística circular e o pacote “plotrix”, para a elaboração de gráficos circulares. Utilizamos também como base alguns testes descritos em Zar (2012). Vale lembrar que existem ainda os pacotes “CircStats” e “CircNNTSR”, que não serão usados nesse tutorial. O primeiro, por ser muito parecido com o “circular” e o segundo por apresentar funções desconhecidas por mim. Essa é a segunda versão desse tutorial. Em relação à primeira versão, é apresentado: 1. a confecção de gráficos circulares mais elegantes; 2. implementação de novas funções, algumas não disponíveis no pacote “circular. Agradeço de coração as críticas e sugestões que recebi na primeira versão do tutorial. Peço novamente que as pessoas que o utilizem me deem algum retorno com críticas e sugestões por meio do e-mail [email protected] . 2

Recomendo que esse tutorial seja utilizado conjuntamente com os seguintes livros: DAVIS, J.C. 1986. Statistics and Data Analysis in Geology, 2nd edn. John Wiley & Sons, New York. JAMMALAMADAKA, S. R., SENGUPTA, 2001. A. Topics in circular statistics. Word Scientific Publishing Co. MORELLATO, L. P. C.; ALBERTI, L. F.; HUDSON, I. Applications of circular statistics in plant phenology: a case studies approach.. In: Phenological Research: Mathematical and Statistical Methods, Design and Applications. KEATLEY M.; HUDSON I. (Org.). Germany: Springer, 2009 PEWSEY, A, NEUHÄUSER, M., RUXTON, G. D. 2013. Circular Statistics in R. Oxford University Press. ZAR, J. H. 2012. Biostatistical analysis. Upper Saddle River : Prentice Hall, Princeton Há vários livros e tutoriais sobre como usar o R que complementam o tutorial. Como citar esse manual: Recomendo que cite o pacote do R. Para isso dê o comando citation(”nome do pacote”), como: citation("circular")

Atenção: as funções que construí não foram devidamente testadas (e.g., com diferentes conjuntos de dados). Por isso use-as com cuidado e, se o resultado for muito diferente do que os gráficos e as análises descritivas indicam, não use essas funções e me comunique por e-mail o problema.

3

1.

Preparando os dados no Excel

Assim como o Oriana e o Biostat, o pacote que trabalha com estatística circular no R usa diretamente com as frequências de ângulos. Você pode ter seus dados de diferentes formas no Excel. Assim: frequencia floracao borda 0 30 180 210 210 240 240 240 240 270 270 270 270 300 300 330

frequencia floracao interior 120 150 180 180 210 210 210 240 240 240 240 270 270 270 270 300 300 300 330

4

Ou assim: mes janeiro fevereiro marco abril maio junho julho agosto setembro outubro novembro dezembro

angulo 0 30 60 90 120 150 180 210 240 270 300 330

frequencia floracao borda 1 1 0 0 0 0 1 2 4 4 2 1

frequencia floracao interior 0 0 0 0 1 1 2 3 4 4 3 1

No primeiro caso, a montagem da planilha é mais trabalhosa tendo em vista a forma como a maioria das planilhas de campo é organizada. A segunda planilha é mais fácil de montar e pode ser facilmente manipulada no R. Vamos considerar a segunda planilha nesse tutorial. Nesse caso, frequência é referente ao número de plantas expressando determinada fenofase.

2. Importando os dados no R O R é capaz de abrir diferentes tipos de arquivos. Darei o exemplo para um arquivo salvo como .csv . Para abrir esse arquivo, use o seguinte comando no R: dados
Lihat lebih banyak...

Comentários

Copyright © 2017 DADOSPDF Inc.