Comportamento Perceptivo Visual: da Biologia à Robótica

May 31, 2017 | Autor: F. Reinaldo | Categoria: Computer Vision, Robot Vision, Artificial Intelligent
Share Embed


Descrição do Produto

Encontro de Ciência e tecnologia (I ECTEC), Lages- SC, Agosto/2002

Comportamento Perceptivo Visual: da Biologia à Robótica ELIANE POZZEBON, FRANCISCO ANTONIO FERNANDES REINALDO, MAURO ROISENBERG, JORGE MUNIZ BARRETO Laboratório de Conexionismo e Ciências Cognitivas – L3C Curso de Pós-Graduação em Ciência da Computação Universidade Federal de Santa Catarina (UFSC) Campus Universitário – Trindade - 88040-900 – Florianópolis – Brasil {eliane,rei,mauro,barreto}@inf.ufsc.br

Resumo Inspirando-se na Natureza, este artigo apresenta uma visão de percepção robótica ativa e passiva. Esta visão está relacionada a conjecturas de conhecimento de objetos dentro do mundo dos agentes. Também é tratado a incontável tentativa de fazer um robô andar sobre uma certa atmosfera hostil, reconhecendo objetos e usado sensores. Palabras claves: Inteligência artificial, Robótica, Visão, Percepção, Visão computacional. Abstract Inspiration in nature, this article presents an approach to vision and active and passive perception in robotics and its relationship with the real world. It makes conjectures on the knowledge objects inside of a agents world to explain, the countless attempts of doing a robot walk about the physical and to recognize objects in a certain hostile atmosphere, using sensors. Keywords: Artificial intelligence, Robotics, Vision, Perception, Computational vision.

1 Introdução O “Robotic Institute of America (R.I.A)” define robô como sendo um manipulador programável multi-funcional capaz de mover materiais, partes, ferramentas ou dispositivos especializados através de movimentos variáveis programados para realizar uma variedade de tarefas (ROISENBERG, 1998)(MARTINS 1993). Seguindo a divisão preconizada pelo projeto MUCON (“Multisensory Control of Movement”) (BARRETO, 2001), pode-se dividir as ações inteligentes de um robô como ação, orientação e locomoção. a) Ação Para agir num determinado ambiente, um robô primeiramente deve planejar suas ações. Planejado estas açoes e estabelecido o objetivo, seu uníco compromisso é agir. Assim, se seu

Encontro de Ciência e tecnologia (I ECTEC), Lages- SC, Agosto/2002

objetivo é mudar um objeto de posição, ele terá inicialmente de pegar o objeto, locomover-se e saber onde colocá-lo, isto é se orientar. b) Orientação A orientação compreende reconhecer o ambiente e saber usar este conhecimento para se locomover de um ponto para o outro. Esta ação combinada a neurofisiologia comenta a integração multisensórea orientando movimentos. Através de posições serão classificados movimentos de braço em relação às atividades subjacentes e em outras estruturas envolvidas. c) Locomoção A locomoção de um robô implica que ele tenha conhecimento do ambiente que o cerca e que possa se orientar nele, assim, na navegação será citado estudos em estruturas de cérebro envolvidas no espaço de memória. Para um robô agir, orientar e locomover, é necessáro basear-se principalmente na percepção visual para atingir seus objetivos, podendo ser com contato ou sem contato. 2 Percepção Existem várias definições para a mesma, de acordo com (FERREIRA,1999) significa “ver ao longe; divisar, enxergar” e (ARKIN, 1998) diz que é “uma impressão obtida de um objeto pelo uso de sentidos: sense-datum“. Alguns autores defendem que o propósito da percepção é construir um modelo de mundo global, assim uma larga linha de pesquisas dentro da ciências biológicas tem apontado as características de percepção relacionadas ao comportamento. Para roboticistas a significante percepção pode ser fundada destes estudos, sendo tratada pela: neurociência, psicologia e etologia. Neurociência Em (WIENER, 1945)(AZUMA et al, 1994) é possível selecionarmos na neurociência duas canalizações visuais como: a visão objetiva onde é gerada pelo reconhecimento de objetos na separação frente-trás, que acontece na área temporal do córtex; a visão parcial na qual provê toda informação da posição para locomoção, região parietal, a qual podemos citar a Ecolocalização que é utilizada em morcegos. Psicologia Nesta, as percepções biológicas devem ser tratadas por uma representação mental, assim não sendo usada para codificar uma percepção, pois cada objeto pode-se tornar outro objeto dependo da situação e ambiente ao qual ele se encontra. Etologia Possibilita à inteligência artificial uma grande contribuição ao seu desenvolvimento. Em consequencia disso, (McFARLAND et al, 1994) tem estudado estados cognitivos de animais baseados em observações passivas de seus próprios comportamentos em condições ambientalmente livres, para reunir um conjunto de ações a garantir uma ação intencional. Assim podemos definir que um complexo animal é comumente uma mistura de controle comportamental autônomo e autômato (ARKIN, 998), onde seu comportamento é determinado por uma valorização de procedimentos Cibernéticos.

Encontro de Ciência e tecnologia (I ECTEC), Lages- SC, Agosto/2002

2.1 Características e suas Classificações É possível acoplar características da percepção biológica na robótica(HARALICK et al, 1993), classificando-a em Propriocepção, onde esta é associada com estímulos aparecendo de dentro do agente(WIENER, 1945)(WANG et al, 1990). Neste exemplo de propriocepção a repetição de ações de movimentação de um braço ou perna geraria um comportamento de trajetória navegacional. Esta consequencia de ações resulta numa somatória de posições, tornando então uma informação Ideotética. A informação ideotética será utilizada por exemplo no retorno para casa da aranha do deserto, como afirma (BITTENCOURT, 1998), onde caso ela se utilizasse de dicas externas ao seu caminho seria Alotética. Tem-se também a Exteriocepção, sendo associada com estímulos externos onde o ambiente transmite informação para o agente via visão, audição ou outro, acarretando como resultado para onde o robô pode se mover. 2.2 Tipos de Percepção Surgindo da necessidade de um projeto de múltiplos motores comportamentalmente paralelos para prover todo o controle num sistema baseado em comportamento robótico(WIENER, 1945), a percepção antigamente referida como generalizada era conduzida sem observar para a intenção do agente ou avaliar o repertório comportamental. O que já não acontece com a nova percepção Modular, pois esta extrai informações importantes de cada comportamento ativo associado a um esquema num evento visual particular, onde os eventos de percepção com o mundo é baseado na ação de motores comportamentais(WIENER, 1945): obstáculo ou não, anda ou não, reconhece ou não, movimenta objetos ou fica parado, que focado em diferentes atividades perceptíveis baseado em uma ação-orientada produz só a informação necessária para um conhecimento particular da tarefa, assim o robô pode ser provido de expectativas de observação do que poderia encontrar como uma conseqüência de percepção natural (DONALD et al, 1994) . 2.3 Problemas A percepção na robótica é uma área de pesquisa que envolve uma dispendiosa dedicação. Processos de estudo (em alguns casos eqüivocados) utilizam-se da imagem visualizada em uma terceira dimensão - posição de um objetivo determinado diretamente por uma triangulação(HOFF,1995) e posição(CHAPMAN, 1990) (BARRETO, 1992). Assim Arkin, trata este problema seguido por uma solução que pode ser moldada através de um detector de movimento de objetos, análise de superfície e um observador de objetos inanimados interligados por uma rede neural no artefato sensóreo. Estas formas de se tratar a percepção, como processo junto com a ação, habilita nos atuadores a resposta gerada pelos sensores para se fazer o posicionamento do artefato móvel (WIENER, 1945)(BROWN et al, 1994) . Migrando da biologia para a percepção na robótica, é encontrado alguns problemas tradicionais como os processos de estudo que pertencem à elite, numa necessidade(equivocada em alguns casos) da montagem da mesma imagem visualizada em uma terceira dimensão,- velho paradigma seguido por uma solução que pode ser tradada por um detector de movimento de objetos, a qual uma das formas de se tratar a percepção na sua forma de processo é junto com a ação onde através de atuadores o processamento dos sensores(WIENER, 1945)(BROWN et al, 1994) para posicionamento faz-se necessário.

Encontro de Ciência e tecnologia (I ECTEC), Lages- SC, Agosto/2002

3 Visão Utilizando-se da biologia para inspirar sensores de visão num ambiente expectativo, o que olhar? Continuidade temporal e consistência hipotética podem ser um sistema para restringir as possíveis localizações de um objeto de um ponto no tempo para outro, assim passamos por duas fases, sendo a primeira chamada Reconhecimento, onde é baseada na antecipação de como possa vir a olhar o objeto em questão. Esta característica pode ser restaurada da memória ou pode ser ligada fisicamente em um comportamento de reconhecimento de um objeto específico; contudo o Rastreamento é o segundo passo depois do reconhecimento alcançado, pois esta fase é computacionalmente menos exigente que a descoberta porque as expectativas derivadas da percepção são mais imediatas e então mais confiáveis. O sistema visual é constituído pelos olhos, pelos nervos associados aos mesmos, ao colículo e ao córtex visual como mostrado na Figura 1. O colículo é uma estrutura cerebral que recebe neurônios sensitivos vindo da retina e do ouvido e integra estas informações. Possue seis camadas de neurônios, nos quais se observa grande numero de ligações na mesma camada. Estas ligações fazem supor que esteja materializando um tipo de camada de Kohonen complexa, envolvendo inibições e excitações. Como saída do colículo têm-se nervos constituídos de motoneurônios dos quais os mais notáveis são os que comandam os movimentos do globo ocular, feitos pelos seis músculos de cada olho. Além destes motoneurônios saem ainda os que comandam os músculos do pescoço e também se atribui ao colículo responsabilidade pelo equilíbrio do corpo. Continuando mais além do colículo, outros neurônios projetam a imagem da retina na parte ocipital do cérebro onde se situa o córtex visual.

Figura 1. Sistema visual dos olhos ao córtex. Extraído de (BARRETO, 2001)

Já a atenção enfocada firma-se na pergunta, para onde olhar? Através de percepção, saber onde guiar para apontar os sensores dentro da imagem(KIM et al, 1989) . Utilizando-se de uma base comportamental visual humana, foi destacado três pontos importantes onde: a) o primeiro se justifica na Metáfora do Refletor, onde (ARKIN, 1998) comenta que esta foca-se no centro do campo de visão, não desfazendo, mas ignorando as imagens ao redor do foco, como um refletor de luz faz num palco de teatro e que nós focalizamos a pessoa no foco, estamos desprezando temporariamente o que esta ao redor dela, pois o ambiente natural confronta o observador com um largo número de estímulos potenciais dentro do campo de visão;

Encontro de Ciência e tecnologia (I ECTEC), Lages- SC, Agosto/2002

b) o segundo ponto sendo com uma Troca Visual onde de uma região para outra não precisa movimentos dos olhos e assim pode ser feito uma varredura na imagem com um velocidade muito maior; c) o terceiro ponto como Troca da Atenção que provê a habilidade para cor e figura. Esta serialização tem vantagens computacionais como conseqüência da mais alta maneira de como a cena é explorada. Partindo-se daí para os métodos de hardware, a citação sensórea se faz necessária, todavia este artigo referencia à sensores ópticos, pois prometem ter a melhor combinação global de velocidade, precisão, e alcance (MEYER, 1992) (HARALICK et al, 1993) (KIM et al, 1989) , embora os métodos podem ser aplicados a outros sensores(BARRETO, 1992), pois ela deve imitar habilidades sensoriais às do homem. Sensores Ópticos É possível representar a exatidão de uma retina humana através de uma câmera - Optotrak Digital (RUSSELL et al, 1995), que deve ser de tempos em tempos calibrada (LAFTER et al, 1989) , a qual simula uma fóvea, pois a luz incidente, focalizada na fóvea, produz imagem nítida, onde múltiplas imagens são adquiridas usando uma lente de zoom, focalizando seqüencialmente em objetos presentes, ver figura 2; múltiplas câmeras usando diferentes campos e ângulos de visão para reconhecer um objeto como também sua superfície, através de uma fissura ou pela projeção de um número de faixas de luz nos objetos e medindo as lacunas refletidas pela luz, assim o ângulo das fraturas e as fraturas externas indicam o tamanho do objeto. Rotinas visuais para este sistema devem incluir um conhecimento heurístico reconhecedor de tipo e um reconhecedor de item; e um chip CCD que é projetado como uma retina artificial com uma densa região de fóvea com lentes especialmente projetadas para trabalhar com CCD.

Figura 2: Processamento de informações em uma câmera

Encontro de Ciência e tecnologia (I ECTEC), Lages- SC, Agosto/2002

COG – Exemplo de robô com visão Sendo um ambicioso projeto e desejado por todos que trabalham com sensores visuais, uma típica cabeça robótica, ver figura 3.

Figura 3: Cog(MIT) Imagem extraída de (WIENER, 1945).

Onde (HOFF,1995) comenta que é de suma importância saber posição a relativa e orientação entre objeto e a cabeça, pois influencia na ordem em exibir um objeto virtual(WANG et al, 1990) que é alinhado com o objeto real sendo um tanto difícil como assim explana(WIENER, 1945)(AZUMA et al, 1994) O Cog, um robô construído por Brooks e Stein,1994, no MIT que consiste escalabilidade em métodos comportamentais “subsumption-based”(WIENER, 1945), possuindo duas câmeras de vídeo, cada qual tem vários controladores de graus de liberdade, vários subsistemas de controles comportamentais, tipo: Sacada visual, uma rápida construção de tragetória balística em uma dada direção; freqüentemente usado para reposicionar uma câmera quando o objetivo move-se para fora do campo de visão, como uma busca pelo objeto; Busca fina: contínuo rastreamento de um objetivo em movimento(WANG et al, 1990)(LAFTER et al, 1989) ; Vergência que: mede a disparidade entre as duas câmeras focadas no objetivo e então movendo-se uma das câmeras para reduzir ou eliminá-las; Reflexo Vestíbulo-ocular: através de propriocepção alotética, usa um “open-loop control” usado para estabilizar as câmeras da cabeça relativas ao movimento do corpo, eliminando aparentes movimentos durante a translação ou rotação da base do robô; Compensação de plataforma: usado para prevenir o sistema de posicionamento da câmera de alcance de seus limites. 4 Conclusão Tendo como acontecimento, várias operações visuais elementares que podem ser compiladas em conjuntos de rotas visuais, que podem compartilhar operações comuns e que possam ser aplicadas em diferentes localizações regionais dentro da imagem do ambiente analisado, todavia por uma classificação extraímos a informação observando mudança na intensidade(texturas); sobre superfícies explícitas de cada ponto dentro da imagem (orientação); observando a forma do objeto dentro do mundo(volume). A teoria visual baseada no desenvolvimento de uma arquitetura de percepção chamado SIVS foi desenvolvida por Chapman (BROWN et al, 1994) . Ela visa modelar atenção a busca visual dentro da cena onde rastreia objetos que se movem e que tem habilidade de computar distâncias, ângulos e direções para objetos dentro do ambiente. Assim permite concluir se a região é limitada. Se os robôs são artefatos que em muitos aspectos imitam funções dos seres humanos(WANG et al, 1990), como as ações inteligentes: agir, orientar e locomover, biologicamente também podemos compara-los.

Encontro de Ciência e tecnologia (I ECTEC), Lages- SC, Agosto/2002

O trabalho discutiu aspectos em que a percepção visual de robôs se inspira na biologia. Com efeito, é possível traçar uma correspondência entre elementos do ser vivo e de rôbos. Tem-se por exemplo. Tabela 1 : Comparativo da biologia com robótica

Biologia

Robótica

Olhos Ouvido Nariz Toque Braços Pernas Músculos Nervos

Câmera com chip CCD Microfones, sonar Analisador de amostras atmosferica Sensor de pressão Manipulador e garra Esteira Motores Controlador motor

Na avaliação das regras de cognição em um comportamento inteligente (KIM et al, 1997) , nós podemos perguntar quais as vantagens que um animal ou um robô poderia ganhar de uma solução cognitiva a um problema, sendo estes um assunto que ficará proposto para futuras pesquisas. 5 Referências Bibliográficas ARKIN R. C. Behavior-based robotics: intelligent robots and autonomous agents Cambridge: Massachusetts Institute of Technology, 1998. AZUMA R. BISHOP G. Improving static and dynamic registration in an optical seethrough HMD, Proc. of 21st International SIGGRAPH Conference, ACM; New York NY USA, Orlando, FL, USA, 197-204, July, 1994 BARRETO J. M., Inteligência artificial no limiar do século XXI ,Florianópolis: PPP, ed.3, 2001. BARRETO J. M., MUCON II Project: multisensory control of movement, European Economic Community, ESPRIT: Basic research, UCL, Louvain-la-Nueve, Belgium, 1992. BITTENCOURT G., Inteligência artificial: ferramentas e teorias, Florianópolis, ed.UFSC, 1998. BROWN C. M., TERZOPOULOS D., Real-time computer vision. (Cambridge: Newton Institute, 1994). CHAPMAN D., Intermediate vision: architecture, implementation and use. Technical Report TR-90-06, Teleos Research, Palo Alto, CA, October, 1990 DONALD B., JENNINGS J., Sensor interpretation and task-directed planning using perceptual equivalence classes. Proc. of the International Conference on Robotics and Automation. Anaheim, CA,1997. FERREIRA A. B. H., Novo dicionário Aurélio: século XXI, Nova Fronteira. Versão eletrônica 3.0 Lexikon Informática, 1999. HARALICK R., SHAPIRO L., Computer and robot vision ,Addison-Wesley: 1993.

Encontro de Ciência e tecnologia (I ECTEC), Lages- SC, Agosto/2002

HOFF W. A., Fusion of data from head-mounted and fixed sensors. Center for Robotics and Intelligent Systems Engineering Division, Colorado School of Mines Golden, CO 80401,1995 KIM D., NEVATIA R., A method for recognition and localization of generic objects for indoor navigation. Final Technical Report, 1989. KIM D., RICHARDS S. W., CAUDELL T. P., An optical tracker for augmented reality and wearable computers. Proc. of IEEE 1997 Annual International Symposium on Virtual Reality, IEEE Comput. Soc. Press; Los Alamitos CA USA, Albuquerque, NM, USA, 1-5 March, 1997 LAFTER B.; CHMIELEWKI T., NEGIN M., Robotic engineering: an integrated approach. Pretince-Hall, Englewood Cliffs, New Jersey, 1989. MARTINS A., Robótica. (São Paulo:Brasiliense, 1993). McFARLAND D., BÖSSER T., Intelligent behavior in animals and robots. Cambridge: Massachusetts Institute of Technology, 1994. MEYER K., A survey of position trackers, Presence, vol. 1, n. 2, 1992. ROISENBERG M., Emergência da inteligência em agentes autônomos através de modelos inspirados na natureza. Tese de Doutorado. Departamento de Engenharia Elétrica, Grupo de Pesquisas em Engenharia Biomédica, UFSC, agosto, 1998. RUSSELL S., NOVIG P., Artificial intelligence: a modern approach. New Jersey: Prentice Hall, 1995. WANG J. F., AZUMA R., BISHOP G., CHI V., EYLES J., FUCHS H., Tracking a headmounted display in a room-sized environment with head-mounted cameras. Proc. of Helmet-Mounted Displays II, Vol. 1290, SPIE, Orlando, FL, April 19-20, 1990,47-57. WIENER N., Cybernetics, MIT Press, Massachusetts 1945.

Lihat lebih banyak...

Comentários

Copyright © 2017 DADOSPDF Inc.