COMPORTAMENTO VERBALMENTE CONTROLADO E AUTOCONTROLE: UMA ANÁLISE DO EFEITO DE RESPOSTAS VERBAIS ACOMPANHADAS POR ESTÍMULOS COM FUNÇÃO AVERSIVA OU POSITIVA SOBRE O COMPORTAMENTO DE ESCOLHA.

July 21, 2017 | Autor: Luna Gimenez | Categoria: Radical Behaviorism, Análise Experimental Do Comportamento, Autocontrole

Share Embed

Denunciar este link

Descrição do Produto

VOJ
VEG
VEG
VOJ
VEG
V/V
L/A

Sem Regra
VEG
VOJ

FASE 3
FASE 1

P2
Bloco 1
Bloco 2

VOJ
V/V
L/A

Sem Regra
VEG
VOJ

FASE 3
FASE 1

P3
Bloco 1
Bloco 2

Bloco V/V
Bloco L/A

Sem Regra
VEG
VOJ

FASE 3
FASE 1

P1
8

Pressões à tecla enter em porcentagem

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO (PUC-SP)
SECRETARIA DE CIÊNCIAS HUMANAS E DA SAÚDE
DEPARTAMENTO DE PSICOLOGIA

COMPORTAMENTO VERBALMENTE CONTROLADO E AUTOCONTROLE: UMA ANÁLISE DO EFEITO DE RESPOSTAS VERBAIS ACOMPANHADAS POR ESTÍMULOS COM FUNÇÃO AVERSIVA OU POSITIVA SOBRE O COMPORTAMENTO DE ESCOLHA. SUB PROJETO 1

BOLSISTA: LUNA PEREIRA GIMENEZ
ORIENTADORA: PAOLA E. DE M. ALMEIDA

SÃO PAULO
AGOSTO – 2014

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO (PUC-SP)
SECRETARIA DE CIÊNCIAS HUMANAS E DA SAÚDE
DEPARTAMENTO DE PSICOLOGIA

COMPORTAMENTO VERBALMENTE CONTROLADO E AUTOCONTROLE: UMA ANÁLISE DO EFEITO DE RESPOSTAS VERBAIS ACOMPANHADAS POR ESTÍMULOS COM FUNÇÃO AVERSIVA OU POSITIVA SOBRE O COMPORTAMENTO DE ESCOLHA. SUB PROJETO 1

BOLSISTA: LUNA PEREIRA GIMENEZ
ORIENTADORA: PAOLA E. DE M. ALMEIDA

SÃO PAULO
AGOSTO – 2014

COMPORTAMENTO VERBALMENTE CONTROLADO E AUTOCONTROLE: UMA ANÁLISE DO EFEITO DE RESPOSTAS VERBAIS ACOMPANHADAS POR ESTÍMULOS COM FUNÇÃO AVERSIVA OU DISCRIMINATIVA SOBRE O COMPORTAMENTO DE ESCOLHA. SUB PROJETO 1

Relatório Final de Pesquisa
Programa Institucional de Bolsas Iniciação Científica
Vigência agosto/2013 a julho/2014
PIBIC/CEPE

SÃO PAULO
AGOSTO - 2014
Sumário
INTRODUÇÃO 5
MÉTODO 11
Fase 1- Instalação de um padrão de preferência por reforçadores menores e mais prováveis, em uma situação de escolha concorrente. 12
Fase 2 – Estabelecimento do valor aversivo e positivo para dois estímulos via condicionamento respondente. 14
Fase 3 – Apresentação de descrições verbais acompanhadas por estímulos com função aversiva ou positiva. 15
RESULTADOS E DISCUSSÃO 16
1) ESTABELECIMENTO DO PADRÃO DE PREFERÊNCIA ENTRE O REFORÇADOR MENOR E MAIS PROVÁVEL, E O REFORÇADOR MAIOR MENOS PROVÁVEL: 16
2) ESTABELECIMENTO DO VALOR AVERSIVO E POSITIVO PARA VEG E VOJ VIA CONDICIONAMENTO 22
3) EFEITOS PRODUZIDOS PELA APRESENTAÇÃO DAS DIFERENTES DESCRIÇÕES VERBAIS (VEG E VOJ) NA REVERSÃO OU NÃO DO PADRÃO DE PREFERÊNCIA: 27
CONCLUSÃO 39
REFERÊNCIAS BIBLIOGRÁFICAS: 44

RESUMO
O presente trabalho pretendeu avaliar o efeito de descrições verbais com função aversiva ou positiva sobre o comportamento de escolha de três participantes adultos em uma tarefa de computador. Para tanto, um delineamento de escolhas concorrentes foi planejado, sendo observado o padrão de preferência de cada participante entre as alternativas de reforçamento menor e mais provável ou maior e menos provável, durante uma atividade no computador. Estabelecida a preferência dos participantes, dois estímulos (pseudopalavras "VEG e VOJ") foram apresentados durante condições de perda ou ganhos de reforços, em uma tarefa em que os os participantes foram convidados a montar um quebra-cabeça, a partir de respostas de pressão às teclas do computador. Na presença do estímulo VEG, respostas a uma das teclas levava ao aparecimento das imagens do quebra-cabeça no centro da tela, e ao acréscimo de pontos em um contador localizado acima da imagem. Na presença do estímulo VOJ, respostas de pressão levava à perda de pontos e de peças. Cada condição de apresentação dos dois estímulos aconteceu por dez vezes, de forma randômica por 10 segundos cada. Após a quinta tentativa de apresentação, uma mensagem aparecia na tela, avisando ao participante que, caso quisessem, poderiam apertar a barra de espaços, para mudar de tela, encerrando a tentativa. Após isto as diferentes descrições verbais VEG e VOJ foram apresentadas antes de cada escolha, assim como na Fase 1, o que permitiu avaliar seu efeito sobre a reversão (ou não) do padrão de preferência antes estabelecido. Os resultados encontrados parecem indicar que o valor positivo ou aversivo do estímulo verbal não foi suficiente para que os participantes seguissem a instrução. Para os três participantes as pseudopalavras pareceram exercer controle sobre o responder nas primeiras tentativas de escolha da Fase 3 (que verificaria o controle dos estímulos verbais), mas nas próximas tentativas, ao longo das subfases, o responder deste dois participantes voltou a ficar sob controle das contingências e da maneira de responder anteriormente estabelecida na Fase 1. Assim, os resultados demonstram que os participantes parecem estar sobre controle da magnitude do reforçador (escolha pelo reforçador maior e menos provável), ou da probabilidade do ganho dos pontos (reforçador menor e mais provável), de acordo com os padrões de preferência estabelecidos anteriormente.
Palavras chave: autocontrole, descrições verbais.

INTRODUÇÃO
O presente trabalho pretendeu avaliar o efeito de descrições verbais com função aversiva ou positiva sobre o comportamento de escolha de três participantes adultos.
Durante o experimento foi avaliada a preferência dos participantes entre alternativas do reforço menor e mais provável e maior e menos provável, tendo sido planejados ajustes que favoreceriam a escolha menor e mais provável, tradicionalmente nomeada como uma escolha impulsiva.
O estudo aqui proposto foi elaborado inicialmente a partir do referencial teórico skinneriano acerca do autocontrole, brevemente retomado a seguir.
Para Skinner (1953), um homem se controla precisamente como controlaria o comportamento de qualquer outro através da manipulação de variáveis das quais o comportamento é função. Ou seja, seu comportamento é um objeto próprio de análise e as variáveis que o individuo utiliza na manipulação de seu comportamento nem sempre são acessíveis aos outros. Assim, o comportamento de autocontrole é aquele capaz de alterar a probabilidade de ocorrência de uma resposta com consequências conflitantes.
O motivo pelo qual um indivíduo vem a controlar parte de seu próprio comportamento é determinando pelas consequências conflitantes produzidas por uma resposta, ou seja, quando uma mesma resposta leva tanto a reforço positivo ou negativo, como pode levar a punição, definida pela retirada de reforçadores positivos ou apresentação de estímulos aversivos.
De acordo com Skinner (1974/2006), para que um determinado estímulo seja considerado aversivo, é necessário que sua remoção tenha características reforçadoras. Os estímulos aversivos eliciam no organismo várias reações fisiológicas que podem ser sentidas ou introspectivamente observadas, e que podem ser bastante perturbadoras e incluem predisposição para fugir. Nos casos em que uma resposta que vem sendo reforçada for seguida também pela apresentação de um aversivo, as emoções eliciadas pelo estímulo aversivo tornam incompatível a manutenção da resposta que produziria a consequência reforçadora, suprimindo-a temporariamente.
Assim, o primeiro efeito da punição consiste na eliciação de comportamentos incompatíveis com a resposta que está sendo punida, sendo este primeiro efeito imediato, ou seja, acaba por impedir a ocorrência da resposta naquele exato momento. O segundo efeito pode ser observado no futuro, mesmo que a resposta não esteja sendo punida diretamente naquele momento. Neste caso, ocorre de os estímulos aversivos condicionados na ocasião passada de punição estarem agora controlando a resposta. Isso porque, quando um comportamento é punido, qualquer estimulo que estivesse presente na ocasião da punição, torna-se um aversivo condicionado, dado o pareamento direto com a punição. Desta forma, a tendência ao comportamento punido ou outros estímulos do ambiente que também podem ter sido pareados com a punição no passado passam também a evocar aqueles estados incompatíveis com a resposta punida. Um terceiro efeito da punição consiste em que, qualquer comportamento que reduza o contato com os estímulos aversivos condicionados será reforçado. Assim, o terceiro efeito é o estabelecimento de condições aversivas que serão evitadas por comportamentos de "fazer alguma outra coisa" (Skinner, 1953).
Dessa forma, o conceito de punição é importante para a compreensão do autocontrole. Isso ocorre seja pela eliciação de respostas incompatíveis com a resposta anteriormente punida, seja pelo efeito enfraquecedor dos estímulos aversivos condicionados e das respostas emocionais, que provém de uma história punitiva anterior, ou porque os mesmos estímulos adquirem função de reforçadores negativos, por aumentarem a probabilidade de uma resposta de fuga, levando à redução da condição aversiva. Portanto, o comportamento de autocontrole ocorre para evitar as sensações desagradáveis que são eliciadas quando uma resposta cuja classe de respostas tem um histórico de punição quando emitidas.
Por exemplo, um sujeito que acorda tarde, porém sempre que isso acontece e chega atrasado ao trabalho é repreendido por seu chefe e tem o horário de descanso reduzido. Quando este sujeito acorda cedo e tem vontade de dormir mais, ele está diante de um conflito, pois o comportamento de dormir mais pode gerar reforçadores (positivos ou negativos), bem como gerar a apresentação de uma punição futura (positiva ou negativa). Desta forma, a punição estará relacionada com o comportamento de autocontrole no caso do sujeito fazer alguma outra coisa que não seja dormir, por exemplo, emitir uma regra para si próprio como: "Levante-se!". Ele seguiria esta regra, pois quando estiver diante da escolha com uma possibilidade de continuar dormindo, estímulos aversivos condicionados são eliciados, causando um desconforto incompatível com a ação de continuar dormindo. Assim, o fazer alguma outra coisa seria uma resposta de fuga aos estímulos aversivos condicionados.
Neste caso, a declaração de uma resposta verbal pode controlar a probabilidade de uma segunda resposta, se esta adquire uma função aversiva por pareamento com punição pelo comportamento de desobedecer à instrução. Porém, este pareamento precisa ser mantido para que seu valor aversivo não se perca, perdendo também a função de resposta controladora.
Tendo em vista a emissão desta resposta controladora de instrução verbal, o individuo emite um dos comportamentos que podemos chamar de autocontrole. As variáveis utilizadas pelo sujeito, tais como a apresentação da estimulação verbal nem sempre são acessíveis e visíveis para os outros. Outras variáveis podem também ser manipuladas com objetivo de aumentar a probabilidade da emissão das respostas que compitam com a resposta que se deseja controlar, como também para reduzir o valor reforçador das consequências destas respostas, diminuindo assim, sua probabilidade de emissão.
Sobre estas variáveis controladoras, o estudo de Mallot e Braam (1990) teve como objetivo, investigar se descrições verbais controlariam diferencialmente as respostas não verbais, a depender das contingências. Foram selecionadas cinco crianças que apresentavam alta porcentagem de colaboração com os pedidos da professora em completar tarefas de higiene. As regras apresentadas pelo experimentador solicitavam que a criança emitisse um determinado comportamento, como por exemplo, recolher os brinquedos. Foram apresentadas quatro condições, cada uma com um tipo diferente de regra apresentada. Foi avaliado o controle exercido pelas diferentes condições ("pedidos", "reforçamento", "sem apresentação de prazo + reforço atrasado" e "apresentação de prazo + reforço atrasado"), a partir da subordinação das crianças às solicitações apresentadas em cada uma dessas quatro condições.
A hipótese dos autores é de que a descrição dos prazos potencializaria os efeitos aversivos gerados pela apresentação da regra, favorecendo a emissão de comportamentos de acordo com a regra. Para os autores, os resultados mostram que o controle por regras que descrevam contingências diretas teria sido estabelecido antes do estudo, pela história de seguimento de regras de cada participante. Para os autores os dados do estudo parecem indicar que as respostas dos participantes estavam sob controle estrito das condições de reforçamento descritas, e não do controle generalizado das regras, estabelecido previamente. Porém, a declaração de prazos para finalizar a tarefa pareceu aumentar o controle das regras que anunciavam consequências atrasadas.
Foi possível tirar duas conclusões deste estudo. A descrição de reforços atrasados ou ausência de reforço parece ter enfraquecido o controle pela regra, e, a inclusão de prazos (resposta verbal) parece maximizar o controle da regra que descreve contingências indiretas envolvendo atraso de reforço. Isto ocorre porque a inclusão de prazos pode ser entendida como a manipulação de respostas autoclíticas de mando, alterando a reação do ouvinte diante das solicitações.
O estudo de Almeida e Hubner (2009) pretende contribuir com a discussão sobre as condições que afetam a probabilidade de controle verbal sobre o comportamento não verbal, investigando se a inclusão de operantes autoclíticos poderia favorecer este controle.
Para tanto, as autoras analisaram o efeito de operantes verbais autoclíticos sobre o comportamento de escolha, avaliando uma possível reversão do padrão de preferência dos participantes (receber reforço maior a longo prazo ou reforço menor a curto prazo), diante de/após apresentação de diferentes declarações verbais. As opções de escolha para os participantes eram concorrentes, sendo primeiro observado o padrão de escolha dos participantes e, então, introduzidas as descrições verbais específicas. Durante esta fase foi também avaliado se a emissão de autoclíticos alterava o controle pela descrição, que qualificava como "pior", por exemplo, a preferência do participante estabelecida no inicio do experimento. Os resultados apontam que neste estudo a presença de autocliticos acompanhando as descrições verbais não foram suficientes para a reversão do padrão de preferência dos participantes. No entanto, foi observado o aumento no tempo para emissão da resposta diante de descrições acompanhadas por operantes verbas autoclíticos.
Algumas hipóteses foram levantadas para interpretar os resultados deste estudo, como por exemplo, o histórico de reforçamento anterior para o comportamento de seguir regras dos participantes, de forma que, notou-se uma importância em estabelecer previamente uma função aversiva ou reforçadora para os autocliticos, pois as qualidades "pior" e "melhor" podem controlar de maneira diferente as respostas, dada as diferentes histórias que estabeleceram seu valor positivo ou negativo para casa participante.
Com relação ao presente trabalho, o estabelecimento prévio do valor aversivo e postivo de determinados estímulos foi garantido durante uma das fases experimentais, de maneira que pudemos assim, ter controle sobre essa variável, isolando os efeitos da história prévia dos participantes com as palavras que qualificavam as escolhas.
Desta forma, o presente estudo foi baseado no estudo de Almeida e Hubner (2009), no sentido de que diferentes descrições verbais também foram manipuladas a fim de avaliar a reversão ou não da preferência sobre a quantidade e probabilidade do reforço por parte dos participantes, ou seja, se os participantes passam a preferir uma probabilidade menor para a obtenção de um maior numero de pontos. Porém, foi feita a mudança com relação aos parâmetros dos reforçadores planejados, pois na tese das autoras, estes eram controlados pelo tempo (atrasado ou imediato) e no presente estudo, será a probabilidade (mais ou menos provável) bem como a magnitude (mais pontos ou menos pontos) que irão compor as combinações presentes nas diferentes escolhas.
A alteração planejada levou em consideração o estudo de Matos (2013), que teve como objetivo avaliar o efeito da manipulação dos parâmetros de atraso e probabilidade do reforço sobre as escolhas em esquemas concorrentes simples e encadeados e se esses efeitos sugiririam semelhanças entre esses dois parâmetros.
Matos (2013) avaliou também os efeitos de diferentes esquemas de reforçamento sobre as escolhas de três participantes que eram feitas em esquemas concorrentes simples, sendo uma alternativa composta por reforço maior e menos provável e a outra por reforço menor e mais provável. Nas condições de seleção, os três participantes preferiram o reforçador com menor magnitude e maior probabilidade inicialmente. Durante o esquema FR/FR do experimento, foi estabelecido o padrão de resposta sob controle do reforço maior e menos provável (considerado comportamento de autocontrole), porém, nas condições SigFR (a diferença entre FR para SigFR é que após a penúltima resposta de clicar sobre um dos quadrados, eles eram desativados por um segundo, e a tela ficava escura durante este período e os cliques não tinham quaisquer efeitos) e FI, a escolha maior entre os participante foi no componente menos e mais provável (comportamento impulsivo).
Assim, com base neste estudo de Matos, foi decidido utilizar o esquema FI/FI em nosso experimento, a fim de garantir a preferencia pelo reforçador menor e mais provável na fase inicial do experimento, ou seja, favorecer o padrão nomeado como impulsivo de responder, e observar uma possível reversão para o padrão de comportamento de autocontrole.

SUBPROJETO 1: COMPORTAMENTO VERBALMENTE CONTROLADO E AUTOCONTROLE: UMA ANÁLISE DO EFEITO DE RESPOSTAS VERBAIS ACOMPANHADAS POR ESTÍMULOS COM FUNÇÃO AVERSIVA OU DISCRIMINATIVA SOBRE O COMPORTAMENTO DE ESCOLHA.

MÉTODO

Participantes
Participaram do estudo três adultos, selecionados entre estudantes de uma universidade privada da cidade de São Paulo. Os participantes foram considerados leitores fluentes, com conhecimento prévio no uso de computador. Os participantes assinaram um termo de consentimento livre e esclarecido, que identificava os objetivos da pesquisa e garantiam a possibilidade de desistência a qualquer momento do estudo.
Ao final da pesquisa, os participantes receberam um brinde por sua participação, sendo o valor determinado pelo total de pontos obtidos por seu desempenho no jogo de computador.

Material e local de coleta:
Foi utilizado um computador notebook, equipado com programa especialmente delineado para o estudo (Woeltz, 2014) com possibilidade de apresentar instruções escritas, dispor arranjos de estímulos, e registrar o desempenho dos participantes. Quatro adesivos de cores diferentes (vermelho, verde, azul e laranja) foram colados às teclas do computador, indicando aos participantes quais as teclas deveriam ser acionadas durante o jogo.
Sala com mesa e cadeira, para o participante realizar a tarefa e termo de consentimento livre e esclarecido.

Procedimento:
O procedimento de coleta de dados foi dividido em três fases principais, com suas respectivas sub-fases:

Fase 1- Instalação de um padrão de preferência por reforçadores menores e mais prováveis, em uma situação de escolha concorrente.
O objetivo desta fase foi estabelecer a preferência do participante pela alternativa de reforço menor e mais provável, disponível em uma tarefa de escolha entre o reforço menor e mais provável ou maior e menos provável em esquema de FI/FI, sendo utilizado o FI de 2 segundos. Instruções acerca das contingências programadas para as diferentes respostas de escolha foram apresentadas aos participantes via computador.
Durante a atividade, dois quadrados de diferentes cores foram dispostos à esquerda e à direita da tela do computador. Entre eles, a mensagem "Escolha entre vermelho (laranja) ou verde (azul)" foi apresentada, sendo considerada como resposta de escolha a pressão da tecla de cor respectiva no teclado do computador. Na Subfase 1.1, quadrados de cor vermelha e verde surgiram na tela, e respostas de pressão à tecla de cor vermelha foram seguidas pela apresentação de reforço menor e mais provável com 95% de probabilidade de acesso ao reforçador (2 pontos) ; e respostas na tecla verde foram seguidas pela apresentação de reforço maior e menos provável com 28% de probabilidade de acesso ao reforçador (8 pontos). Na subfase 1.2, a única modificação planejada foi nas cores dos quadrados e teclas, que passaram a ser de cor laranja (reforçador menor e mais provável) e azul (reforçador maior e menos provável). A mudança de cores nas duas condições foi planejada a fim de garantir que as respostas motoras permanecessem sob controle dos estímulos visuais, aumentando a probabilidade do participante atentar para instruções e demais mudanças na tela, previstas nas condições posteriores.
Em cada uma das Subfases 1 e 2, a tarefa foi iniciada com oito tentativas de escolha-forçada. Nestas tentativas, a tela do computador apresentava os dois quadrados de diferentes cores e a mensagem de escolha, mas apenas uma das teclas do teclado estava em funcionamento. O objetivo desta manipulação foi garantir que o participante tinha contato com as contingências programadas nas duas teclas, antes do início das tentativas de escolhas-livres. Após o encerramento das tentativas de escolha-forçada, os contadores eram zerados e a tela escurecida. Uma pressão na barra de espaço indicava que o participante estava pronto para iniciar as tentativas de escolha-livre. A partir de então, a escolha por uma das teclas do par em funcionamento foi seguida pela soma de pontos no contador de cor respectiva, que apresentava o total de pontos obtidos na sessão. Após a emissão da resposta de escolha, os dígitos foram apresentados na parte de cima dos contadores, acompanhados por um bip. Os dígitos sobrepuseram-se uns aos outros, em intervalos de 500ms, ficando coloridos e visíveis ao participante por 2s, antes de serem somados ao total obtido nas tentativas anteriores. O intervalo entre tentativas foi de 2s, independente da escolha anterior.
Para o encerramento das fases, um critério de preferencia foi estipulado a partir da escolha por uma das alternativas de reforço em 75% das oportunidades apresentadas, em um bloco de 20 tentativas. O máximo de quatro blocos foi previsto para que o participante alcance o critério de preferência, e as fases encerradas. Caso o índice de preferencia não tivesse sido atingido após dois blocos, um ajuste no esquema do reforço foi programado ao início do terceiro bloco a fim de favorecer a direção da escolha por reforçadores menores e mais prováveis. Assim, um ajuste nos parâmetros do reforço foi programado ao início do terceiro bloco, a fim de favorecer a escolha na direção do reforço menor e mais provável. O reajuste implicava em: o participante passar a receber 3 pontos (ao invés de 2) a cada escolha/pressão na tecla correspondente ao reforço menor e mais provável, mantendo-se a probabilidade de 95% de chance de acesso ao reforçador. Ao mesmo tempo, continuaria recebendo 8 pontos caso opte pela escolha do reforçador maior e menos provável. No entanto, passará a ter a 20% de probabilidade (não mais 28%) de acesso ao reforçador.
Caso o critério não fosse atingido após o total de quatro blocos, o participante seria desligado do estudo, não prosseguindo para as fases posteriores. Quando necessário o ajuste, os parâmetros definidos na Fase 1.1 foram mantidos na Fase 1.2, desde o início do primeiro bloco.
Ao final de cada Subfase, o participante chamava o pesquisador, que conferia os pontos obtidos. O participante, então, recebe um recibo e era convidado a participar das próximas Fases do estudo.

Fase 2 – Estabelecimento do valor aversivo e positivo para dois estímulos via condicionamento respondente.
Nesta fase, dois estímulos compostos por pseudopalavras "VEG e VOJ" foram apresentados durante condições de perda ou ganhos de reforços, em uma tarefa de computador.
Os participantes foram convidados a montar um quebra-cabeça, a partir de respostas de pressão às teclas do computador.
Na presença do estímulo VEG, respostas a uma das teclas levava ao aparecimento das imagens do quebra-cabeça no centro da tela, e ao acréscimo de pontos em um contador localizado acima da imagem. Na presença do estímulo VOJ, respostas de pressão leva a perda de pontos e de 3 peças do quebra cabeça. Cada condição de apresentação dos dois estímulos ocorreu por dez vezes, de forma randômica por 10 segundos cada.
Após a quinta tentativa de apresentação de casa uma das condições de est[imulo, uma mensagem aparecia na tela, avisando ao participante que, caso quisesse, poderia apertar a barra de espaços, para mudar de tela, encerrando a tentativa. O objetivo de tal manipulação foi avaliar se a pseudopalavra VOJ poderia ser um estímulo que tivesse adquirido função aversiva, já que uma resposta de fuga/esquiva seria provável nesta condição. O mesmo não seria esperado no caso de VEG, o que levaria o participante a não emitir respostas de fuga/esquiva diante de sua apresentação.
Fase 3 – Apresentação de descrições verbais acompanhadas por estímulos com função aversiva ou positiva.
Nesta fase, os participantes foram submetidos às mesmas contingências de escolhas concorrentes descritas na Fase 1. No entanto, diferentes descrições verbais foram apresentadas antes de cada escolha, o que permitiu avaliar seu efeito sobre a reversão (ou não) do padrão de preferência antes estabelecido.
Para todos os participantes, nas dez tentativas iniciais desta fase não houve apresentação de qualquer tipo de descrição acerca das respostas de escolha. Tal manipulação pretendeu avaliar a estabilidade do padrão de preferência estabelecido na Fase 1, o que permitiu esclarecer se possíveis mudanças neste padrão seriam, de fato, decorrentes da introdução das diferentes descrições. A partir de então, vinte novas tentativas foram sequencialmente apresentadas, sendo antecedidas por uma descrição acompanhada por um estímulo VEG ou VOJ, relacionadas com condições de reforçamento positivo ou punição durante a Fase 2, o que teria permitido a aquisição de uma função positiva ou aversiva os estímulos, via condicionamento respondente. As descrições acompanhadas pelas pseudopalavras VEG e VOJ foram, assim, posicionadas acima de um dos quadrados coloridos dispostos na tela do computador, de forma para o participante que inicialmente demonstrou preferencia pela escolha de reforçamento menor e mais provável, a seguinte descrição verbal aparecia sobre o quadrado de escolha por reforçamento maior e menos provável "Escolher aqui é...VEG (estímulo que teria adquirido valor eliciador positivo e de provável estímulo discriminativo a partir da história de condicionamento na fase anterior). De forma contrária, a seguinte descrição verbal aparecia sobre a quadrado respectivo à preferência inicial estabelecida " Escolher aqui é... VOJ" (estímulo que teria adquirido valor aversivo a partir da história de condicionamento na fase anterior).
Todas as condições descritas foram apresentadas em uma única sessão. Terminada a sessão, os participantes foram avisados pelo computador do encerramento do estudo, recebendo do pesquisador o recibo do brinde a ser recebido após a sessão.

RESULTADOS E DISCUSSÃO
Os resultados agora apresentados serão discutidos de acordo com os seguintes aspectos: estabelecimento do padrão de preferência dos participantes entre as alternativas de reforçamento menor e mais provável ou reforçamento maior e menos provável; aquisição de diferentes funções (aversiva e positiva) na apresentação de estímulos verbais (VEJ e VOJ); e os efeitos produzidos pela apresentação das diferentes descrições verbais acompanhadas por estas pseudopalavras na reversão ou não do padrão de preferência inicial.
1) ESTABELECIMENTO DO PADRÃO DE PREFERÊNCIA ENTRE O REFORÇADOR MENOR E MAIS PROVÁVEL, E O REFORÇADOR MAIOR MENOS PROVÁVEL:
O objetivo desta fase foi estabelecer a preferência do participante pela alternativa de reforço menor e mais provável, disponível em uma tarefa de escolha entre o reforço menor e mais provável ou maior e menos provável.
Os resultados encontrados revelam que, os três participantes alcançaram o critério de estabilidade definido para caracterizar a preferência pela escolha do reforçador menor e mais provável na Fase 1, ou seja, atingiram o índice de 75% de escolhas por esta alternativa de reforço a longo das tentativas disponíveis na Fase 1.
Os gráficos abaixo representam o desempenho dos participantes ao longo da Fase 1 e correspondem às respostas emitidas nos diferentes blocos de 20 tentativas cada. A área cinza do gráfico indica as respostas de escolha do participante pelo reforçador menor e mais provável. Os triângulos indicam as respostas emitidas que obtiveram pontos como consequência, dadas as diferentes probabilidades de obtenção de reforço programadas pelo experimentador.
Para P1, das 20 tentativas de escolha disponíveis no primeiro bloco, como demonstrado na Figura 1, 100% delas ocorreram no quadrado vermelho, ou seja, reforçador menor e mais provável. Assim, o participante passou para a fase 1.2 após o primeiro bloco de tentativas.
Na fase 1.2., 95% das escolhas do participante ocorreram no quadrado laranja (reforçador menor e mais provável), e 5% no quadrado azul (reforçador maior e menos provável). Somente uma das escolhas dentre as 20 tentativas foi no quadrado azul. Esta ocorreu na primeira tentativa do bloco 1 (L/A), e não houve pontos como consequência. Nas 19 tentativas restantes, as escolhas foram concentradas na tecla que dava acesso ao reforçador menor e mais provável, sendo que 18 delas tiveram pontos como consequência, e somente em uma delas não houve pontos (tentativa 10).

Figura 1: Respostas de escolha emitidas por P1 ao longo dos blocos nas subfases 1.1 (V/V) e na subfase 1.2 (L/A).
Desta forma, o participante seguiu para a fase 2 com um padrão de preferência sob controle do reforçador menor e mais provável, concentrando entre 99% a 100% de suas respostas nas teclas que dão acesso a este reforçador.
No caso dos participantes P2 e P3, pode-se notar que o estabelecimento de padrão de preferência foi bastante diferente do que observado no caso de P1.
Ambos os participantes (P2 e P3), iniciaram o estudo dividindo suas escolhas entre os dois tipos de reforçadores (menor e mais provável, e maior e menos provável), e precisaram de 2 blocos para atingir o critério de preferência de 75% de escolhas pelo reforçador menor e mais provável na Subfase 1.1, e um bloco para a fase 1.2.
Para P2, na Subfase 1.1., das 20 tentativas de escolha disponíveis no primeiro bloco, como demonstrado na Figura 2, 50% delas ocorreram no quadrado vermelho, ou seja, reforçador menor e mais provável. O dado indica que o participante tendia a dividir suas escolhas entre as alternativas concorrentes, provavelmente como uma estratégia para aumentar seus ganhos, ficando sob controle tanto da magnitude do reforçador (escolha pelo reforçador maior e menos provável), quanto da maior probabilidade do ganho dos pontos (reforçador menor e mais provável). Ao longo das tentativas do primeiro bloco, nota-se também que P2 se manteve respondendo no reforçador maior e menos provável, possivelmente porque por três vezes o Participante obteve reforço, sempre após três tentativas em que insistia na escola desse reforçador. Nota-se, neste caso, que uma sequência de responder foi casualmente reforçada, o que poderia levar ao fortalecimento de um padrão de variação entre as duas alternativas de reforço.
Assim, o Participante 2 precisou de mais um bloco para atingir o critério de 75% de escolhas pelo reforçador menor e mais provável, passando para a sub-fase 1.2 após 31 respostas de escolha, conforme mostra a Figura 2.
Na Subfase 1.2, P2 obteve reforço nas cinco respostas de escolha pelo reforçador maior e menos provável. O programa de computador foi programado de forma que 28% das respostas emitidas neste reforçador fossem reforçadas. Dentre as 20 tentativas disponíveis, em seis delas, aleatoriamente, o Participante poderiam ser reforçado. Assim, o Participante foi reforçado nas cinco respostas emitidas neste reforçador, fato que aumenta a probabilidade de resposta neste reforçador.

Figura 2: Respostas de escolha emitidas por P2 ao longo dos blocos nas subfases 1.1 (V/V) e na subfase 1.2 (L/A).
Para P3, na Subase 1.1., das 20 tentativas de escolha disponíveis no primeiro bloco, como demonstrado na Figura 3, 60% delas ocorreram no quadrado vermelho, ou seja, reforçador menor e mais provável. As outras 40% respostas de escolha ocorreram no quadrado verde, ou seja, reforçador maior e menos provável.

Figura 3: Respostas de escolha emitidas por P3 ao longo dos blocos nas subfases 1.1 (V/V) e na subfase 1.2 (L/A).
No entanto, deve-se notar que, diferentemente de P1, o participante P3, tal como P2, nunca deixou de dividir as suas escolhas. O que pode explicar este padrão é o fato de que P1 foi reforçado por 90% das suas respostas de escolha no reforçador menor e mais provável e não obteve reforço pelas respostas de escolha no reforçador maior e menos provável. Já P2 e P3 entraram em contato com a consequência reforçadora nos dois tipos de reforçadores, apesar de ter acontecido com maior frequência para o reforçador menor e mais provável.
Como se pode notar, assim como P2, P3 divide suas respostas de escolha entre os dois tipos de reforçadores, recebendo mais frequentemente reforço após escolhas pelo reforçador menor e mais provável. O Participante 3 parece ter se exposto mais as contingências de maior probabilidade de reforço, o que pode ter sido uma variável importante para explicar a maior concentração de escolhas nesta alternativa no início do bloco 2, e ao final do bloco 1 (L/A). No bloco 2 da primeira subfase (vermelho e verde), P3 passa a emitir um comportamento um pouco mais estável, respondendo mais vezes no reforçador menor e mais provável, e sendo reforçado em 6 das 7 respostas de escolhas emitidas neste reforçador em sequência.
Na subfase 1.2 (laranja e azul) 4 das 5 respostas de escolha emitidas por P3 para o reforçador maior e menos provável não obtiveram reforço como consequência. Já todas as respostas emitidas pelo reforçador menor e mais provável foram reforçadas. Com esse desempenho, P3 alcança o critério de preferência de 75% de escolhas pelo reforçador menor e mais provável. Porém, deve-se notar que, P3 ainda divide as respostas de escolha até o final da Fase 1 conforme mostra a Figura 3. Das 16 tentativas em que o participante alterna para a resposta de escolha pelo reforçador menor e mesmo provável, em 6 delas P3 é reforçado.
Assim, tanto para P2 quanto para P3, as contingências mantiveram o comportamento de alternar a resposta de escolha em ambos os reforçadores, ainda que o critério de 75% de respostas de escolhas pelo reforçador menor e mais provável tenha sido alcançado.

2) ESTABELECIMENTO DO VALOR AVERSIVO E POSITIVO PARA VEG E VOJ VIA CONDICIONAMENTO
O objetivo da Fase 2, foi produzir valor aversivo e positivo para cada uma das pseudopalavras VOJ e VEG, respectivamente, e observar seus efeitos posteriores sobre o responder dos participantes. A fase foi subdividias em duas subfases:
Na subfase 2.1, os participantes passaram por uma atividade de quebra cabeça, na qual diante de VEG, a pressão na tecla enter tinha como consequência três pontos acrescidos no contador, bem como o acréscimo de três peças em um quebra cabeça disposto na tela do computador. Diante de VOJ, a pressão na tecla enter tinha como consequência três pontos diminuídos do contador e a diminuição de três peças da tela.
Cada condição dos dois estímulos foi apresentado por cinco vezes de forma randômica, e tiveram a duração de 10s, sendo apresentados por cinco vezes cada um, aleatoriamente. A única tecla que estava em funcionamento nesta fase era a tecla enter.
Após 10 tentativas de pressão a tecla, a Subfase 2.2 tinha início, sendo mantidas as mesmas contingências programadas na Subfase 2.1, exceto pelo fato de que ao início da sexta tentativa, o participante recebia a instrução de que poderia pressionar a tecla de espaço para "pular" o estímulo que desejasse, ou seja, o participante podia, ao pressionar a tecla espaço, subtrair a apresentação de VEG ou VOJ, quantas vezes desejasse. O objetivo desta manipulação foi verificar se algum estímulo, VEG ou VOJ, teria adquirido função aversiva, dado que o participante poderia emitir comportamento de fuga diante deste, ao "pular" este estímulo e esquivar-se de possibilidade de perder pontos ao pressionar a tecla enter em sua presença.
Para os três participantes, a fase teve início com a apresentação do estímulo VEG. Durante esta primeira apresentação, os participantes seguiram os 10 segundos pressionando a tecla enter continuamente. Durante as condições em que o estímulo VEG era apresentado, os participantes respondiam com pressões a tecla enter continuamente, obtendo os pontos correspondentes e peças para seu quebra-cabeças.
No momento em que o estímulo VOJ foi apresentado pela primeira vez, o participante P1 pressionou uma vez a tecla enter e teve 3 pontos descontados do seu contador, ao mesmo tempo em que três peças foram retiradas do quebra cabeça. A partir deste momento, todas as vezes em que VOJ estava disponível, o sujeito ignorou o teclado pelos 10 segundos, e nenhuma resposta foi contabilizada novamente durante a presença de VOJ para P1.
A Figura 4 representa quantas respostas de pressão a tecla enter foram dadas na presença do estímulo VEG (cinza) e na presença do estímulo VOJ (preto).

FIGURA 4: Porcentagem de resposta de pressão à tecla enter do participante P1 diante do estímulo VEG e diante do estímumo VOJ.
Já para P2, no momento em que o estímulo VOJ foi apresentado pela primeira vez, o participante pressiona uma vez a tecla enter e tinha 3 pontos descontados do seu contador e três peças saíram do quebra cabeça. Diferente de P1, P2 seguiu pressionando a tecla enter na presença de VOJ por 17 vezes, o que levou a perda de 51 pontos. A frequência de pressões foi diminuindo ao longo da fase, porém, P2 seguiu pressionando até o final da fase, não deixando de responder totalmente.

FIGURA 5: Porcentagem de resposta de pressão à tecla enter do participante P2 diante do estímulo VEG e diante do estímumo VOJ.
Para P3, no momento em que o estímulo VOJ foi apresentado pela primeira vez, o participante pressiona a tecla enter nove vezes e perde 21 pontos dos 30 anteriormente adquiridos diante de VEJ, bem como a perda das peças do quebra cabeça. P3 finalizou a fase 2.1. com 93 pontos, o que indica que a pressão da tecla enter diante de VEG foi maior (92%) que diante de VOJ (8%), como mostra a Figura 6. Desta forma, tanto P2 quanto P3 terminaram a Fase 2 com um saldo de pontos positivo, apesar de ambos seguirem pressionando a tecla enter diante de VOJ até o final do experimento, mas com uma frequência menor em comparado a frequência diante de VEG.

FIGURA 6: Porcentagem de resposta de pressão à tecla enter do participante P3 diante do estímulo VEG e diante do estímumo VOJ.
Na fase 2.2, quando os participantes podiam pular a apresentação de uma das condições de estímulos pressionando a tecla espaço, P1 a pressionou todas as vezes em que o estímulo VOJ foi apresentado, e não houve pressão diante do estímulo VEG, como mostra a Figura 7. O dado parece sugerir que o estímulo VOJ tenha adquirido valor aversivo.

FIGURA 7: Porcentagem de resposta de pressão à tecla de espaço do participante P1 diante do estímulo VEG e diante do estímumo VOJ.
Para P2, nesta subfase 2.2, o participante pressionou continuamente a tecla enter diante de VEG, recebendo a pontuação de acordo com as pressões. Já diante de VOJ, o participante pressiona a tecla enter somente uma vez, perdendo 3 pontos. Após isso, pressiona a tecla espaço todas às vezes que o estímulo VOJ está presente, como mostra a Figura 8.

FIGURA 8: Porcentagem de resposta de pressão à tecla de espaço do participante P2 diante do estímulo VEG e diante do estímumo VOJ.
P3, por sua vez, pressionou todas às vezes (100%) a tecla de espaço, emitindo comportamento de esquiva/fuga diante do estímulo VOJ, como pode ser observado na Figura 9, esquivando-se da contingência de perda de pontos diante de sua apresentação. Diante de VEG continuou pressionando a tecla enter, terminando a Fase 2 com um saldo de 129 pontos.

FIGURA 9: Porcentagem de resposta de pressão à tecla de espaço do participante P1 diante do estímulo VEG e diante do estímumo VOJ.
Uma síntese dos resultados dos três participantes sugere que, o estímulo VOJ parece ter adquirido valor aversivo, pois os participantes emitem comportamento de fuga diante deste, pressionando a tecla de espaço que permitia que os participantes "pulassem" o estímulo, esquivando-se da perda dos pontos e das peças. Já o estímulo antes neutro VEG, parece ter adquirido valor discriminativo para a resposta de pressão na tecla enter, pois os participantes emitiam a resposta de pressão nesta tecla continuamente diante de VEG. Ainda que nesta fase o valor positivo de VEG não tenha sido testado, entende-se que esta função possa também ter sido adquirida pela pseudopalavra, dado seu pareamento com a apresentação do reforço.

3) EFEITOS PRODUZIDOS PELA APRESENTAÇÃO DAS DIFERENTES DESCRIÇÕES VERBAIS (VEG E VOJ) NA REVERSÃO OU NÃO DO PADRÃO DE PREFERÊNCIA:
Na Fase 3, os participantes foram submetidos às mesmas contingências de escolhas concorrentes descritas na Fase 1. No entanto, diferentes descrições verbais foram apresentadas antes de cada escolha, o que permitiu avaliar seu efeito sobre a reversão (ou não) do padrão de preferência antes estabelecido.
Nas dez tentativas iniciais desta fase (3.1) não houve apresentação de qualquer tipo de descrição acerca das respostas de escolha. Tal manipulação pretendeu avaliar a estabilidade do padrão de preferência estabelecido na Fase 1, o que permitiria esclarecer se possíveis mudanças neste padrão seriam, de fato, decorrentes da introdução das descrições acompanhadas pelas pseudopalavras VEG e VOJ.
A partir de então, vinte novas tentativas foram sequencialmente apresentadas, sendo antecedidas por uma descrição acompanhada por um estímulo VEG ou VOJ, relacionadas a função positiva ou aversiva, via condicionamento respondente. As descrições foram posicionadas acima de um dos quadrados coloridos dispostos na tela do computador, de forma a avaliar seu efeito sobre o padrão de preferencia inicialmente estabelecido na Fase 1. Assim, o participante que inicialmente demonstrou preferencia pela escolha de reforçamento menor e mais provável, a seguinte descrição verbal apareceu sobre o quadrado de escolha por reforçamento maior e menos provável "Escolher aqui é...VEG (estímulo que teria adquirido valor apetitivo e de provável estímulo discriminativo a partir da história de condicionamento na fase anterior). De forma contrária, a seguinte descrição verbal surgirá sobre a quadrado respectivo à preferência inicial estabelecida " Escolher aqui é... VOJ" (estímulo que teria adquirido valor aversivo a partir da história de condicionamento na fase anterior).
A figura abaixo ilustra o desempenho do Participante 1 ao longo das três subfases (sem instrução, VEG e VOJ) da Fase 3. As linhas pontilhadas dividem as subfases compostas por 10 oportunidades de escolhas. A área cinza do gráfico indica quais respostas emitidas pelo participante foram de acordo com a a instrução, e respostas na área sem cor são opostas à instrução.

FIGURA 10: Respostas de escolha nas dez tentativas de cada subase disponíveis, emitidas pelo participante P1 ao longo da fase 3. A área em cinza é aquela em que as respostas de escolha foram pelo reforçador maior e menos provável, ou seja, respostas que podem estar son controle da instrução.
Como se pode notar, na subfase 3.1, 100% das escolhas de P1 foram no reforçador menor e mais provável, ou seja, , no caso de P1, nota-se a manutenção de um padrão de preferência estabelecido no início do experimento.
Nas próximas 10 tentativas (subfase 3.2), somente na primeira o participante seguiu a instrução, de forma que o quadrado selecionado foi o corresponde ao reforço maior e menos provável, resposta considerada de acordo com o descrito na instrução e oposta ao que o participante vinha fazendo até então durante o experimento. Assim, o quadrado selecionado foi o que continha acima a frase "fazer isto é VEG". Nota-se, no entanto, que nesta tentativa, P1 não obteve pontuação por seguir a instrução e emitir a resposta de escolha diante de VEG, o que pode explicar que nas novas tentativas seguintes o participante não tenha se comportado de acordo com as instruções, passando a escolher pelo reforço menor e mais provável, que foi recebido em 8 das 9 tentativas desta Subfase (exceto na tentativa 5.
Nas 10 tentativas seguintes (Subfase 3.3), a frase "fazer isto é VOJ" aparecia acima do quadrado que tinha como consequência o reforço menor e mais provável. Somente em uma delas o participante seguiu a regra, como pode ser observado na Figura 10. De forma que, novamente, na primeira tentativa do bloco, o quadrado selecionado foi o corresponde ao reforço maior e menos provável, padrão correspondente ao descrito na instrução e oposto ao estabelecido na Fase 1 e o que vinha sendo mantido nas tentativas anteriores da sub fase 3.2. Mais uma vez, P1 não obteve o recebimento de pontos como consequência por seguir a instrução nesta tentativa e durante as 9 tentativas seguintes, o quadrado selecionado passou a ser aquele que tinha como consequência para a resposta de escolha, reforço menor e mais provável, ou seja, os quadrados que continham a cima a frase "fazer isto é VOJ". Destas 9 oportunidades de escolha, em todas elas o participante obteve pontos como consequência por não seguir a instrução.
Assim, observamos que o estímulo anteriormente neutro VOJ, parece ter obtido valor aversivo durante a atividade de quebra cabeça, pois, o participante emitiu comportamento de fuga na presença deste, durante a Fase 2 do estudo. Porém, durante a Fase 3, em que investigamos se diante de VOJ o participante reverteria seu padrão de preferencia, pudemos notar que inicialmente ele seguiu a regra, porém, como as consequências permanecem as mesmas de quando ele estabeleceu sua preferencia, o participante voltou a responder de acordo com esta.
Os dados nos mostra que, mesmo que pseudopalavras com valor aversivo ou positivo tenham sido incluídas para favorecer o seguimento da instrução, elas não necessariamente aumentam a probabilidade de seguimento da instrução, quando as contingencias para o seguimento da regra não sejam mantidas pelo acréscimo de pontos.
No caso do Participante 1, nota-se que ele nunca foi reforçado por seguir a instrução neste experimento, e por outro lado, tem uma história bastante forte de reforçamento para a resposta de escolha pelo reforçador menor e mais provável. Assim, mesmo quando as descrições foram acompanhadas de pseudopalavras com valor aversivo ou positivo, a história de reforçamento deste participante em específico, parece contribuir para que ele continue se comportando da maneira que vinha fazendo ao longo do estabelecimento do padrão de preferência.
Uma hipótese acerca destes resultados seria a de que, o participante teria entrado mais em contato com a consequência reforçadora (pela resposta de pressão à tecla diante de VEG) na Fase 2, do que com consequências aversivas na presença de VOJ nesta mesma Fase. Por mais que durante o experimento ele tenha emitido comportamento de esquiva de VOJ, poucas foram as vezes em que ele entrou de fato em contato com a perda dos pontos, pois assim que isto ocorreu ele não mais pressionou a tecla que retirava pontos e peças da tela diante de VOJ.
Desta forma, para P1, a história construída ao longo do experimento, somada a uma história pessoal anterior do participante de seguimento de instruções, parece não ter contribuído para que o estímulo verbal tivesse maior controle sobre o comportamento do seguir instruções neste experimento do que as contingências atuais.
No caso de P2, no entanto, nota-se um padrão diferente do que o de P1 já na fase 3.1, na qual não havia instrução para a resposta de escolha. Nesta fase, 70% das escolhas de P2 foram no reforçador menor e mais provável, ou seja, pode-se notar, no caso de P2, a manutenção de um padrão de preferência estabelecido no início do experimento, porém, com uma variação maior, ele não manteve o critério 75% de preferência por esta alternativa de reforço, tal como na Fase 1. Somente em três das dez tentativas da sub-fase 3.1, P2 emitiu resposta de escolha no quadrado correspondente ao reforço maior e menos provável. Em nenhuma das três tentativas o participante obteve pontos como reforço. Uma provável hipótese acerca da emissão de respostas de escolha por esta alternativa de reforço, ainda que o participante não viesse recebendo pontos durante esta subfase 3.1., seria de que na Fase 1 ele foi bastante reforçado por manter um comportamento de alternar entre os reforço, incluindo assim, a escolha pelo reforço maior e menos provável.
Já nas sete respostas de escolha no quadrado correspondente ao reforçador menor e mais provável pode-se observar o recebimento de pontos como reforço em todas elas, como mostra a Figura 11.

FIGURA 11: Respostas de escolha nas dez tentativas de cada subase disponíveis, emitidas pelo participante P2 ao longo da fase 3. A área em cinza é aquela em que as respostas de escolha foram pelo reforçador maior e menos provável, ou seja, respostas que podem estar son controle da instrução.
Nas próximas 10 tentativas (subfase 3.2), a frase "fazer isto é VEG" aparecia acima do quadrado que tinha como consequência o recebimento do reforço maior e menos provável, favorecendo a escolha oposta ao padrão estabelecido até então. Nesta subfase, das 10 tentativas disponíveis diante do estímulo VEG, em cinco delas o participante escolher o reforçador maior e menos provável, padrão de acordo ao sugerido na instrução (50%), como pode ser observado na Figura 11. Na primeira das tentativas desta sub-fase, P2 segue a instrução, porém, não é reforçado por isto, passando a emitir a resposta de escolha no reforçador (menor e mais provável) em seguida, sendo reforçado por comportar-se em desacordo ao sugerido na instrução. Isto parece indicar que as contingências atuais parece não contribuir para a manutenção do comportamento de seguir regras.
Na terceira tentativa da Subfase 3.2, P2 volta, no entanto, a escolher por reforçador maior e menos provável, de acordo com o padrão especificado na instrução. Dado que o participante não recebeu reforço anterior por seguir a instrução e escolher por esta alternativa de reforço nesta subfase, escolher novamente por reforçador maior e menos provável pode sugerir tanto que a presença de VEG possa ter estabelecido valor positivo para esta escolha, independente das contingencias atuais mantidas; quanto que o padrão de dividir as escolhas entre os dois reforçadores, reforçado na Fase 1 do experimento, foi mantido durante esta Subfase 3.2.
P2 foi reforçador ao emitir resposta de escolha na alternativa de reforço maior e menos provável, após emitir algumas respostas no reforçador menos e mais provável. Assim, o padrão parece estar mais sob o controle das contingências do que sob controle da instrução, atenuando o valor do Sd verbal.
Quando é reforçado por 4 tentativas seguidas de escolha pelo reforçador oposto ao seguir a instrução, P2 continua a emitir resposta de escolha neste reforçador até que não recebe reforço. Assim como nas tentativas anteriores, quando P2 não recebe reforço pela resposta de escolha, ele emite comportamento de escolha no reforçador oposto, e neste caso ele é reforçado.
O padrão de alternação que P2 apresenta (quatro tentativas em reforçamento menor e mais provável, passando para uma variação para maior e menos provável), pode indicar um maior controle sobre as contingências do que das pseudopalavras. Ou seja, parece que as contingências são relevantes no controle do padrão do responder de P2, independente da presença de VEG e VOJ.
As próximas 10 tentativas (subfase 3.3) aparecem com a frase "fazer isto é VOJ" acima do quadrado que tinha reforço menor e mais provável como consequência para a resposta de escolha. Nesta subfase, das 10 tentativas disponíveis diante do estímulo VOJ, somente em duas delas o participante não escolheu o quadrado correspondente a VOJ. O dado parece indicar que o estimulo não parece exercer valor aversivo sobre o responder do sujeito, como efeito do enfraquecimento do valor do estímulo na subfase anterior.
P2 começou a Subfase 3.3 respondendo no quadrado corresponde a escolha pelo reforçador menor e mais provável e obtém pontos em todas as escolhas. Nota-se assim, que ele não iniciou esta subfase seguindo a instrução. Na quinta tentativa, o participante volta a alternar a escolha para a alternativa de reforço maior e menos provável e recebe pontos como reforço, porém, em seguida passa a responder no reforçador menor e mais provável, ou seja, faz o oposto à instrução. P2 volta a responder no reforçador menor e mais provável por quatro tentativas, obtendo pontos em todas elas até que na ultima tentativa, responde no quadrado correspondente ao reforçador maior e menos provável, seguindo a instrução, porém, novamente não obtém pontuação por esta resposta de escolha.
Esses dados sugerem que na subfase 3.3 (VOJ), P2 responde menos de acordo com a instrução do que na subfase 3.2 (VEG). Mesmo quando foi reforçado por emitir resposta de escolha de acordo com a instrução, não permaneceu emitindo resposta de escolha por este reforçador. Isto pode mostrar que P2 não está sob controle da instrução, mas pode ainda está dividindo as respostas de escolha entre os dois reforçadores, padrão estabelecido pelas contingências de reforçamento intermitente para o comportamento de alternar suas escolhas ao longo do estudo.
Novamente podemos inferir que ao longo do experimento, o contato com as contingências reforçadoras tem maior controle sobre o responder do participante, do que a variável verbal, mesmo que esta tenha adquirido um valor aversivo ou positivo no experimento na Fase 2.
Na fase 3.1, na qual não havia instrução para a resposta de escolha, 100% das escolhas de P3 foram no reforçador menor e mais provável, confirmando o padrão de preferência estabelecido na Fase 1. Durante as 10 tentativas, nas 9 primeiras o participante obteve como consequência os pontos correspondentes a respostas de escolha no reforçador menor e mais provável. Ou seja, somente na ultima não houve consequência, como mostra a Figura 12.
Na subfase 3.2, das 10 tentativas disponíveis diante do estímulo VEG, em sete delas o participante seguiu a instrução (70%), como pode ser observado na Figura 12. Assim, o quadrado selecionado por sete vezes foi o que continha acima a frase "fazer isto é VEG". Destas sete, quatro delas tiverem reforço como consequência.

FIGURA 12: Respostas de escolha nas dez tentativas de cada subase disponíveis, emitidas pelo participante P3 ao longo da fase 3. A área em cinza é aquela em que as respostas de escolha foram pelo reforçador maior e menos provável, ou seja, respostas que podem estar son controle da instrução.
Na primeira tentativa da sub-fase 3.1, o participante seguiu a instrução, o que parece sugerir o controle que a pseudopalavra exerceu sobre o responder, pois o participante vinha respondendo no reforçador oposto durante toda a subfase anterior (3.1). P3 é reforçado por seguir a instrução, e segue por 5 tentativas neste reforçador maior e menos provável. Depois de duas tentativas consecutivas sem obter reforço, o participante passa a responder no outro reforçador, dividindo as escolhas entre os dois até o final da subfase 3.2.
Na subfase 3.3, novamente P3 comporta-se de acordo com o sugerido na instrução e é reforçado por isto, passando a responder de forma muito parecida com a subfase 3.2. A partir dos dados, parece que, inicialmente, o estímulo verbal exerce controle sobre o responder do sujeito. Porém, quando não recebe mais reforço por esta resposta, passa a revezar novamente, podemos dizer que P3 esta em certa medida, sob controle das contingências atuais.
Com base nesses dados, parece que P3 esteve sob controle das instruções inicialmente, e por ter sido reforçado também por seguir as instruções, porém, foi mais reforçado por não fazê-lo. Assim, ao final do experimento, o participante esteve sob controle das contingências, mantendo seu padrão de revezar entre os reforçadores.
Os resultados agora apresentados referem-se a uma análise ao desempenho dos participantes ao longo de todas as fases, com objetivo de apresentar um panorama geral do padrão comportamental de cada Participante, além da comparação entre o responder dos três participantes.
As figuras ilustram a porcentagem do padrão de respostas do participante ao longo dos blocos do experimento que envolveram escolha entre os dois tipos de reforçadores (Fase 1 e Fase 3). A primeira área da figura corresponde a Fase 1. A área seguinte corresponde a Fase 3, dividida entre as três subfases.
As resposta localizadas na área cinza do gráfico, indicam as respostas de escolha emitidas no reforçador maior e menos provável. Se as respostas estiverem agrupadas em maior número nesta área cinza durante a fase 3, significa que houve a reversão do padrão de preferência do participante, do reforçador menor e mais provável para o reforçador maior e menos provável.

FIGURA 13: Porcentagem de resposta de escolha no reforçador menor e mais provável do participante P1. As áreas em cinza são aquelas em que as respostas estariam se o participante estivesse se comportando sob controle da instrução.
FIGURA 14: Porcentagem de resposta de escolha no reforçador menor e mais provável do participante P2. As áreas em cinza são aquelas em que as respostas estariam se o participante estivesse se comportando sob controle da instrução.

FIGURA 15: Porcentagem de resposta de escolha no reforçador menor e mais provável do participante P3. As áreas em cinza são aquelas em que as respostas estariam se o participante estivesse se comportando sob controle da instrução.
Dos três participantes, P3 foi o que mais entrou em contato com a consequência de perder pontos e peças no quebra cabeça, por continuar pressionando a tecla enter na presença de VOJ. Os outros dois participantes (P1 e P2), assim que tinham a possibilidade de pular a janela de VOJ o faziam, ou então, ignoravam a tela correspondente a VOJ.
Assim, P3 foi o participante que mais se distanciou do antigo padrão de preferência estabelecido na Fase 1, quando novamente observado na Fase 3. Porém, aparentemente, o participante demonstra um responder sob controle das contingências reforçadoras, e não sob controle da instrução, pois ele foi reforçado por responder de acordo com a instrução.

CONCLUSÃO
O presente trabalho pretendeu avaliar o efeito de descrições verbais com função aversiva ou positiva, sobre o comportamento de escolha de três participantes adultos.
Durante o experimento foi avaliada a preferência inicial dos participantes entre alternativas do reforço menor e mais provável e maior e menos provável, Sendo posteriormente avaliado se a inclusão de instruções verbais contrárias ao padrão inicialmente estabelecido, e acompanhadas por pseudopalavras qualificadoras com valor positivo ou aversivo poderiam levar à reversão deste padrão.
Segundo Braam e Mallot (1990) descrições verbais controlarão diferencialmente as respostas não verbais, a depender das contingências que especifiquem. Para Mallot (1989), o controle de instruções/regras que especifiquem contingências de ação seria maior quando fossem acompanhadas por estímulos que maximizem o valor aversivo de uma instrução, pois a instrução/regra funcionaria como estímulo aversivo condicionado, capaz de favorecer seu seguimento por induzir condições aversivas que seriam atenuadas após seu cumprimento.
Almeida e Hubner (2009) pretenderam contribuir com a discussão sobre as condições que afetam a probabilidade de controle verbal sobre o comportamento não verbal, investigando se a inclusão de operantes autoclíticos pode favorecer este controle. As autoras analisaram se operantes verbais autoclíticos negativos e também positivos reverteriam o padrão de preferência estabelecido anteriormente pelos participantes. Os resultados de Almeida e Hubner (2009), apontaram que não houve reversão do padrão de preferência por conta das instruções introduzidas. A hipótese levantada pelas autoras foi que o histórico anterior dos sujeitos sobre autoclíticos "pior" e "melhor" utilizados no experimento, poderiam ter influenciado na maneira em que cada participante iria responder a esses estímulos.
No presente estudo, pretendeu-se testaro controle verbal no estabelecimento de um valor aversivo a VOJ, analisando se quando acompanhado a instrução, ele também teria a função de maximizar o valor aversivo desta. Bem como testas se o estabelecimento de um valor positivo a outro estímulo, VEG, também exerceria controle sob o responder do sujeito com o objetivo de reverter o padrão anteriormente estabelecido no experimento.
O estabelecimento prévio do valor aversivo e positivo de determinados estímulos foi garantido durante a Fase 2 do experimento, de maneira que pudemos assim, ter controle sobre essa variável, isolando os efeitos da história prévia dos participantes com as palavras que qualificavam as escolhas.
Assim, no presente estudo, o efeito das descrições na reversão da preferência dos participantes foi avaliado em condições em que houve o estabelecimento de um novo evento, no caso a instrução aversiva gerada pela inclusão da pseudopalavra VOJ (e do aumento do valor positivo desta escolha, pela inclusão de um estímulo de função positiva VEG). No caso das descrições acompanhadas por VOJ, entende-se que a reversão de preferência dar-se-ia como uma resposta de esquiva, a fim de eliminar a aversividade imposta por este tipo de descrição.
Com base nesta discussão, testamos assim, o controle que descrições acompanhadas pelas pseudopalavras VEG e VOJ exerciam sobre o responder dos participantes, após terem sido diretamente pareados com reforço e punição, respectivamente. Os dados mostram que esse controle não foi suficiente para que os participantes seguissem a instrução, nas condições em que havia reforço para respostas incompatíveis com o seguimento
Para os três participantes as pseudopalavras pareceram exercer controle sobre o responder nas primeiras tentativas de escolha da Fase 3 (que verificaria o controle dos estímulos verbais), mas nas próximas tentativas, ao longo das subfases, o responder deste três participantes voltou a ficar sob controle das contingências e da maneira a responder anteriormente estabelecido durante a Fase 1.
Assim, os resultados parecem demonstrar que os participantes estavam sobre controle da magnitude do reforçador (escolha pelo reforçador maior e menos provável), ou da probabilidade do ganho dos pontos (reforçador menor e mais provável), de acordo com seu padrão de preferencia estabelecido anteriormente.
Desta forma, instruções verbais acompanhadas por estímulos VEG e VOJ, parecem exercer pouco controle sobre o responder dos participantes, mesmo tendo adquirido valor positivo e aversivo, respectivamente.
Nos estudos descritos por Braam e Mallot em que objetivo era investigar se descrições verbais controlariam diferencialmente as respostas não verbais, a depender das contingências, foi possível tirar duas conclusões. A descrição de reforços atrasados ou ausência de reforço parece ter enfraquecido o controle pela regra, e, a inclusão de prazos (resposta verbal) parece maximizar o controle da regra que descreve contingências indiretas envolvendo atraso de reforço. Porém, nossos dados não vão de acordo com os dos autores, pois a resposta verbal não pareceu maximizar o controle pela regra, mesmo que esta descrevesse contingências aversivas condicionadas.
Talvez o fato de no experimento dos autores, as contingências descreverem o atraso do reforço, tenha influenciado de maneira diferente do nosso experimento, que não descrevia um atraso. No nosso experimento, mesmo que o participante não seguisse a instrução, ele poderia ser reforçado por isto, assim como seguir a instrução não necessariamente tinha como consequência o reforço. Nestas condições, pode-se observar se o responder está sob controle da instrução ou sob o controle das contingências vigente, o que ocorreu no nosso caso.
Isto parece fazer com que os participantes voltem a emitir respostas de escolha que, nas fases anteriores do experimento, teriam aumentado a possibilidade de reforço e que nas condições atuais, continuam a reforçar este comportamento.
De acordo com Skinner (1953), ao discutir o comportamento de autocontrole, a declaração de uma resposta verbal pode controlar a probabilidade de uma segunda resposta, se esta primeira adquire uma função aversiva, dados pareamentos anteriores com punição pelo comportamento de desobedecer à instrução. Porém, este pareamento precisa ser mantido para que seu valor aversivo não se perca, perdendo também a função de resposta controladora.
No nosso experimento, foi possível perceber que o valor positivo de VEG e aversivo de VOJ foi atenuado na Fase 3, pois a punição não estava em vigor caso a instrução não fosse seguida.
Assim, nota-se que no nosso experimento não pareceu possível manter o valor positivo ou aversivo estabelecido via condicionamento diante de contingências atuantes que favoreçam a emissão de respostas opostas a instrução. Mesmo que VEG e VOJ tenham adquirido valor positivo ou aversivo, elas não foram suficientes para manter o controle do comportamento de escolhas, diferentemente do resultado obtido por Braam e Mallot (1990).
Porém, os resultados são semelhantes aos obtidos por Almeida e Hubner (2009), em que não foi possível observar reversão do padrão por conta do controle da regra. Assim, de modo geral, os resultados pareceram indicar que não é possível manter o valor aversivo de uma regra/instrução quando as contingências vigentes são opostas ao comportamento de seguir a instrução, no caso do sujeito ser mais reforçado por fazer o contrário a ela. Foi possível verificar que o valor aversivo é atenuado, caso não aconteça punição por não seguir a regra. Assim como o valor positivo, caso o sujeito não seja reforçado por seguir a instrução. O que justifica essa hipótese, também é o fato de o participante que mais seguir a instrução, foi aquele que foi reforçado por fazê-lo. De modo que este continua sob controle das contingências e não da instrução.
Neste caso em específico, em que o Participante 3 que aparentemente segue mais as instruções, foi necessária uma análise tentativa a tentativa para compreender se o responder estava sob controle da instrução ou das contingências. Isto porque, o participante foi reforçado em 90% das respostas de escolhas emitidas de acordo com a instrução. Mesmo que a programação do nosso experimento tenha sido de 28% de probabilidade de reforço neste reforçador (maior e menos provável), ao acaso, o participante obteve o reforço em quase todas as respostas de escolha neste reforçador, o que implicou no aumento da probabilidade de resposta neste reforçador.
Como sugestão para estudos futuros, poderia ser repensado o parâmetro de probabilidade seria o mais adequado a ser utilizado nesta investigação, pois aparentemente este contribuiu diretamente para os resultados obtidos, uma vez que interfere no acesso as contingências de reforço, fazendo com que os participantes tentem maximizar o acesso ao reforço, dividindo as respostas entre os dois tipos de reforçadores. Com isso, ocasiões em que o participante obedece à regra podem ser seguidas sem o acesso ao reforço, da mesma forma que ocasiões em que o participante não segue as instruções podem ser seguidas de acesso ao reforçador, como aconteceu nos resultados obtidos dos Participantes P1 e P2.
Outra sugestão seria sobre como garantir que o Participante entre em contato por mais vezes com a consequência punitiva na Fase 2 do experimento, para que esta adquira valor aversivo mais eficiente. No caso do Participante P1, ele quase não entrou em contato com a perda de pontos e de peças, de forma que isto pode ter influenciado em seu responder na Fase 3.

REFERÊNCIAS BIBLIOGRÁFICAS:
ALMEIDA, P.E.M; HUBNER. M.M.C (2009) "Comportamento verbalmente controlado: uma análise do efeito de operantes verbais autoclíticos sobre o comportamento de escolha". Tese de doutorado defendida No Programa de Psicologia Experimental da Universidade de São Paulo, São Paulo.
BORTOLOTI, R.; DE ROSE, J. C. (2008) "Transferência de 'significado' de expressões faciais apresentadas brevemente para estímulos abstratos equivalentes à elas". Acta Comportamentalia Vol.16, Núm.2, pp.223-241. São Carlos, São Paulo.

BRAAM, C; MALLOT, R.W (1990) "I´ll do it when the snow melts: The effects of deadlines and delayed outcomes on rule-governed behavior in preschool children". The Analysis of Verbal Behavior, 8, 67-76.
FRANÇA, T. P. (2002) "Transferência de Função Aversiva em Classes de Equivalência: Uma Visão Analítico-Comportamental dos Transtornos de Ansiedade". Brasília, IBAC.
MALLOT, R.W. (1989) "The achievement of evasive goals: Control by rules describing contingencies that are not direct acting". Em Hayes, S. (org) Rule-governed behavior: cognition, contingencies, and instructional control (p. 269-322) New York: Plenum Press.
MATOS, D. (2013) "Análise dos efeitos do Atraso e da Probabilidade do Reforço sobre a escola em Condições com Esquemas Concorrentes Encadeados e Simples" Tese de doutorado defendida no Programa de Psicologia Experimental: Análise do Comportamento da PUC-SP, São Paulo.
REIS, A.A; TEIXEIRA, E.R & PARACAMPO, C.C.P (2005) "Auto-regras como variáveis facilitadoras na emissão de comportamentos autocontrolados: o exemplo do comportamento alimentar". Interação em Psicologia, 9 (1), 57-64.
SKINNER, B.F. "Ciência e Comportamento Humano". 5ª edição. Ed Martins Fontes, 1953/1981. São Paulo.
VALDIVIA, S., LUCIANO, C. & MOLINA, F. J. (2006) "Verbal regulation of motivational states" The Psychological Record: Vol. 56: Iss. 4, Article 8

Preferência pelo reforço menor e mais provável em porcentagem
Preferência pelo reforço menor e mais provável em porcentagem
Pressões à tecla de espaço em porcentagem

Pressões à tecla enter em porcentagem

Pressões à tecla de espaço em porcentagem

Preferência pelo reforço menor e mais provável em porcentagem
Pressões à tecla de espaço em porcentagem

Pressões à tecla enter em porcentagem

Lihat lebih banyak...

COMPORTAMENTO VERBALMENTE CONTROLADO E AUTOCONTROLE: UMA ANÁLISE DO EFEITO DE RESPOSTAS VERBAIS ACOMPANHADAS POR ESTÍMULOS COM FUNÇÃO AVERSIVA OU POSITIVA SOBRE O COMPORTAMENTO DE ESCOLHA.

Descrição do Produto

Comentários