Universidade de São Paulo
Faculdade de Filosofia, Ciências e Letras de Ribeirão Preto
Isabela Pizzarro Rebessi
Paola Chaves Marmorato
Extinção e Esquemas de Reforço Intermitente: uma análise experimental e
comparativa em rato Wistar
Ribeirão Preto
2013
2
Sumário
Introdução......................................................................................................................3
Método.............................................................................................................................9
Resultados........................................................................................................... 12
Discussão.............................................................................................................. 16
Referências............................................................................................................ 19
3
Introdução
Para melhor compreender as pesquisas dentro da Análise do Comportamento, é
importante entender os conceitos principais que embasam tal abordagem. Em 1935,
Skinner propôs que existem dois tipos de condicionamento (Keller, 1968). O primeiro,
classificado como “Condicionamento Respondente” (apresentado pelo trabalho de
Pavlov) ocorre por meio do emparelhamento de dois estímulos, sendo um estímulo
reflexo (incondicionado) e o outro um estímulo neutro que, após determinado tempo de
emparelhamento, adquire propriedades eliciadores da resposta mesmo na ausência do
estímulo incondicionado (Baum, 2008). Já o segundo, é classificado por Skinner como
“Condicionamento Operante”, em que uma ação (comportamento) sobre o meio se torna
mais ou menos provável de ser repetida de acordo com suas consequências para o
organismo (Skinner, 1967).
O Condicionamento Operante é, para Skinner, a base da construção da maioria
dos comportamentos e hábitos. Tanto animais quanto seres humanos estariam aptos a
repetirem comportamentos que geram resultados satisfatórios e a suprimirem aqueles
que geram resultados insatisfatórios ou desfavoráveis. Como, por exemplo, no
experimento com a caixa de Skinner, um rato com sede ou faminto que pressiona a
barra como uma resposta voluntária (comportamento operante) e recebe água ou
alimento como consequência (reforçador), se torna apto a repetir o procedimento outras
vezes. Já, por outro lado, se ao pressionar a barra (comportamento operante) o rato
recebesse um choque (punidor), a probabilidade de pressionar a barra novamente
diminuiria. (Shaffer & Kipp, 2012).
Em outras palavras, o condicionamento operante ocorre quando um
comportamento voluntário emitido gera consequências que aumentam (reforçadores) ou
diminuem (punidores) a probabilidade de uma nova ocorrência do mesmo (Catania,
1999).
Há, também, uma classificação de reforçadores e punidores: Reforçadores
podem ser positivos (quando algo agradável é dado ao ator) ou negativos (quando algo
aversivo é retirado do ator). Da mesma forma, punidores podem ser positivos (quando
algo aversivo é dado ao ator) ou negativos (quando algo agradável é retirado do ator).
Em suma, o comportamento é modelado por reforçadores e punidores. (et. Skinner,
1967; Keller, 1968; Catania, 1999; Shaffer & Kipp, 2012).
4
É importante ressaltar que um comportamento que outrora fora reforçado pode
ser extinto na ausência do reforçador, isto se deve a um conceito denominado “extinção
operante”. Em outras palavras o sujeito para de responder quando o reforço não é mais
adquirido. Skinner (1967) argumenta que “Em geral, quando nos empenhamos em
comportamentos que ´não compensam` encontramo-nos menos inclinados a
comportamentos semelhantes no futuro. Se perdemos uma caneta-tinteiro, passamos a
procura-la cada vez menos no bolso em que costumeiramente era guardada. Se não
obtivermos respostas a ligações telefônicas eventualmente deixamos de telefonar. Se o
piano está desafinado, tocamos cada vez menos. Se o rádio torna-se barulhento ou se os
programas pioram, paramos de ouvir.”. Entretanto, a extinção operante ocorre de
maneira mais lenta que o condicionamento operante. Numa curva de taxa de resposta, o
declínio da frequência do comportamento é visivelmente lento e, inclusive, pode ser
alternado com picos de maior frequência do mesmo (Skinner, 1967). Durante a extinção
podem ocorrer reações que Skinner denominou como “frustração ou cólera”, que são
definidos como “violentos comportamentos emocionais” pela frustração da falta do
reforçador. Um adulto que, por exemplo, tenta abrir uma gaveta e não consegue, pode
parar de tentar, mas também pode golpear o tampo da mesa como uma resposta
emocional de sua frustração. (Skinner, 1967).
A extinção é, sem dúvida, uma ferramenta importante e efetiva para remover um
comportamento do repertório de um indivíduo sem se utilizar de métodos aversivos
(punição), no entanto, o processo de extinção depende da história do condicionamento
(Skinner, 1967). Se apenas algumas respostas foram reforçadas, a extinção pode se dar
de maneira mais rápida e fácil. Se, por outro lado, o condicionamento foi mais intenso, a
extinção se dará de maneira lenta e árdua (Skinner, 1967).
Para melhor entender o processo de extinção, é preciso entender os tipos de
esquemas de reforço. Reforçadores podem ser apresentados de maneira contínua
(quando o reforço é dado para toda vez que o comportamento é emitido) ou de maneira
intermitente (quando o reforço não é dado em determinadas condições em que o
comportamento é emitido) (Shaffer & Kipp, 2012). Como é possível deduzir, grande
parte do comportamento da vida cotidiana é reforçado apenas intermitentemente
(Skinner, 1967). Uma dada consequência reforçadora pode não depender apenas do
comportamento operante, mas sim de mais uma série de eventos não facilmente
previsíveis. Os reforços característicos da indústria e educação, por exemplo, são quase
5
sempre intermitentes, visto que não é praticável controlar o comportamento pelo reforço
de cada resposta (Skinner, 1967). Como exemplificação cotidiana, podemos observar
quando se liga a um amigo que não tem uma secretária eletrônica e não atenda naquele
instante: a probabilidade de obter uma resposta mais tarde vai depender do momento e
não do número de ligações. Para conquistar o reforço (ser atendido), portanto, não
depende exclusivamente do comportamento de ligar, mas também de outros eventos
imprevisíveis (o amigo estar em casa ou disponível, por exemplo). O que indica que o
comportamento no cotidiano não é moldado apenas por reforçadores contínuos, mas,
principalmente, por esquemas de reforço (Catania, 1999).
Como esquemas de reforço básicos, podemos citar: aqueles em que uma resposta
é reforçada depois de algum número de respostas (esquemas de razão); e aqueles em
que uma resposta só é reforçada após um tempo transcorrido desde algum evento
anterior (esquemas de intervalo). Ambos os tipos (razão e intervalo) podem ser
variáveis ou fixos (Catania, 1999).
Quando se fala de reforço por intervalo fixo (FI), entende-se um reforço que é
dado após intervalos exatamente iguais (Shaffer & Kipp, 2012). Durante o FI, o reforço
não depende da quantidade de vezes que o sujeito se comporta, mas sim do tempo
transcorrido desde a emissão de uma resposta e outra (Catania, 1999). Por exemplo, um
rato que recebe água ao pressionar a barra, só ganhará novamente depois de transcorrido
um tempo determinado desde a última vez que a pressionou, independente de quantas
vezes a pressione novamente (Skinner, 1967). Neste tipo de esquema, o organismo se
ajusta a uma frequência de respostas aproximadamente constante. A frequência de
resposta é determinada pela frequência do reforço. Quanto maior o intervalo, mais
lentamente o organismo irá responder, ou seja, em intervalos de 1 minuto o organismo
responderá mais rapidamente que em intervalos de 5 minutos e assim sucessivamente
(Skinner, 1967). Note que, independente do intervalo, o organismo ainda precisa emitir
a resposta, não em quantidades ideais, mas em momentos certos (Catania, 1999).
Skinner (1967) acrescenta que “Se o comportamento continua a ser reforçado em
intervalos fixos, intervém um outro processo. Como as respostas nunca são reforçadas
logo após o último reforço, ocorre eventualmente uma mudança (...) na qual a
frequência de resposta é baixa por um certo tempo depois de cada reforço. A frequência
eleva-se novamente quando o intervalo de tempo se escoa, o qual não pode ser
distinguido, presumivelmente, pelo organismo no intervalo no qual é reforçado.” O que
6
sugere que o organismo passa, então, a estabelecer uma noção temporal, diminuindo sua
frequência de resposta durante o período de ausência de reforço e aumentando-a
significativamente quando o intervalo está se aproximando ao fim.
Para evitar a baixa probabilidade de resposta logo após o reforço do organismo
que se mantém em FI, Skinner (1967) sugere o esquema de intervalo variável (VI).
Neste esquema, ao em vez de reforçar o organismo a cada 5 minutos, por exemplo,
reforça-o a cada 5 minutos em média. Variam-se os intervalos, ocasionalmente
trocando-os por segundos ou até pelo dobro de tempo inicial. Este esquema gera uma
emissão de resposta constante e sem alterações de frequências, ou até mesmo sem
pausas durante o intervalo de um reforço a outro. Veja que, se o organismo não adquire
uma noção temporal de quando vai adquirir o reforço, comporta-se de maneira
uniforme. Este esquema, portanto, acaba gerando uma taxa de respostas maior e com
uma probabilidade de extinção muito mais restrita. Já que o organismo se adapta a não
saber quando terá o reforço, num processo de extinção terá uma resistência maior que
teria se tivesse passado por um processo de reforçamento contínuo.
Por outro lado, há o reforço por esquema de razão. Este gera um resultado
totalmente diferente, pois o reforço depende da quantidade de respostas do organismo
(Skinner, 1967). Em razão fixa (FV), o reforço é dado a cada número predeterminado de
respostas. Este tipo de reforço é bastante utilizado por empregadores: na indústria é
conhecido como pagamento por peça ou por tarefa (Skinner, 1967). Este tipo de reforço
gera uma frequência de respostas muito alta, visto que depende justamente deste
número para que o sujeito seja reforçado (et. Catania, 1999; Skinner, 1967). Um rato
que precisa pressionar a barra 5 vezes para conseguir uma gota de água irá pressiona-la
com uma frequência alta para ganhar cada vez mais água. Sem interferências externas, a
frequência atinge a valores mais altos possíveis. Este tipo de reforçador permite,
também, que cada razão seja substituída por uma maior ainda. Ou seja, um funcionário
de uma empresa de embalagens que recebe uma quantia x a cada 10 embalagens que
confecciona, continuará mantendo sua alta produtividade se a empresa mudar a meta
para 15 embalagens pela mesma quantia x de dinheiro. Ou, no caso do rato que recebia
água a cada 5 vezes que pressionava a barra, continuará pressionando em larga escala
mesmo que receba água somente após 10 respostas (Skinner, 1967).
Todavia, o sujeito em esquema FR também, como no esquema FI, sofre de uma
“pausa pós-reforço” (Catania, 1999), passando por um período em que sua
probabilidade de resposta se torna baixa por entender que a trajetória para conseguir um
7
segundo reforço será fatigante. Este efeito se acentua com razões maiores. Entretanto, a
cada resposta emitida, a resposta subsequente é gerada mais rapidamente como em uma
“aceleração uniforme” (Skinner, 1967).
A extinção do reforço por esquema de razão é dada por um período de alta
frequência de resposta inicialmente. Quando o número de resposta chega no que antes
seria apropriado para adquirir o reforço e, entretanto, o reforço não é dado, o organismo
mantém sua alta frequência de resposta por um período até que para de maneira abrupta
(Keller, 1968).
Por último, há o esquema de reforço por razão variável (VR), determinado por
um reforço por número de respostas variáveis. Enquanto uma vez o sujeito é reforçado
após 5 emissões de comportamento, para conseguir um segundo reforço precisará emitir
10 respostas e assim por diante. Mantém-se uma “média” da variável, entretanto o
organismo não estabelece metas concretas sobre quanto se comportar para ganhar o
reforço. Bem como na FR, a VR gera uma alta taxa de resposta. O organismo tende a se
comportar com uma frequência muito alta visando o maior número de reforços. Este
tipo de esquema também passa pela “pausa pós reforço” (Catania, 1999) e este efeito se
acentua quando a razão é maior. A extinção após reforço em VR se dá, também, por
uma alta frequência e uma parada abrupta da taxa de respostas (Catania, 1999).
Além do mais, estudos em laboratório mostraram que para esquemas de razão há
uma razão limite para manter cada tipo de comportamento em cada tipo de organismo.
Se a razão for muito alta o organismo pode passar por um alto grau de extinção
denominado “abulia” (Skinner, 1967), deixando de se comportar para adquirir o reforço.
Esta extinção se dá por uma “fadiga mental” e é apresentada por longos períodos sem
emissão de resposta. Skinner acrescenta que “Nestes esquemas de reforço por razão, a
exaustão pode ocorrer devido à falta de um mecanismo de auto-regulação. No reforço
em intervalo, por outro lado, a qualquer tendência para extinguir-se opõe-se ao fato de
que quando a frequência declina, o primeiro reforço será recebido por poucas respostas.
O esquema de intervalo variável também se auto-protege: um organismo estabilizará
seu comportamento em uma determinada frequência sob qualquer amplitude de
intervalo.” Em outras palavras, os esquemas de razão, muito embora aumentem a taxa
de resposta do organismo, são mais susceptíveis a extinção em razões muito altas, o que
Catania (1999) chamou de “distensão da razão”, ao contrário dos esquemas de intervalo.
8
O presente estudo teve 3 práticas em laboratório, sendo o objetivo de cada
prática: 1- submeter o sujeito experimental a um processo de extinção após
Reforçamento Contínuo (CRF); 2- Submeter o sujeito experimental a um Esquema de
Reforço por Razão Variável (VR); e 3- Submeter o sujeito experimental a um processo
de extinção após VR.
Os objetivos finais do trabalho foram: analisar e comparar os dois processos de
extinção; analisar o processo de reforço por VR e comparar com sujeitos experimentais
que passaram por esquemas de FR (Razão Fixa), FI (Intervalo fixo) e VI (Intervalo
variável).
9
Método
Sujeito
Foi utilizado um rato que já foi submetido aos experimentos de Treino ao
Bebedouro, Modelagem e Reforçamento Contínuo (CRF), macho, da espécie Rattus
norvegicus, linhagem Wistar, com aproximadamente 90 dias de vida e pesando por
volta de 500 gramas nesta segunda parte dos experimentos. Sua água e ração são
controladas, sendo que esta última é específica para ratos. Os ratos eram privados de
água 30 horas antes do início dos experimentos. O biotério onde eles estão localizados
tem controle de temperatura a 25ºC e de luz de 12 em 12 horas, e eles são alojados em
trios, exceto nos momentos de privação, em que eles são alojados individualmente,
numa caixa plástica com maravalha.
Local
Laboratório Fred S. Keller, situado na Faculdade de Filosofia, Ciências e Letras
da Universidade de São Paulo, campus de Ribeirão Preto.
Equipamentos
Na realização dos experimentos foi utilizada a Caixa de Condicionamento
Operante (Caixa de Skinner). A Caixa de Skinner possibilita o controle das variáveis
que possam influenciar no comportamento do animal, permitindo assim a obtenção das
respostas desejadas no experimento sem a interferência de agentes externos.
Suas dimensões são de 31cmX26cmX22,5cm. Em seu interior, três paredes são
feitas de metal, mesmo metal das barras cilíndricas em formato de grade que constituem
o chão da caixa, de modo que os dejetos do animal possam ser depositados na bandeja,
forrada com jornal, que fica abaixo dela.
O teto e a porta frontal são feitos de acrílico transparente para permitir uma
melhor visualização do sujeito. Em seu interior há uma barra de metal que, quando
acionada, dá acesso à água no bebedouro. Na parte externa da caixa há o equipamento
necessário para que o bebedouro funcione: o mecanismo que leva a água até o
bebedouro e o reservatório que a contém. A Caixa de Condicionamento Operante
encontra-se dentro da caixa de isolamento acústico, que em seu interior é constituída por
isopor e espuma. Essa caixa é um cubo, com dimensões de 55cmX55cmX55cm. Para
10
controle do experimento na caixa, existe a Interface de Controle, que possui as funções
“manual automático”, cujas funções são, respectivamente, fazer com que o reforço seja
liberado por quem controla a caixa e fazer com que o reforço seja liberado pelo próprio
rato ao pressionar a barra, e os botões que liberam o reforço para o rato; marcam ainda o
número de pressões à barra e o número de gotas liberadas até então.
Procedimento
Extinção após CRF: No início da prática, o rato foi submetido a 5 minutos de CRF,
que foi o esquema de reforçamento anterior ao qual ele foi submetido. Após os 5
minutos de CRF, a interface de controle foi desligada, a fim de que o rato não obtivesse
mais o reforçador quando pressionasse a barra, quebrando a contingência entre resposta
(RPB) e consequência (obtenção de água). O objetivo da prática é, além de realizar a
quebra da contingência, verificar a variabilidade de comportamento do sujeito e a
frequência de pressão à barra em tais condições. A sessão foi finalizada após uma hora e
meia, momento em que o rato atingiu o critério de encerramento, que era ficar 10
minutos sem pressionar a barra.
Esquema intermitente de razão variável: A prática realizada na semana seguinte
abordou os Esquemas de Reforçamento Intermitente. O sujeito em questão foi
submetido ao esquema de forçamento de razão variável. Na primeira sessão, o rato foi
submetido ao CRF nos 5 minutos iniciais. Feito isso, o primeiro esquema de razão
variável foi o de razão 5 (VR5), ou seja, a média de respostas emitidas para o ganho do
reforçador (água) era igual a 5. Após uma série de VR5, o rato foi submetido ao
esquema de razão 7 (VR7), e por fim foi submetido a razão 10 (VR10), a qual foi
aplicada durante 30 minutos. A primeira sessão terminou depois de 40 minutos, após o
critério de encerramento (30 minutos em VR10) ter sido atingido.
Como a primeira sessão teve a finalidade da aprendizagem do comportamento, a
segunda sessão teve como objetivo reforçá-lo. Assim, o rato foi submetido a 1 hora de
esquema de reforço de razão variável na razão 10 (VR10). O objetivo dessa prática é
perceber o aumento na frequência de respostas emitidas pelo sujeito e também uma
maior resistência à extinção posterior. Após o critério de encerramento ser atingido, que
era submeter o rato a 1 hora de VR10, a sessão foi finalizada.
11
Extinção após esquema de razão variável VR10: A terceira e última prática abordada
nesse relatório foi a segunda extinção de comportamento, feita agora para extinguir o
comportamento do sujeito nos esquemas de reforço intermitente. A prática foi feita de
maneira semelhante a extinção após CRF, porém foram feitos 5 reforços no esquema de
reforçamento ministrado anteriormente, o esquema de razão 10 (VR10). O objetivo da
prática foi quebrar a contingência entre resposta e consequência e observar o
comportamento do sujeito no que diz respeito a variabilidade e a frequência de pressão à
barra nessas condições. A segunda prática foi encerrada aos 45 minutos, após o rato ter
atingido o critério de encerramento de ficar 10 minutos consecutivos sem pressionar a
barra.
12
Resultados
Neste estudo foram abordados os esquemas de reforço intermitentes. O sujeito
deste relatório foi submetido à prática de reforçamento intermitente de razão variável
(VR). Há ainda três esquemas: razão fixa (FR), intervalo variável (VI) e intervalo fixo
(FI). Para análise do esquema de intervalo variável (VI), foram avaliados os dados do
sujeito experimental da dupla Schiavon & Correa (2013). O esquema de razão fixa (FR)
foi analisado a partir do sujeito experimental de Gil (2013), e a análise do esquema de
intervalo fixo (FI) foi feita a partir do sujeito da dupla Barbosa & Simonassi (2013).
Foram feitas curvas acumuladas que permitem identificar as diferenças de
comportamento de RPB dos sujeitos nos seus determinados esquemas. As observações
foram feitas na segunda sessão de cada esquema, com duração de 60 minutos.
0
100
200
300
400
500
600
700
1 5 9 13 17 21 25 29 33 37 41 45 49 53 57
Nú
me
ro d
e r
esp
ost
as
Tempo (min)
0
100
200
300
400
500
600
700
800
900
1000
1 5 9 13 17 21 25 29 33 37 41 45 49 53 57
Nú
me
ro d
e r
esp
ost
as
Tempo (min)
0
100
200
300
400
500
600
700
1 5 9 13 17 21 25 29 33 37 41 45 49 53 57
Nú
me
ro d
e r
esp
ost
as
Tempo (min)
0
100
200
300
400
500
600
700
800
900
1000
1 5 9 131721252933374145495357
Nú
me
ro d
e r
esp
ost
as
Tempo (min)
13
Da esquerda para a direita, de cima para baixo:
Figura 1. Esquema de VI 60 (Schiavon & Correa, 2013)
Figura 2. Esquema de FI 60 (Barbosa & Simonassi, 2013)
Figura 3. Esquema de VR 10 (Rebessi & Marmorato, 2013)
Figura 4. Esquema de FR 10 (Gil, 2013)
A observação das taxas de RPB nos esquemas foi feita nas folhas de registros.
Através delas é possível observar o nítido aumento das RPBs do sujeito, indicando que
o esquema foi aprendido. A figura 5 mostra a comparação entre as taxas de resposta de
pressão à barra da segunda sessão, que teve duração de 60 minutos, nos quatro
esquemas de reforçamento intermitente, a partir da análise de dados das duplas citadas
anteriormente.
Figura 5. Taxas de RPB da segunda sessão dos quatro esquemas de reforçamento
intermitentes.
Esquemas intermitentes Taxa
Intervalo fixo (FI60) 10,2
Intervalo variável (VI60) 11,0
Razão fixa (FR10) 15,8
Razão variável (VR10) 14,8
O sujeito experimental deste relatório foi submetido ao esquema de
reforçamento intermitente de razão variável. Na primeira sessão, o sujeito foi submetido
aos esquemas de VR5 (4 minutos), VR7 (6 minutos) e por último VR10 (30 minutos). A
figura 6 mostra as taxas de resposta em cada uma das razões.
Figura 6. Taxas de RPB na primeira sessão do esquema de razão variável.
Razão do esquema Taxa de RPB
VR5 12,25
VR7 11,6
VR10 15,6
14
Na segunda sessão, o sujeito experimental foi submetido a 60 minutos no
esquema de razão variável VR10, e sua taxa de resposta ao final da sessão foi uma
média de 14,8 RPB por minuto.
Outra prática abordada neste relatório foi a extinção da resposta de pressão à
barra reforçada anteriormente pelo Esquema de Reforçamento Contínuo (CRF). A
figura 7 mostra o número de respostas de pressão à barra (RPB) aplicadas pelo sujeito
ao longo da sessão, que durou 89 minutos. É possível observar através desta figura que
o rato parou de pressionar a barra a partir dos 80 minutos, com o critério de
encerramento de passar 10 minutos consecutivos sem pressionar a barra.
Figura 7. Curva acumulada de RPB na extinção pós CRF.
Após os esquemas de reforçamento intermitente, foi feita a segunda extinção da
resposta de pressão à barra (RPB), porém agora, no caso do sujeito deste relatório, para
extinguir a resposta de pressão à barra no esquema de razão variável 10 (VR10). A
sessão durou 49 minutos, sendo que o critério de encerramento foi o fato do rato ficar
10 minutos consecutivos sem pressionar a barra. É possível observar através da figura 8
que o rato parou de pressionar a barra aos 40 minutos.
Figura 8. Curva acumulada de RPB na extinção pós VR10.
0
50
100
150
200
250
300
1 5 9 13 17 21 25 29 33 37 41 45 49 53 57 61 65 69 73 77 81 85 89
Nú
me
ro d
e r
esp
ost
as
Tempo (min)
15
A partir da análise das taxas de resposta das duas extinções, é possível notar as
diferenças entre as taxas do começo e do final da sessão, e a diferença entre os tipos de
extinção. A figura 9 mostra a extinção do CRF e a figura 10 mostra a extinção depois do
esquema de razão variável VR10.
Figura 9. Taxa de RPB na extinção após CRF.
Minutos Taxa
10 primeiros minutos 5,9
20 últimos minutos 2,8
Figura 10. Taxa de RPB na extinção após esquema intermitente de VR10.
Minutos Taxa
10 primeiros minutos 4,5
20 últimos minutos 3,4
0
20
40
60
80
100
120
140
160
180
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49
Nú
me
ro d
e r
esp
ost
as
Tempo (min)
16
Discussão
Os objetivos do presente estudo foram analisar o sujeito experimental (um rato
Wistar) em condições de reforçamento intermitente por esquema de razão variável
(VR); comparar seu desempenho com sujeitos experimentais de outros trabalhos afins
que passaram por esquemas de intervalo varíavel (VI), intervalo fixo (FI) e razão fixa
(FR); e analisar e comparar o desempenho do sujeito experimental em uma extinção
após CRF (reforçamento contínuo) e extinção após reforçamento por VR.
Com os resultados expostos na figura 6 podemos observar que a taxa de resposta
do sujeito experimental perante o esquema de reforçamento VR foi alta. Iniciando com
VR5, em que o sujeito foi reforçado a partir de uma razão com média 5, obteve-se uma
taxa de 12,25 em 4 minutos. Logo, a média da VR foi 7, mantendo a taxa alta em 11,6
por 6 minutos. Por último, foi realizada a VR10, que se manteve por 30 minutos com a
maior taxa de resposta, 15,6. Este resultado vai de encontro com as observações da
literatura consultada (et. Skinner, 1967; Keller, 1968; Catania, 1999), em que fica clara
a eficácia do reforçamento por VR em manter altas frequências de respostas. Skinner
(1967) aponta que, dentro de um reforçamento por esquema de razão, pode-se mudar a
razão (aumenta-la) e manter a alta taxa de resposta. Isto se verifica neste estudo, visto
que ao mudar de VR5 para VR7 e VR10, a taxa de resposta não só se manteve alta,
como também aumentou durante a média de razão maior (VR10).
Nas figuras 1 e 2 , temos curvas acopladas do comportamento emitido por um
sujeito experimental em um Intervalo Variável de média 60 segundos (Schiavon &
Correa, 2013) e um sujeito experimental em um esquema de Intervalo Fixo de 60
segundos (Barbosa & Simonassi, 2013). Nos dois gráficos pode-se observar que as
respostas foram emitidas de maneira uniforme, sem grandes picos de maior ou menor
frequência. Este dado já era esperado, visto que, em um esquema de reforço por
intervalo, a frequência de resposta é determinada pela frequência do reforço
inversamente, ou seja, quanto menor o intervalo, maior a frequência de respostas, ou,
quanto maior o intervalo, menor a frequência de respostas (Skinner, 19967).
Entretanto, com o decorrer do tempo, observa-se que no gráfico de FI (figura 2)
houve pequenas oscilações mais nítidas que o gráfico de VI (figura 1). Isto se deve à
aquisição de noção temporal do sujeito experimental que, ao em vez de emitir a mesma
taxa de respostas ao longo do intervalo, passou a se comportar com maior frequência no
17
final do intervalo e menor frequência logo após o reforço (Skinner, 1967). Já em um
reforço por VI, a frequência permanece uniforme, pois o organismo não adquire uma
noção temporal e, portanto, mantém seu comportamento constante (Skinner, 1967).
Nas figuras 3 e 4, observam-se gráficos de curva acoplada do comportamento
emitido pelo sujeito experimental deste estudo em um esquema de reforço em Razão
Variável de razão média 10 (Rebessi & Marmorato, 2013) e de um sujeito experimental
em um esquema de reforço em Razão Fixa de razão 10 (Gil, 2013). Nas duas curvas
pode-se notar a alta frequência de resposta em função do tempo. Como em esquemas de
razão o reforço depende do quanto o organismo se comporta e não quando, o mesmo
tende a emitir respostas com uma maior frequência para adquirir mais reforços (Skinner,
1967). Na figura 3, observa-se uma frequência alta e constante. A uniformidade da
curva assemelha-se do Intervalo Variável (figura 1), porém com uma frequência maior.
Isto também é apresentado na literatura consultada (Catania, 1999), como o organismo
não adquire noção temporal ou de quantidade durante estes dois esquemas de
reforçamento, ele tende a se comportar de maneira constante para atingir seu objetivo
(adquirir o reforço), entretanto, durante a VR nota-se que o reforço é adquirido mais
rapidamente com o maior número de respostas, o que não ocorre em VI.
Com a figura 5, conclui-se que a taxa de resposta é maior em esquemas de razão.
Isto se deve a alta frequência de resposta que ocorrem nestes esquemas, como já
apontado pela literatura consultada (et. Skinner, 19967; Keller, 1968; Catania, 1999;
Shaffer & Kipp, 2012).
Em ambos os experimentos de extinção, o sujeito experimental apresentou
momentos de estresse emocional, em que se coçava de maneira agressiva chegando a se
machucar. Isto se deve ao que Skinner (1967) chamou de “frustração ou cólera”, que
ocorre quando o reforço se faz ausente mesmo depois de um grande número de
respostas.
A figura 7 representa a curva acumulada de RPB da extinção após CRF, nela
observa-se uma frequência de respostas inicialmente estáveis, com pequenos momentos
de pausa, mas logo com retomadas na emissão da resposta. A frequência do
comportamento se elevou e pausou sucessivamente. Ao chegar ao fim, o
comportamento passou a ter pausas mais longas, até atingir o critério de 10 minutos sem
emissão. É visível que a extinção ocorreu de maneira lenta: o declínio da frequência foi
18
devagar e alternado com picos de maior frequência, como foi apontado pela literatura
consultada (et. Skinner, 1967; Catania, 1999).
Na figura 8, por sua vez, é representada o processo de extinção após um
reforçamento por VR. Na curva acumulada, podemos observar que o comportamento se
manteve frequente no inicio e não foi alternado com pausas sucessivas (como ocorreu
com a extinção após o CRF). O comportamento se manteve até ter uma pausa, uma
volta em sua frequência e, enfim, parou de maneira abrupta. De acordo com Keller
(1968), um organismo em processo de extinção após um reforço por esquema de razão
tende a manter sua taxa de resposta alta. Mesmo quando chega em um nível de esforço
que julga ser o necessário para receber o reforço, mantém uma alta frequência de
resposta até que para abruptamente. O que significa que o experimento em questão está
de acordo com a literatura consultada. Este padrão de extinção após esquema de razão
também se encontra nos trabalhos de Catania (1999) e Skinner (1967).
19
Referências
Gil, M (2013). Extinção após CRF, Reforço Intermitente e Extinção após Esquema de
Razão Fixa em Rato Wistar. Ribeirão Preto: FFLCRP USP.
Côrrea, J. H. & Schiavon, L. (2013). Esquemas de Reforço Intermitente e Extinção em
um Rato Wistar. Ribeirão Preto: FFCLRP USP.
Barbosa, D & Simonassi, S. (2013). Extinção e Esquemas de Reforçamento Intermitente
em Rato Wistar. Ribeirão Preto: FFCLRP USP.
Baum, W. M. (2008). Compreender o behaviorismo: comportamento, cultura e
evolução (M. T. A. Silva et al., trad.) Porto Alegre: Artmed.
Skinner, B. F. (2003). Ciência e comportamento humano. (J. C. Todorov, trad.). São
Paulo: Martins Fontes. (Trabalho original publicado em 1953).
Catania, A. C. (1999). Aprendiagem: Comportamento, Linguagem e Cognição. Porto
Alegre: Artmed.
Shaffer, D. R. & Kipp, K. (2012). Psicologia do Desenvolvimento: Infância e
Adolescência. São Paulo: Cengage Learning.
Top Related