Conceitos de reforço intermitente e etc

Universidade de São Paulo

Faculdade de Filosofia, Ciências e Letras de Ribeirão Preto

Isabela Pizzarro Rebessi

Paola Chaves Marmorato

Extinção e Esquemas de Reforço Intermitente: uma análise experimental e

comparativa em rato Wistar

Ribeirão Preto

2013

2

Sumário

Introdução......................................................................................................................3

Método.............................................................................................................................9

Resultados........................................................................................................... 12

Discussão.............................................................................................................. 16

Referências............................................................................................................ 19

3

Introdução

Para melhor compreender as pesquisas dentro da Análise do Comportamento, é

importante entender os conceitos principais que embasam tal abordagem. Em 1935,

Skinner propôs que existem dois tipos de condicionamento (Keller, 1968). O primeiro,

classificado como “Condicionamento Respondente” (apresentado pelo trabalho de

Pavlov) ocorre por meio do emparelhamento de dois estímulos, sendo um estímulo

reflexo (incondicionado) e o outro um estímulo neutro que, após determinado tempo de

emparelhamento, adquire propriedades eliciadores da resposta mesmo na ausência do

estímulo incondicionado (Baum, 2008). Já o segundo, é classificado por Skinner como

“Condicionamento Operante”, em que uma ação (comportamento) sobre o meio se torna

mais ou menos provável de ser repetida de acordo com suas consequências para o

organismo (Skinner, 1967).

O Condicionamento Operante é, para Skinner, a base da construção da maioria

dos comportamentos e hábitos. Tanto animais quanto seres humanos estariam aptos a

repetirem comportamentos que geram resultados satisfatórios e a suprimirem aqueles

que geram resultados insatisfatórios ou desfavoráveis. Como, por exemplo, no

experimento com a caixa de Skinner, um rato com sede ou faminto que pressiona a

barra como uma resposta voluntária (comportamento operante) e recebe água ou

alimento como consequência (reforçador), se torna apto a repetir o procedimento outras

vezes. Já, por outro lado, se ao pressionar a barra (comportamento operante) o rato

recebesse um choque (punidor), a probabilidade de pressionar a barra novamente

diminuiria. (Shaffer & Kipp, 2012).

Em outras palavras, o condicionamento operante ocorre quando um

comportamento voluntário emitido gera consequências que aumentam (reforçadores) ou

diminuem (punidores) a probabilidade de uma nova ocorrência do mesmo (Catania,

1999).

Há, também, uma classificação de reforçadores e punidores: Reforçadores

podem ser positivos (quando algo agradável é dado ao ator) ou negativos (quando algo

aversivo é retirado do ator). Da mesma forma, punidores podem ser positivos (quando

algo aversivo é dado ao ator) ou negativos (quando algo agradável é retirado do ator).

Em suma, o comportamento é modelado por reforçadores e punidores. (et. Skinner,

1967; Keller, 1968; Catania, 1999; Shaffer & Kipp, 2012).

4

É importante ressaltar que um comportamento que outrora fora reforçado pode

ser extinto na ausência do reforçador, isto se deve a um conceito denominado “extinção

operante”. Em outras palavras o sujeito para de responder quando o reforço não é mais

adquirido. Skinner (1967) argumenta que “Em geral, quando nos empenhamos em

comportamentos que ´não compensam` encontramo-nos menos inclinados a

comportamentos semelhantes no futuro. Se perdemos uma caneta-tinteiro, passamos a

procura-la cada vez menos no bolso em que costumeiramente era guardada. Se não

obtivermos respostas a ligações telefônicas eventualmente deixamos de telefonar. Se o

piano está desafinado, tocamos cada vez menos. Se o rádio torna-se barulhento ou se os

programas pioram, paramos de ouvir.”. Entretanto, a extinção operante ocorre de

maneira mais lenta que o condicionamento operante. Numa curva de taxa de resposta, o

declínio da frequência do comportamento é visivelmente lento e, inclusive, pode ser

alternado com picos de maior frequência do mesmo (Skinner, 1967). Durante a extinção

podem ocorrer reações que Skinner denominou como “frustração ou cólera”, que são

definidos como “violentos comportamentos emocionais” pela frustração da falta do

reforçador. Um adulto que, por exemplo, tenta abrir uma gaveta e não consegue, pode

parar de tentar, mas também pode golpear o tampo da mesa como uma resposta

emocional de sua frustração. (Skinner, 1967).

A extinção é, sem dúvida, uma ferramenta importante e efetiva para remover um

comportamento do repertório de um indivíduo sem se utilizar de métodos aversivos

(punição), no entanto, o processo de extinção depende da história do condicionamento

(Skinner, 1967). Se apenas algumas respostas foram reforçadas, a extinção pode se dar

de maneira mais rápida e fácil. Se, por outro lado, o condicionamento foi mais intenso, a

extinção se dará de maneira lenta e árdua (Skinner, 1967).

Para melhor entender o processo de extinção, é preciso entender os tipos de

esquemas de reforço. Reforçadores podem ser apresentados de maneira contínua

(quando o reforço é dado para toda vez que o comportamento é emitido) ou de maneira

intermitente (quando o reforço não é dado em determinadas condições em que o

comportamento é emitido) (Shaffer & Kipp, 2012). Como é possível deduzir, grande

parte do comportamento da vida cotidiana é reforçado apenas intermitentemente

(Skinner, 1967). Uma dada consequência reforçadora pode não depender apenas do

comportamento operante, mas sim de mais uma série de eventos não facilmente

previsíveis. Os reforços característicos da indústria e educação, por exemplo, são quase

5

sempre intermitentes, visto que não é praticável controlar o comportamento pelo reforço

de cada resposta (Skinner, 1967). Como exemplificação cotidiana, podemos observar

quando se liga a um amigo que não tem uma secretária eletrônica e não atenda naquele

instante: a probabilidade de obter uma resposta mais tarde vai depender do momento e

não do número de ligações. Para conquistar o reforço (ser atendido), portanto, não

depende exclusivamente do comportamento de ligar, mas também de outros eventos

imprevisíveis (o amigo estar em casa ou disponível, por exemplo). O que indica que o

comportamento no cotidiano não é moldado apenas por reforçadores contínuos, mas,

principalmente, por esquemas de reforço (Catania, 1999).

Como esquemas de reforço básicos, podemos citar: aqueles em que uma resposta

é reforçada depois de algum número de respostas (esquemas de razão); e aqueles em

que uma resposta só é reforçada após um tempo transcorrido desde algum evento

anterior (esquemas de intervalo). Ambos os tipos (razão e intervalo) podem ser

variáveis ou fixos (Catania, 1999).

Quando se fala de reforço por intervalo fixo (FI), entende-se um reforço que é

dado após intervalos exatamente iguais (Shaffer & Kipp, 2012). Durante o FI, o reforço

não depende da quantidade de vezes que o sujeito se comporta, mas sim do tempo

transcorrido desde a emissão de uma resposta e outra (Catania, 1999). Por exemplo, um

rato que recebe água ao pressionar a barra, só ganhará novamente depois de transcorrido

um tempo determinado desde a última vez que a pressionou, independente de quantas

vezes a pressione novamente (Skinner, 1967). Neste tipo de esquema, o organismo se

ajusta a uma frequência de respostas aproximadamente constante. A frequência de

resposta é determinada pela frequência do reforço. Quanto maior o intervalo, mais

lentamente o organismo irá responder, ou seja, em intervalos de 1 minuto o organismo

responderá mais rapidamente que em intervalos de 5 minutos e assim sucessivamente

(Skinner, 1967). Note que, independente do intervalo, o organismo ainda precisa emitir

a resposta, não em quantidades ideais, mas em momentos certos (Catania, 1999).

Skinner (1967) acrescenta que “Se o comportamento continua a ser reforçado em

intervalos fixos, intervém um outro processo. Como as respostas nunca são reforçadas

logo após o último reforço, ocorre eventualmente uma mudança (...) na qual a

frequência de resposta é baixa por um certo tempo depois de cada reforço. A frequência

eleva-se novamente quando o intervalo de tempo se escoa, o qual não pode ser

distinguido, presumivelmente, pelo organismo no intervalo no qual é reforçado.” O que

6

sugere que o organismo passa, então, a estabelecer uma noção temporal, diminuindo sua

frequência de resposta durante o período de ausência de reforço e aumentando-a

significativamente quando o intervalo está se aproximando ao fim.

Para evitar a baixa probabilidade de resposta logo após o reforço do organismo

que se mantém em FI, Skinner (1967) sugere o esquema de intervalo variável (VI).

Neste esquema, ao em vez de reforçar o organismo a cada 5 minutos, por exemplo,

reforça-o a cada 5 minutos em média. Variam-se os intervalos, ocasionalmente

trocando-os por segundos ou até pelo dobro de tempo inicial. Este esquema gera uma

emissão de resposta constante e sem alterações de frequências, ou até mesmo sem

pausas durante o intervalo de um reforço a outro. Veja que, se o organismo não adquire

uma noção temporal de quando vai adquirir o reforço, comporta-se de maneira

uniforme. Este esquema, portanto, acaba gerando uma taxa de respostas maior e com

uma probabilidade de extinção muito mais restrita. Já que o organismo se adapta a não

saber quando terá o reforço, num processo de extinção terá uma resistência maior que

teria se tivesse passado por um processo de reforçamento contínuo.

Por outro lado, há o reforço por esquema de razão. Este gera um resultado

totalmente diferente, pois o reforço depende da quantidade de respostas do organismo

(Skinner, 1967). Em razão fixa (FV), o reforço é dado a cada número predeterminado de

respostas. Este tipo de reforço é bastante utilizado por empregadores: na indústria é

conhecido como pagamento por peça ou por tarefa (Skinner, 1967). Este tipo de reforço

gera uma frequência de respostas muito alta, visto que depende justamente deste

número para que o sujeito seja reforçado (et. Catania, 1999; Skinner, 1967). Um rato

que precisa pressionar a barra 5 vezes para conseguir uma gota de água irá pressiona-la

com uma frequência alta para ganhar cada vez mais água. Sem interferências externas, a

frequência atinge a valores mais altos possíveis. Este tipo de reforçador permite,

também, que cada razão seja substituída por uma maior ainda. Ou seja, um funcionário

de uma empresa de embalagens que recebe uma quantia x a cada 10 embalagens que

confecciona, continuará mantendo sua alta produtividade se a empresa mudar a meta

para 15 embalagens pela mesma quantia x de dinheiro. Ou, no caso do rato que recebia

água a cada 5 vezes que pressionava a barra, continuará pressionando em larga escala

mesmo que receba água somente após 10 respostas (Skinner, 1967).

Todavia, o sujeito em esquema FR também, como no esquema FI, sofre de uma

“pausa pós-reforço” (Catania, 1999), passando por um período em que sua

probabilidade de resposta se torna baixa por entender que a trajetória para conseguir um

7

segundo reforço será fatigante. Este efeito se acentua com razões maiores. Entretanto, a

cada resposta emitida, a resposta subsequente é gerada mais rapidamente como em uma

“aceleração uniforme” (Skinner, 1967).

A extinção do reforço por esquema de razão é dada por um período de alta

frequência de resposta inicialmente. Quando o número de resposta chega no que antes

seria apropriado para adquirir o reforço e, entretanto, o reforço não é dado, o organismo

mantém sua alta frequência de resposta por um período até que para de maneira abrupta

(Keller, 1968).

Por último, há o esquema de reforço por razão variável (VR), determinado por

um reforço por número de respostas variáveis. Enquanto uma vez o sujeito é reforçado

após 5 emissões de comportamento, para conseguir um segundo reforço precisará emitir

10 respostas e assim por diante. Mantém-se uma “média” da variável, entretanto o

organismo não estabelece metas concretas sobre quanto se comportar para ganhar o

reforço. Bem como na FR, a VR gera uma alta taxa de resposta. O organismo tende a se

comportar com uma frequência muito alta visando o maior número de reforços. Este

tipo de esquema também passa pela “pausa pós reforço” (Catania, 1999) e este efeito se

acentua quando a razão é maior. A extinção após reforço em VR se dá, também, por

uma alta frequência e uma parada abrupta da taxa de respostas (Catania, 1999).

Além do mais, estudos em laboratório mostraram que para esquemas de razão há

uma razão limite para manter cada tipo de comportamento em cada tipo de organismo.

Se a razão for muito alta o organismo pode passar por um alto grau de extinção

denominado “abulia” (Skinner, 1967), deixando de se comportar para adquirir o reforço.

Esta extinção se dá por uma “fadiga mental” e é apresentada por longos períodos sem

emissão de resposta. Skinner acrescenta que “Nestes esquemas de reforço por razão, a

exaustão pode ocorrer devido à falta de um mecanismo de auto-regulação. No reforço

em intervalo, por outro lado, a qualquer tendência para extinguir-se opõe-se ao fato de

que quando a frequência declina, o primeiro reforço será recebido por poucas respostas.

O esquema de intervalo variável também se auto-protege: um organismo estabilizará

seu comportamento em uma determinada frequência sob qualquer amplitude de

intervalo.” Em outras palavras, os esquemas de razão, muito embora aumentem a taxa

de resposta do organismo, são mais susceptíveis a extinção em razões muito altas, o que

Catania (1999) chamou de “distensão da razão”, ao contrário dos esquemas de intervalo.

8

O presente estudo teve 3 práticas em laboratório, sendo o objetivo de cada

prática: 1- submeter o sujeito experimental a um processo de extinção após

Reforçamento Contínuo (CRF); 2- Submeter o sujeito experimental a um Esquema de

Reforço por Razão Variável (VR); e 3- Submeter o sujeito experimental a um processo

de extinção após VR.

Os objetivos finais do trabalho foram: analisar e comparar os dois processos de

extinção; analisar o processo de reforço por VR e comparar com sujeitos experimentais

que passaram por esquemas de FR (Razão Fixa), FI (Intervalo fixo) e VI (Intervalo

variável).

9

Método

Sujeito

Foi utilizado um rato que já foi submetido aos experimentos de Treino ao

Bebedouro, Modelagem e Reforçamento Contínuo (CRF), macho, da espécie Rattus

norvegicus, linhagem Wistar, com aproximadamente 90 dias de vida e pesando por

volta de 500 gramas nesta segunda parte dos experimentos. Sua água e ração são

controladas, sendo que esta última é específica para ratos. Os ratos eram privados de

água 30 horas antes do início dos experimentos. O biotério onde eles estão localizados

tem controle de temperatura a 25ºC e de luz de 12 em 12 horas, e eles são alojados em

trios, exceto nos momentos de privação, em que eles são alojados individualmente,

numa caixa plástica com maravalha.

Local

Laboratório Fred S. Keller, situado na Faculdade de Filosofia, Ciências e Letras

da Universidade de São Paulo, campus de Ribeirão Preto.

Equipamentos

Na realização dos experimentos foi utilizada a Caixa de Condicionamento

Operante (Caixa de Skinner). A Caixa de Skinner possibilita o controle das variáveis

que possam influenciar no comportamento do animal, permitindo assim a obtenção das

respostas desejadas no experimento sem a interferência de agentes externos.

Suas dimensões são de 31cmX26cmX22,5cm. Em seu interior, três paredes são

feitas de metal, mesmo metal das barras cilíndricas em formato de grade que constituem

o chão da caixa, de modo que os dejetos do animal possam ser depositados na bandeja,

forrada com jornal, que fica abaixo dela.

O teto e a porta frontal são feitos de acrílico transparente para permitir uma

melhor visualização do sujeito. Em seu interior há uma barra de metal que, quando

acionada, dá acesso à água no bebedouro. Na parte externa da caixa há o equipamento

necessário para que o bebedouro funcione: o mecanismo que leva a água até o

bebedouro e o reservatório que a contém. A Caixa de Condicionamento Operante

encontra-se dentro da caixa de isolamento acústico, que em seu interior é constituída por

isopor e espuma. Essa caixa é um cubo, com dimensões de 55cmX55cmX55cm. Para

10

controle do experimento na caixa, existe a Interface de Controle, que possui as funções

“manual automático”, cujas funções são, respectivamente, fazer com que o reforço seja

liberado por quem controla a caixa e fazer com que o reforço seja liberado pelo próprio

rato ao pressionar a barra, e os botões que liberam o reforço para o rato; marcam ainda o

número de pressões à barra e o número de gotas liberadas até então.

Procedimento

Extinção após CRF: No início da prática, o rato foi submetido a 5 minutos de CRF,

que foi o esquema de reforçamento anterior ao qual ele foi submetido. Após os 5

minutos de CRF, a interface de controle foi desligada, a fim de que o rato não obtivesse

mais o reforçador quando pressionasse a barra, quebrando a contingência entre resposta

(RPB) e consequência (obtenção de água). O objetivo da prática é, além de realizar a

quebra da contingência, verificar a variabilidade de comportamento do sujeito e a

frequência de pressão à barra em tais condições. A sessão foi finalizada após uma hora e

meia, momento em que o rato atingiu o critério de encerramento, que era ficar 10

minutos sem pressionar a barra.

Esquema intermitente de razão variável: A prática realizada na semana seguinte

abordou os Esquemas de Reforçamento Intermitente. O sujeito em questão foi

submetido ao esquema de forçamento de razão variável. Na primeira sessão, o rato foi

submetido ao CRF nos 5 minutos iniciais. Feito isso, o primeiro esquema de razão

variável foi o de razão 5 (VR5), ou seja, a média de respostas emitidas para o ganho do

reforçador (água) era igual a 5. Após uma série de VR5, o rato foi submetido ao

esquema de razão 7 (VR7), e por fim foi submetido a razão 10 (VR10), a qual foi

aplicada durante 30 minutos. A primeira sessão terminou depois de 40 minutos, após o

critério de encerramento (30 minutos em VR10) ter sido atingido.

Como a primeira sessão teve a finalidade da aprendizagem do comportamento, a

segunda sessão teve como objetivo reforçá-lo. Assim, o rato foi submetido a 1 hora de

esquema de reforço de razão variável na razão 10 (VR10). O objetivo dessa prática é

perceber o aumento na frequência de respostas emitidas pelo sujeito e também uma

maior resistência à extinção posterior. Após o critério de encerramento ser atingido, que

era submeter o rato a 1 hora de VR10, a sessão foi finalizada.

11

Extinção após esquema de razão variável VR10: A terceira e última prática abordada

nesse relatório foi a segunda extinção de comportamento, feita agora para extinguir o

comportamento do sujeito nos esquemas de reforço intermitente. A prática foi feita de

maneira semelhante a extinção após CRF, porém foram feitos 5 reforços no esquema de

reforçamento ministrado anteriormente, o esquema de razão 10 (VR10). O objetivo da

prática foi quebrar a contingência entre resposta e consequência e observar o

comportamento do sujeito no que diz respeito a variabilidade e a frequência de pressão à

barra nessas condições. A segunda prática foi encerrada aos 45 minutos, após o rato ter

atingido o critério de encerramento de ficar 10 minutos consecutivos sem pressionar a

barra.

12

Resultados

Neste estudo foram abordados os esquemas de reforço intermitentes. O sujeito

deste relatório foi submetido à prática de reforçamento intermitente de razão variável

(VR). Há ainda três esquemas: razão fixa (FR), intervalo variável (VI) e intervalo fixo

(FI). Para análise do esquema de intervalo variável (VI), foram avaliados os dados do

sujeito experimental da dupla Schiavon & Correa (2013). O esquema de razão fixa (FR)

foi analisado a partir do sujeito experimental de Gil (2013), e a análise do esquema de

intervalo fixo (FI) foi feita a partir do sujeito da dupla Barbosa & Simonassi (2013).

Foram feitas curvas acumuladas que permitem identificar as diferenças de

comportamento de RPB dos sujeitos nos seus determinados esquemas. As observações

foram feitas na segunda sessão de cada esquema, com duração de 60 minutos.

0

100

200

300

400

500

600

700

1 5 9 13 17 21 25 29 33 37 41 45 49 53 57

Nú

me

ro d

e r

esp

ost

as

Tempo (min)

0

100

200

300

400

500

600

700

800

900

1000

1 5 9 13 17 21 25 29 33 37 41 45 49 53 57

Nú

me

ro d

e r

esp

ost

as

Tempo (min)

0

100

200

300

400

500

600

700

1 5 9 13 17 21 25 29 33 37 41 45 49 53 57

Nú

me

ro d

e r

esp

ost

as

Tempo (min)

0

100

200

300

400

500

600

700

800

900

1000

1 5 9 131721252933374145495357

Nú

me

ro d

e r

esp

ost

as

Tempo (min)

13

Da esquerda para a direita, de cima para baixo:

Figura 1. Esquema de VI 60 (Schiavon & Correa, 2013)

Figura 2. Esquema de FI 60 (Barbosa & Simonassi, 2013)

Figura 3. Esquema de VR 10 (Rebessi & Marmorato, 2013)

Figura 4. Esquema de FR 10 (Gil, 2013)

A observação das taxas de RPB nos esquemas foi feita nas folhas de registros.

Através delas é possível observar o nítido aumento das RPBs do sujeito, indicando que

o esquema foi aprendido. A figura 5 mostra a comparação entre as taxas de resposta de

pressão à barra da segunda sessão, que teve duração de 60 minutos, nos quatro

esquemas de reforçamento intermitente, a partir da análise de dados das duplas citadas

anteriormente.

Figura 5. Taxas de RPB da segunda sessão dos quatro esquemas de reforçamento

intermitentes.

Esquemas intermitentes Taxa

Intervalo fixo (FI60) 10,2

Intervalo variável (VI60) 11,0

Razão fixa (FR10) 15,8

Razão variável (VR10) 14,8

O sujeito experimental deste relatório foi submetido ao esquema de

reforçamento intermitente de razão variável. Na primeira sessão, o sujeito foi submetido

aos esquemas de VR5 (4 minutos), VR7 (6 minutos) e por último VR10 (30 minutos). A

figura 6 mostra as taxas de resposta em cada uma das razões.

Figura 6. Taxas de RPB na primeira sessão do esquema de razão variável.

Razão do esquema Taxa de RPB

VR5 12,25

VR7 11,6

VR10 15,6

14

Na segunda sessão, o sujeito experimental foi submetido a 60 minutos no

esquema de razão variável VR10, e sua taxa de resposta ao final da sessão foi uma

média de 14,8 RPB por minuto.

Outra prática abordada neste relatório foi a extinção da resposta de pressão à

barra reforçada anteriormente pelo Esquema de Reforçamento Contínuo (CRF). A

figura 7 mostra o número de respostas de pressão à barra (RPB) aplicadas pelo sujeito

ao longo da sessão, que durou 89 minutos. É possível observar através desta figura que

o rato parou de pressionar a barra a partir dos 80 minutos, com o critério de

encerramento de passar 10 minutos consecutivos sem pressionar a barra.

Figura 7. Curva acumulada de RPB na extinção pós CRF.

Após os esquemas de reforçamento intermitente, foi feita a segunda extinção da

resposta de pressão à barra (RPB), porém agora, no caso do sujeito deste relatório, para

extinguir a resposta de pressão à barra no esquema de razão variável 10 (VR10). A

sessão durou 49 minutos, sendo que o critério de encerramento foi o fato do rato ficar

10 minutos consecutivos sem pressionar a barra. É possível observar através da figura 8

que o rato parou de pressionar a barra aos 40 minutos.

Figura 8. Curva acumulada de RPB na extinção pós VR10.

0

50

100

150

200

250

300

1 5 9 13 17 21 25 29 33 37 41 45 49 53 57 61 65 69 73 77 81 85 89

Nú

me

ro d

e r

esp

ost

as

Tempo (min)

15

A partir da análise das taxas de resposta das duas extinções, é possível notar as

diferenças entre as taxas do começo e do final da sessão, e a diferença entre os tipos de

extinção. A figura 9 mostra a extinção do CRF e a figura 10 mostra a extinção depois do

esquema de razão variável VR10.

Figura 9. Taxa de RPB na extinção após CRF.

Minutos Taxa

10 primeiros minutos 5,9

20 últimos minutos 2,8

Figura 10. Taxa de RPB na extinção após esquema intermitente de VR10.

Minutos Taxa

10 primeiros minutos 4,5

20 últimos minutos 3,4

0

20

40

60

80

100

120

140

160

180

1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49

Nú

me

ro d

e r

esp

ost

as

Tempo (min)

16

Discussão

Os objetivos do presente estudo foram analisar o sujeito experimental (um rato

Wistar) em condições de reforçamento intermitente por esquema de razão variável

(VR); comparar seu desempenho com sujeitos experimentais de outros trabalhos afins

que passaram por esquemas de intervalo varíavel (VI), intervalo fixo (FI) e razão fixa

(FR); e analisar e comparar o desempenho do sujeito experimental em uma extinção

após CRF (reforçamento contínuo) e extinção após reforçamento por VR.

Com os resultados expostos na figura 6 podemos observar que a taxa de resposta

do sujeito experimental perante o esquema de reforçamento VR foi alta. Iniciando com

VR5, em que o sujeito foi reforçado a partir de uma razão com média 5, obteve-se uma

taxa de 12,25 em 4 minutos. Logo, a média da VR foi 7, mantendo a taxa alta em 11,6

por 6 minutos. Por último, foi realizada a VR10, que se manteve por 30 minutos com a

maior taxa de resposta, 15,6. Este resultado vai de encontro com as observações da

literatura consultada (et. Skinner, 1967; Keller, 1968; Catania, 1999), em que fica clara

a eficácia do reforçamento por VR em manter altas frequências de respostas. Skinner

(1967) aponta que, dentro de um reforçamento por esquema de razão, pode-se mudar a

razão (aumenta-la) e manter a alta taxa de resposta. Isto se verifica neste estudo, visto

que ao mudar de VR5 para VR7 e VR10, a taxa de resposta não só se manteve alta,

como também aumentou durante a média de razão maior (VR10).

Nas figuras 1 e 2 , temos curvas acopladas do comportamento emitido por um

sujeito experimental em um Intervalo Variável de média 60 segundos (Schiavon &

Correa, 2013) e um sujeito experimental em um esquema de Intervalo Fixo de 60

segundos (Barbosa & Simonassi, 2013). Nos dois gráficos pode-se observar que as

respostas foram emitidas de maneira uniforme, sem grandes picos de maior ou menor

frequência. Este dado já era esperado, visto que, em um esquema de reforço por

intervalo, a frequência de resposta é determinada pela frequência do reforço

inversamente, ou seja, quanto menor o intervalo, maior a frequência de respostas, ou,

quanto maior o intervalo, menor a frequência de respostas (Skinner, 19967).

Entretanto, com o decorrer do tempo, observa-se que no gráfico de FI (figura 2)

houve pequenas oscilações mais nítidas que o gráfico de VI (figura 1). Isto se deve à

aquisição de noção temporal do sujeito experimental que, ao em vez de emitir a mesma

taxa de respostas ao longo do intervalo, passou a se comportar com maior frequência no

17

final do intervalo e menor frequência logo após o reforço (Skinner, 1967). Já em um

reforço por VI, a frequência permanece uniforme, pois o organismo não adquire uma

noção temporal e, portanto, mantém seu comportamento constante (Skinner, 1967).

Nas figuras 3 e 4, observam-se gráficos de curva acoplada do comportamento

emitido pelo sujeito experimental deste estudo em um esquema de reforço em Razão

Variável de razão média 10 (Rebessi & Marmorato, 2013) e de um sujeito experimental

em um esquema de reforço em Razão Fixa de razão 10 (Gil, 2013). Nas duas curvas

pode-se notar a alta frequência de resposta em função do tempo. Como em esquemas de

razão o reforço depende do quanto o organismo se comporta e não quando, o mesmo

tende a emitir respostas com uma maior frequência para adquirir mais reforços (Skinner,

1967). Na figura 3, observa-se uma frequência alta e constante. A uniformidade da

curva assemelha-se do Intervalo Variável (figura 1), porém com uma frequência maior.

Isto também é apresentado na literatura consultada (Catania, 1999), como o organismo

não adquire noção temporal ou de quantidade durante estes dois esquemas de

reforçamento, ele tende a se comportar de maneira constante para atingir seu objetivo

(adquirir o reforço), entretanto, durante a VR nota-se que o reforço é adquirido mais

rapidamente com o maior número de respostas, o que não ocorre em VI.

Com a figura 5, conclui-se que a taxa de resposta é maior em esquemas de razão.

Isto se deve a alta frequência de resposta que ocorrem nestes esquemas, como já

apontado pela literatura consultada (et. Skinner, 19967; Keller, 1968; Catania, 1999;

Shaffer & Kipp, 2012).

Em ambos os experimentos de extinção, o sujeito experimental apresentou

momentos de estresse emocional, em que se coçava de maneira agressiva chegando a se

machucar. Isto se deve ao que Skinner (1967) chamou de “frustração ou cólera”, que

ocorre quando o reforço se faz ausente mesmo depois de um grande número de

respostas.

A figura 7 representa a curva acumulada de RPB da extinção após CRF, nela

observa-se uma frequência de respostas inicialmente estáveis, com pequenos momentos

de pausa, mas logo com retomadas na emissão da resposta. A frequência do

comportamento se elevou e pausou sucessivamente. Ao chegar ao fim, o

comportamento passou a ter pausas mais longas, até atingir o critério de 10 minutos sem

emissão. É visível que a extinção ocorreu de maneira lenta: o declínio da frequência foi

18

devagar e alternado com picos de maior frequência, como foi apontado pela literatura

consultada (et. Skinner, 1967; Catania, 1999).

Na figura 8, por sua vez, é representada o processo de extinção após um

reforçamento por VR. Na curva acumulada, podemos observar que o comportamento se

manteve frequente no inicio e não foi alternado com pausas sucessivas (como ocorreu

com a extinção após o CRF). O comportamento se manteve até ter uma pausa, uma

volta em sua frequência e, enfim, parou de maneira abrupta. De acordo com Keller

(1968), um organismo em processo de extinção após um reforço por esquema de razão

tende a manter sua taxa de resposta alta. Mesmo quando chega em um nível de esforço

que julga ser o necessário para receber o reforço, mantém uma alta frequência de

resposta até que para abruptamente. O que significa que o experimento em questão está

de acordo com a literatura consultada. Este padrão de extinção após esquema de razão

também se encontra nos trabalhos de Catania (1999) e Skinner (1967).

19

Referências

Gil, M (2013). Extinção após CRF, Reforço Intermitente e Extinção após Esquema de

Razão Fixa em Rato Wistar. Ribeirão Preto: FFLCRP USP.

Côrrea, J. H. & Schiavon, L. (2013). Esquemas de Reforço Intermitente e Extinção em

um Rato Wistar. Ribeirão Preto: FFCLRP USP.

Barbosa, D & Simonassi, S. (2013). Extinção e Esquemas de Reforçamento Intermitente

em Rato Wistar. Ribeirão Preto: FFCLRP USP.

Baum, W. M. (2008). Compreender o behaviorismo: comportamento, cultura e

evolução (M. T. A. Silva et al., trad.) Porto Alegre: Artmed.

Skinner, B. F. (2003). Ciência e comportamento humano. (J. C. Todorov, trad.). São

Paulo: Martins Fontes. (Trabalho original publicado em 1953).

Catania, A. C. (1999). Aprendiagem: Comportamento, Linguagem e Cognição. Porto

Alegre: Artmed.

Shaffer, D. R. & Kipp, K. (2012). Psicologia do Desenvolvimento: Infância e

Adolescência. São Paulo: Cengage Learning.

Conceitos de reforço intermitente e etc

Documents

Transcript of Conceitos de reforço intermitente e etc