EL EFECTO DE LAS SEÑALES EN PROGRAMAS DE REFORZAMIENTO DEMORADO: UNA REVISIÓN CONTEMPORÁNEA...

Enseñanza e Investigación en PsicologíaConsejo Nacional para la Enseñanza e Investigación en Psicología [email protected]: 0185-1594 MÉXICO

2004 Marco Antonio Pulido / Nuria Lanzagorta /

Enrique Morán / Alejandra Reyes / Mariana Rubí EL EFECTO DE LAS SEÑALES EN PROGRAMAS DE REFORZAMIENTO DEMORADO:

UNA REVISIÓN CONTEMPORÁNEA Enseñanza e Investigación en Psicología, julio-diciembre, año/vol. 9, número 002

Universidad Veracruzana Xalapa, México

pp. 321-339

mailto:[email protected]

www.redalyc.com

ENSEÑANZA E INVESTIGACIÓN EN PSICOLOGÍA VOL. 9, NUM. 2: 321-339 JULIO-DICIEMBRE, 2004

EL EFECTO DE LAS SEÑALES EN PROGRAMAS DE REFORZAMIENTO DEMORADO: UNA REVISIÓN CONTEMPORÁNEA

Effect of signals in delayed reinforcement schedules:

A contemporary review

Marco Antonio Pulido, Nuria Lanzagorta, Enrique Morán, Alejandra Reyes y Mariana Rubí Universidad Intercontinental1

RESUMEN

Diversos estudios han demostrado que los efectos decrementales de separar la respuesta procuradora del reforzador pueden diluirse si una señal exteroceptiva ocurre durante el intervalo de demora. En este trabajo se presenta una revisión de experimentos contemporáneos, tanto de orientación conductual como cogni-tiva, sobre los efectos de la demora señalada. Las principales conclusiones de la revisión fueron que los estudios de orientación cognitiva carecen de los grupos de control apropiados, y, por otro lado, que los estudios de orientación conduc-tual carecen de las extensiones paramétricas necesarias para evaluar adecua-damente las diferentes teorías desarrolladas para explicar el fenómeno.

Indicadores: Demora señalada; Teorías cognitivas y conductuales.

ABSTRACT

Different studies have showed that delay gradients are less steep when a sig-nal occurs during the delay interval. This paper reviews a number of contem-porary studies on the signaled of delay reinforcement, and includes both cogni-tively and behaviorally oriented studies. The review showed that most of the cognitive studies lack appropriate control groups; on the other hand, most of the behaviorally oriented studies lack appropriate parametric extensions.

1 Laboratorio de Condicionamiento Operante, Av. Universidad 1330, Edificio A, 1102, Colo-nia del Carmen Coyoacán, 04100 México, D.F., tel. 5555-738544, exts. 1411 y 3325, correo electrónico: [email protected]. Artículo recibido el 18 de abril y aceptado el 12 de junio de 2003.


322

These deficiencies make it difficult to choose amongst the different theories developed to explain the effects of the signaled of delay reinforcement.

Keywords: Signaled delay of reinforcement; Cognitive and behavioral theories.

El asociacionismo y la reflexología del siglo XIX tuvieron una influen-cia importante sobre la investigación y la teoría del aprendizaje de inicios del siglo XX. Tanto en el asociacionismo como en la reflexolo-gía— es decir, dentro de lo que se conoce como teorías conexionistas del aprendizaje (Baum, 1995)— predominaba la idea de que los even-tos ambientales y conductuales pueden dividirse en unidades discre-tas (ideas, sensaciones, estímulos, respuestas, etc.) para su estudio. Esta forma de analizar los fenómenos psicológicos llevó forzosamente a plantear diferentes hipótesis acerca de la forma en que los eventos discretos pueden asociarse para formar “ideas complejas” (dentro del asociacionismo) o largas cadenas de comportamiento (dentro de la reflexología). Una de las hipótesis propuestas para explicar la forma en que eventos discretos pueden llegar a unirse es la contigüidad temporal. De acuerdo con esta hipótesis, dos eventos discretos pue-den asociarse si el intervalo temporal entre ambos es “breve” (Pavlov, 1927).

La hipótesis de la contigüidad está presente en dos investigado-res de gran importancia para el desarrollo del análisis experimental de la conducta: Thorndike y Pavlov. Así, resulta comprensible que en el trabajo seminal de Skinner (1938) aparezca la separación entre la respuesta procuradora y el reforzador (en adelante demora de refor-zamiento ) como variable independiente en varios experimentos.

Una de las formas más comunes de explorar los efectos de la de-mora de reforzamiento es utilizando programas tándem de dos componentes. Sizemore y Lattal (1977, 1978), por ejemplo, sometie-ron palomas a programas tándem IV 60"-TF 3", donde el TF funciona como intervalo de demora que separa la respuesta procuradora del reforzador. En arreglos como el descrito pueden ocurrir respuestas durante el intervalo de demora, por lo que se les suele denominar “procedimientos de demora variable”. Con la finalidad de mantener constante el intervalo de demora, es posible sustituir el TF por un RDO, en el cual las respuestas que ocurren durante la demora reini-


323

cian dicho intervalo. Por razones evidentes, la sustitución del TF por un RDO produce lo que se conoce como “programa de demora fija.”

Además de variar la posibilidad de que ocurran o no respuestas durante los intervalos de demora, también es posible señalar dicho intervalo al organismo mediante un estímulo exteroceptivo. Por ejem-plo, Ávila y Bruner (1995) expusieron ratas a programas encadenados IA 30"-TF 60". En dichos programas, el intervalo de TF se señaló me-diante la activación de un tono auditivo. En general, procedimientos como el descrito reciben el nombre de “programas de demora señala-da”; en consecuencia, estudios como los descritos de Sizemore y Lat-tal (1977, 1978) reciben el nombre de “programas de demora no se-ñalada”.

Un hallazgo bien documentado dentro del análisis experimental es el de que la demora disminuye el valor del reforzador; el efecto de la demora es más notorio conforme aumenta la separación entre la respuesta y el reforzador. A la relación inversa entre la separación respuesta-reforzador y el valor del reforzador se le conoce como “gra-diente de demora” (Hull, 1952). Un segundo hallazgo bastante docu-mentado en la literatura sobre demora de reforzamiento es que pre-sentar señales exteroceptivas durante el intervalo que separa la res-puesta del reforzador (es decir, el uso de procedimientos de demora señalada) modifica la forma del gradiente de demora. El resultado más habitual es que la conducta se mantenga en niveles similares a los encontrados con reforzamiento inmediato cuando se utilizan pro-cedimientos de demora señalada (Spence, 1956).

Los efectos de la demora señalada sobre el gradiente de demora fueron de gran interés para teóricos del aprendizaje como Clark Hull y Kenneth Spence. Para estos investigadores, cuyos argumentos teó-ricos son esencialmente conexionistas, resultaba difícil explicar el comportamiento de los roedores que recorrían laberintos y cuya con-ducta ocurría principalmente en ausencia del reforzador primario. Spence (1947) resolvió el problema al recurrir al concepto de “refor-zador secundario” o “condicionado”. De acuerdo con este concepto, las diferentes señales exteroceptivas del recorrido en el laberinto se han asociado con alimento (el reforzador primario); así, la conducta del sujeto se mantiene durante el camino debido a que va siendo re-


324

forzada de forma inmediata por reforzadores condicionados. En una serie de elegantes experimentos, Perkins (1947) evaluó la hipótesis de Spence midiendo la ejecución de roedores en laberintos rotados. Al rotar la orientación del laberinto de un ensayo a otro, las pistas y señales luminosas que podían funcionar como reforzadores condicio-nados cambiaban también. En congruencia con la hipótesis de Spen-ce (1947), la ejecución de los su-jetos se deterioró al rotar los laberin-tos, en comparación con aquellos gru-pos experimentales en los cua-les el laberinto no se cambió de posición.

El hallazgo de que la ejecución bajo condiciones de demora se facilita al intercalar señales durante el intervalo que separa la res-puesta del reforzador se ha replicado con diferentes especies anima-les y

procedimientos experimentales. Los resultados sugieren que el hallazgo posee considerable generalidad (Azzi, Fix, Keller y Rocha e Silva, 1964; Ferster, 1953; Lattal, 1984, y otros).

Los programas de demora señalada y no señalada han recibido durante décadas la atención de los investigadores interesados en los fenómenos de aprendizaje. De hecho, hasta hoy se han realizado tres revisiones extensivas sobre el tema. De ellas, las dos primeras (Ren-ner, 1964; Tarpy y Sawabini, 1974) se han centrado en procedimien-tos de condicionamiento sumamente heterogéneos; por otro lado, la más reciente de ellas (Lattal, 1987) solamente se ocupa de experi-mentos de-sarrollados utilizando los métodos, instrumentos y teorías del análisis experimental de la conducta. Dado que ya se han realiza-do tres revisiones sobre el tema, es necesario justificar la realización de una cuarta, centrada principalmente en procedimientos de demo-ra señalada. En lo relacionado con una justificación de carácter me-todológico, el desarrollo de nuevos sistemas de automatización y pro-gramación de experimentos ha invitado a los investigadores a llevar a cabo estudios con diseños experimentales cada vez más poderosos (y a conducir dichos estudios con mayor frecuencia). En lo que respecta a una justificación teórica, la hipótesis de que los efectos facilitativos de las señales solamente pueden interpretarse en términos de refor-zamiento condicionado se ha cuestionado por modelos alternativos de orientación cognoscitiva (véase, por ejemplo, Lieberman, McIntosh y


325

Thomas, 1979; Rescorla, 1982; Schaal, Odum y Shahan, 2000; Wi-lliams, 1994).

En esta revisión se abordarán principalmente aquellos estudios contemporáneos, posteriores a la última revisión, diseñados para eva-luar la hipótesis del reforzador condicionado; no obstante, también se recuperan algunos estudios anteriores que fueron relegados por Lat-tal (1987). A diferencia de éste, se incluyen asimismo algunos estu-dios contemporáneos con hipótesis de orientación cognitiva. Los es-tudios se analizan, en primer lugar, para determinar la medida en que sus resultados apoyan la hipótesis del reforzamiento condiciona-do; en segundo lugar, se presentan algunas de las nuevas hipótesis y experimentos diseñados para explicar los efectos de la demora seña-lada; finalmente, se discute la evidencia empírica a favor y en contra de las diferentes hi-pótesis revisadas, y se proponen los diversos cur-sos que podrían seguir futuras investigaciones.

Antes de comenzar con esta sección, es importante señalar que el concepto de reforzador condicionado ha sido evaluado empírica-mente de formas muy diversas, y que la interpretación de los efectos de la demora señalada como evidencia del fenómeno es solamente una de sus múltiples manifestaciones empíricas (véase, por ejemplo, Kelleher y Gollub, 1962; Williams, 1994). En vista de lo anterior, una revisión acerca del concepto de reforzamiento condicionado en el con-texto de los estudios de demora señalada no puede pretender deste-rrar ?o fundamentar? definitivamente el concepto dentro del condi-cionamiento operante.

Efectos de las señales durante la demora como reforzadores condicionados

Una cantidad importante de estudios sobre demora señalada parte del supuesto de que un buen diseño de investigación debería compa-rar al menos tres condiciones experimentales: 1) la ejecución del su-jeto con reforzamiento inmediato, 2) la ejecución del sujeto bajo con-diciones de demora no señalada y 3) la ejecución del sujeto bajo con-diciones de demora señalada (Lattal, 1984). Si la ejecución se deterio-ra notablemente bajo condiciones de demora no señalada y se man-

https://www.researchgate.net/publication/6973283_Signal_functions_in_delayed_reinforcement?el=1_x_8&enrichId=rgreq-5ebfa79b27c5434f4f970ec2af46a12e-XXX&enrichSource=Y292ZXJQYWdlOzI2NDE5NTEwO0FTOjk5NDY4MDUzNTgxODM0QDE0MDA3MjY0NDA3MDM=


326

tiene a niveles similares a los encontrados en reforzamiento inmedia-to con demora señalada, entonces el resultado se interpreta como congruente con la hi-pótesis del reforzamiento condicionado. Ri-chards (1981), por ejemplo, comparó el mantenimiento de la respues-ta de picoteo a la tecla en palomas puestas bajo programas tándem y encadenado IV 60"-TF (0", 0.5", 2.5", 5" y 10"). En general, las tasas de respuesta producidas por el programa encadenado fueron más al-tas ?y más parecidas a las obtenidas con reforzamiento inmediato? que las producidas en el programa tándem. El resultado no varió al cambiar el componente consumatorio de los programas por un RDB 20".

Schaal y Branch (1988) replicaron los resultados producidos por Richards utilizando señales luminosas breves de 0.5" y 3" de du-ración, en lugar de una señal luminosa continua durante todo el in-tervalo de demora. Por lo común, las tasas de respuesta de picoteo a la tecla encontradas en programas encadenados (IV 60"-TF 3", 9" y 27") se mantuvieron en niveles más altos que las tasas de respuesta producidas por un programa tándem equivalente. La diferencia entre las tasas de respuesta de los dos programas fue mayor con demoras cortas que con

la demora de 27". En síntesis, el resultado sugiere que los efectos fa-ciltadores de las señales dependen de la relación entre la duración de la señal y la duración de la demora.

En otro estudio similar, Schaal y Branch (1990) evaluaron el efecto de señales de diferente duración sobre el mantenimiento de la tasa de picoteo de palomas en programas encadenados IV 60"-TF 27". En resumen, los autores observaron que con señales de 10" o más las tasas de respuesta en el programa demorado fueron iguales a las en-contradas en la condición de reforzamiento inmediato; con señales menores a 10", fueron considerablemente más bajas a las encontra-das con reforzamiento inmediato.

Estudios como los de Schaal y Branch (1988, 1990) sugieren que los efectos facilitadores de las señales podrían diluirse con demo-ras largas. Precisamente con el objetivo de evaluar los límites máxi-mos de demora en los cuales las señales todavía tienen efectos facili-tadores, Ávila y Bruner (1995) llevaron a cabo un estudio en el cual

https://www.researchgate.net/publication/6971308_Responding_of_pigeons_under_variable-interval_schedules_of_unsignaled_briefly_signaled_and_completely_signaled_delays_to_reinforcement?el=1_x_8&enrichId=rgreq-5ebfa79b27c5434f4f970ec2af46a12e-XXX&enrichSource=Y292ZXJQYWdlOzI2NDE5NTEwO0FTOjk5NDY4MDUzNTgxODM0QDE0MDA3MjY0NDA3MDM=

https://www.researchgate.net/publication/20857367_Responding_of_pigeons_under_variable-interval_schedules_of_signaled-delayed_reinforcement_effects_of_delay-signal_duration?el=1_x_8&enrichId=rgreq-5ebfa79b27c5434f4f970ec2af46a12e-XXX&enrichSource=Y292ZXJQYWdlOzI2NDE5NTEwO0FTOjk5NDY4MDUzNTgxODM0QDE0MDA3MjY0NDA3MDM=


327

sometieron a ratas ingenuas a programas tándem y encadenado IA 30"-TF 60", 120" o 180". Al evaluar los resultados, encontraron poca evidencia de adquisición en cualesquiera de las condiciones experi-mentales (aun cuando la señal estuvo presente durante todo el inter-valo de demora en los programas encadenados). El resultado parece confirmar el hallazgo de Schaal y Branch (1990) en el sentido de que los efectos facilitativos de las señales desaparecen con demoras lar-gas.

De los estudios revisados se puede concluir que las señales tie-nen una capacidad relativamente limitada para mediar entre la res-puesta y la consecuencia en procedimientos de operante libre. Los hallazgos coinciden con las conclusiones de Spence (1947) y Hull (1952), quienes también encontraron que los gradientes de demora producidos por ratas en cajas de Skinner eran sorprendentemente inclinados, en comparación con los producidos en laberintos donde los sujetos continuaban corriendo aun con demoras de varios minu-tos.

En un intento por identificar otras variables que pudieran mo-dular los efectos de las señales en programas de demora señalada, Schaal, Schuh y Branch (1992) compararon programas encadenados IV-TF que difirieron en la duración del IV. Específicamente, compara-ron la ejecución de palomas en un programa múltiple en el cual el primer componente fue un IV 20"-TF (5, 10, 20") y el segundo compo-nente un IV 120"-TF (5, 10, 20"), hallando que los efectos de la demo-ra fueron menos notables con el IV de 120" que con el IV más corto. Los resultados se discutieron principalmente en términos de sus si-militudes con los hallaz-gos más usuales reportados en la literatura sobre automoldeamiento. Al parecer, tanto en el automoldeamiento como en los programas de demora señalada la duración del intervalo entre reforzadores modula los efectos de las señales.

En estudios recientes se ha cuestionado la idea de que los pro-gramas de demora no señalada se encuentren completamente des-provistos de señales mediadoras entre la respuesta y el reforzador. En particular, Critchfield y Lattal (1993) sugirieron que los sonidos pro-ducidos por la presión de la palanca podrían tener propiedades de reforzadores condicionados. Con la finalidad de evaluar el efecto de la


328

señales auditivas breves producidas por los manipulanda convencio-nales en cajas de condicionamiento, los autores expusieron ratas in-genuas a una situación en la cual una interrupción de un haz de luz invisible producía alimento después de un intervalo de 30" de demo-ra. La mitad de los sujetos produjo un breve tono auditivo al emitir la respuesta; en la otra mitad de los sujetos la emisión de la respuesta no produjo cambios exteroceptivos programados. Los resultados mos-traron que la adquisición de la respuesta fue más rápida en el primer grupo que en el grupo que no recibió retroalimentación.

Los resultados de Critchfield y Lattal (1993) fueron ampliados por Schlinger, Henry y Blakely (1994), quienes, utilizando una pre-paración semejante, evaluaron demoras de 4 y 10". En general, las ratas expuestas a la demora más breve y con retroalimentación audi-tiva mostraron mayor evidencia de adquisición de la respuesta.

Tanto el estudio de Critchfield y Lattal (1993) como el de Schlinger y cols. (1994) sugieren que distinguir entre procedimientos de demora señalada y no señalada es más complicado de lo que usualmente se piensa. Por otro lado, indican también que todo pro-cedimiento de reforzamiento demorado no señalado puede tener re-forzadores condicionados que median el intervalo entre la respuesta y el reforzador.

Además de acortar y alargar los intervalos de demora y variar la duración de la señal, los estudios contemporáneos han evaluado po-cas variantes en la forma de programar demoras señaladas. Una ex-cepción a la falta de variantes paramétricas en el análisis de los efec-tos de la demora señalada es el trabajo de Lattal (1984). En una pri-mera serie de estudios evaluó el efecto de la colocación de la señal dentro de programas encadenados de dos componentes y también de la forma de presentar la señal (de forma contingente o no contingen-te). El autor sometió a palomas a programas encadenados IV 50"-TF 20, 75 o 150". Los resultados mostraron que los efectos facilitadores de las señales sobre el mantenimiento de la tasa de respuesta son mayores cuando la señal coincide con el intervalo de demora; adicio-nalmente, las señales contingentes resultaron ser más efectivas para mantener la tasa de respuesta que las no contingentes.


329

Uno de los grupos de control evaluado por Lattal (1984) en el primer experimento consistió en presentar señales de manera aleato-ria durante diferentes porciones del programa encadenado. El proce-dimiento produjo tasas inesperadamente altas de respuesta en el grupo control, las cuales se atribuyeron a que una proporción de las señales ocurrieron durante el intervalo de demora. Justamente con la finalidad de evaluar sistemáticamente si la proporción de demoras señaladas que recibe el sujeto es importante en los efectos facilitati-vos de las señales en programas de demora señalada, Lattal (1987) llevó a cabo un estudio en el que sometió a palomas a programas en-cadenados de dos componentes en los cuales las señales durante el intervalo de demora podían ocurrir con una probabilidad de 1.0, 0.66, 33 ó 0.0". El autor observó que las tasas de respuesta se incrementa-ron de manera directa a la proporción de demoras señaladas.

Otro estudio contemporáneo que destaca por la originalidad de sus manipulaciones experimentales es el de Royalty, Williams y Fan-tino (1987). En síntesis, estos autores deseaban evaluar el carácter de reforzador condicionado de las señales en programas encadenados. Razonaron que si los reforzadores primarios pierden valor al separar-se de la respuesta procuradora, lo mismo debería ocurrir con los es-tímulos exteroceptivos presentados en programas de demora señala-da. Para evaluar su hipótesis, compararon programas encadenados de tres com-ponentes (IV 33", IV 33", IV 33") con la ejecución en progra-mas similares en los cuales uno de los IV se sustituyó por un IV 30"-TF 3". Los resultados mostraron que introducir una demora de 3" en-tre la respuesta y el cambio de estímulo disminuyó notablemente la tasa de respuesta en el componente modificado; el efecto fue particu-larmente considerable al introducir la modificación en cualquiera de los primeros dos componentes del encadenado. Los resultados se dis-cuten como evidencia del carácter de reforzador condicionado de los estímulos en programas de demora señalada.

En los estudios reseñados las variables dependientes emplea-das han sido el mantenimiento y la adquisición de la operante libre; sin embargo, también se han llevado a cabo utilizando otras variables dependientes. Por ejemplo, Marcatilio y Richards (1981) sometieron palomas a programas concurrentes en los cuales los sujetos podían


330

escoger entre un encadenado y un tándem (IV 90"-TF 0.25", 2.5", 5" ó 10"). Los resultados mostraron importantes efectos de historia, pero también una clara preferencia por los programas encadenados.

Los resultados de Marcatilio y Richards (1981) contrastan con los de Leung y Winston (1986). Dichos autores sometieron palomas a programas concurrentes en que podían escoger entre un programa encadenado IF (5, 10, 15, 20, 30, 110, 115, 120 ó 130")-TF 5", obser-vándose una preferencia consistente de los animales por el programa tándem. Los resultados se interpretaron como consistentes con la idea de Fantino (1969) de que segmentar el programa mediante estí-mulos discriminativos incrementa la percepción psicológica del tiem-po en los animales. Leung y Winston (1986) también sugirieron que sus discrepancias con Marcatilio y Richards (1981) podrían deberse a que el tipo de componente inicial del programa terminal (periódico o a periódico) modula los efectos de las señales en programas de demo-ra señalada.

En general, los resultados de esta primera sección tienden a co-incidir en que las señales durante el intervalo de demora tienen efec-tos facilitadores sobre el condicionamiento operante. Al parecer, las señales no necesariamente deben ser largas, pero sí es importante que ocurran consistentemente durante el intervalo de demora y que sean contingentes y cercanas a la respuesta que las produce. El in-tervalo entre reforzadores, las características del primer componente del programa y la duración de la demora programada modulan los efectos de las señales. Aparentemente, los efectos de las señales so-bre el condicionamiento son semejantes en al menos tres variables dependientes: el mantenimiento, la adquisición y, en menor medida, la elección.

Los efectos de las señales durante la demora: interpretaciones cognoscitivas

A diferencia de las investigaciones desarrolladas dentro de la perspec-tiva del análisis experimental de la conducta, en las cuales existe una relativa homogeneidad metodológica, la investigación cognitiva sobre demora se-ñalada es sumamente desigual. Esa diversidad metodoló-gica podría tal vez atribuirse al hecho de que algunas de las hipótesis


331

cognitivas tuvieron su origen en estudios con laberintos (por ejemplo, la hipótesis de la señalización de Lieberman y cols., 1979).

La hipótesis de la señalización plantea que las señales que ocu-rren dentro del intervalo de demora sirven para marcar o resaltar en la memoria del sujeto la respuesta procuradora. La señalización facili-ta la recuperación del “recuerdo” de la respuesta al ocurrir el evento reforzante, produciendo así la asociación entre la respuesta y el refor-zador remoto. La hipótesis de la señalización fue planteada inicial-mente por Lieberman y cols. (1979) basándose en investigaciones previas de Lett (1973, 1975). Este autor mostró que las ratas son ca-paces de aprender laberintos bajo condiciones de demora de reforza-miento de varios minutos, siempre y cuando se retire al sujeto del laberinto justo después de emitir la respuesta correcta (o incorrecta). De acuerdo con Lett, las ratas aprenden bajo estas condiciones debi-do a que se evita que ocurran otras respuestas en el espacio experi-mental, las cuales compiten con la respuesta seleccionada para ser reforzada, siendo el sujeto incapaz de discriminar cuál de todas estas conductas produjo el evento reforzante.

Lieberman y cols. (1979) sugirieron alternativamente que el apren-dizaje bajo condiciones de demoras largas (en el estudio de Lett) ocurrió debido a que, al sacar al animal del laberinto justo des-pués de dar la vuelta correcta (o incorrecta), dicha conducta quedó señalada en la memoria del sujeto. Así, la saliencia mnémica, y no la ausencia de conductas competitivas durante el intervalo de demora, es la responsable de la facilitación del aprendizaje.

Para evaluar empíricamente la hipótesis de la señalización, Lie-berman y cols. (1979) sometieron a dos grupos de ratas a un laberin-to en el cual una de dos puertas se asociaba con alimento. Al primero de estos grupos se le extraía brevemente de la caja una vez seleccio-nada una de las puertas del laberinto, y rápidamente se le regresaba durante todo el intervalo de demora. Los sujetos del segundo grupo no fueron manipulados por los investigadores después de emitir la respuesta (correcta o incorrecta). Los resultados solamente mostraron aprendizaje en el grupo que fue manipulado después de emitir la respuesta, a pesar de que los sujetos de ambos grupos permanecie-ron durante la demora en el laberinto donde podrían ocurrir conduc-


332

tas competitivas y dificultar así la asociación entre la respuesta procu-radora y el reforzador. En un experimento subsecuente (experimento 4), utilizaron un laberinto similar al descrito previamente para mos-trar que la señalización puede ocurrir también con estímulos extero-ceptivos diferentes a la manipulación del animal (por ejemplo, tonos auditivos y/o cambios de iluminación). Adicionalmente, Lieberman, Davidson y Thomas (1985) mostraron también que los efectos de sus procedimientos pueden replicarse con procedimientos de mayor con-trol de variables extrañas (como sería una cámara de condicionamien-to operante para palomas).

Tanto el poder evitar la manipulación directa del sujeto como el éxito en la replicación del fenómeno de señalización en procedimien-tos de operante libre generaron interés en otros investigadores por estudiar fenómenos mnémicos en procedimientos de demora señala-da. Por ejemplo, Cronin (1980) intentó evaluar la hipótesis conocida con el nombre de “reactivación mnémica” en programas de demora señalada. De acuerdo con dicha hipótesis, dos sucesos que ocurren separados en el tiempo pueden asociarse si un tercer suceso ocurre al presentarse ambos (Roberts, 1976; Spear, 1978). Así, si la misma señal que sigue a la respuesta procuradora también antecede a la en-trega del reforzador, la asociación entre ambos eventos debería facili-tarse. Cronin (1980) evaluó esta posibilidad sometiendo a palomas a programas de discriminación condicional en los que la señal se pre-sentaba al iniciar y al terminar el intervalo de demora. La autora ob-servó un mejor desempeño en la tarea de discriminación condicional en aquellas condiciones en las cuales la misma señal ocurrió al ini-ciar y al terminar la demora que en condiciones de control en las que las dos señales diferían entre sí.

Los resultados de Cronin proponen una explicación tentativa al hallazgo de Schaal y Branch (1988) de que las señales breves pierden su capacidad para mantener la tasa de respuesta con demoras largas. De acuerdo con los resultados de Cronin (1980), la pérdida en el con-trol conductual podría atribuirse a que la señal termina antes de la entrega del reforzador y, por lo tanto, fracasa en la reinstalación mnémica de la respuesta procuradora al ocurrir el reforzador.

https://www.researchgate.net/publication/232524940_The_Processing_of_Memories_Forgetting_and_Retention?el=1_x_8&enrichId=rgreq-5ebfa79b27c5434f4f970ec2af46a12e-XXX&enrichSource=Y292ZXJQYWdlOzI2NDE5NTEwO0FTOjk5NDY4MDUzNTgxODM0QDE0MDA3MjY0NDA3MDM=

https://www.researchgate.net/publication/223631375_Failure_to_replicate_visual_discrimination_learning_with_a_1-min_delay_of_reward?el=1_x_8&enrichId=rgreq-5ebfa79b27c5434f4f970ec2af46a12e-XXX&enrichSource=Y292ZXJQYWdlOzI2NDE5NTEwO0FTOjk5NDY4MDUzNTgxODM0QDE0MDA3MjY0NDA3MDM=

https://www.researchgate.net/publication/225680145_Reinstatement_of_postresponse_stimuli_prior_to_reward_in_delayed-reward_discrimination_learning_by_pigeons?el=1_x_8&enrichId=rgreq-5ebfa79b27c5434f4f970ec2af46a12e-XXX&enrichSource=Y292ZXJQYWdlOzI2NDE5NTEwO0FTOjk5NDY4MDUzNTgxODM0QDE0MDA3MjY0NDA3MDM=


333

Otros autores que han trabajado en modelos mnémicos de la demora señalada son Schaal y cols. (2000), quienes sometieron palo-mas a programas de igualación a la muestra en que se presentaba el estímulo muestra de dos segundos después de un IV (60" ó 120"). Los estímulos de comparación se mostraron a los sujetos después de dife-rentes intervalos de demora. Los resultados mostraron que tanto la tasa de respuesta como el número de igualaciones correctas fueron una función inversa de la duración de la demora. Adicionalmente, los animales tuvieron un mayor porcentaje de igualaciones correctas con el IV 120". En consecuencia, los hallazgos se interpretaron como evi-dencia de que el mecanismo principal que explica las limitaciones de señales cortas en demoras largas es principalmente mnémico; es de-cir, la separación temporal evita que el sujeto recuerde los eventos que acompañaron a la respuesta procuradora. Por otro lado, el hecho de que la duración del IV modulara el porcentaje de igualaciones co-rrectas corroboró el hallazgo previo (Schaal y cols., 1992) de que la duración del primer componente en programas de demora señalada es determinante para el funcionamiento de las señales.

Uno de los pocos trabajos de investigación desarrollados para evaluar simultáneamente algunas de las hipótesis que compiten para explicar los efectos de las señales en programas de reforzamiento demorado fue realizado por Williams (1991). Este autor sugirió que las diferencias entre las hipótesis no son sólo de carácter teórico sino también metodológico. Las hipótesis del reforzamiento condicionado, de señalización y de reactivación mnémica difieren entre sí princi-palmente por la forma en que se programan las señales; esto es, en tanto que el procedimiento para generar reforzadores condicionados consiste sola-mente en señalar la respuesta procuradora, en los pro-cedimientos de señalización y reactivación se señalan tanto las res-puestas procuradoras como las que no lo son (por ejemplo, un vuelta equivocada en el laberinto). Otra diferencia metodológica en los estu-dios característicos de las tres hipótesis tiene que ver con la duración de la señal. Mientras que en los estudios típicos de señalización y re-forzamiento condicionado la señal es breve y ocurre solamente al ini-cio, en los que tratan sobre la reactivación mnémica la señal se pre-senta al inicio y al final del intervalo, si bien puede ser continua.


334

Williams (1991) comparó los procedimientos descritos expo-niendo ratas a programas de discriminación condicional en los que una señal indicaba a un sujeto cuál de dos palancas proporcionaba reforzamiento demorado. Las respuestas de los sujetos podían no producir señal u ocasionar una señal breve o una larga. Además, para algunos grupos experimentales se señalaron solamente las respues-tas en la palanca “correcta”, en tanto que para otros se señalaron tan-to respuestas “correctas” como “incorrectas”. Los resultados mostra-ron que los sujetos que recibieron únicamente señales ante la res-puesta “correcta” y que adicionalmente recibieron una señal larga al-canzaron los criterios de adquisición más rápido. Con base en los re-sultados, el autor concluyó que los procedimientos característicos de reforzamiento condicionado tienen mayores efectos facilitativos du-rante la demora que los procedimientos de señalización y reactivación mnémica.

En síntesis, las hipótesis cognoscitivas acerca de los efectos faci-litativos de las señales en programas de reforzamiento demorado su-gieren que los mecanismos de memoria juegan un papel fundamental para producir dichos efectos. En general, aquellos factores que ayu-dan a dar saliencia mnémica a las conductas procuradoras del orga-nismo son esenciales para el aprendizaje, y también la unión de los eventos conductuales con sus consecuencias mediante dos señales semejantes (o una de ellas larga) ayuda al condicionamiento. De acuerdo con los resultados de Williams (1991), los factores mnémicos son necesarios pero no suficientes para explicar los efectos de las se-ñales en programas de reforzamiento demorado.

SÍNTESIS Y CONCLUSIONES

El propósito principal de esta revisión fue el de tratar de evaluar la evidencia empírica a favor y en contra de las hipótesis que se han su-gerido para explicar los efectos de las señales en programas de refor-zamiento demorado. A continuación se presenta un análisis crítico de los estudios revisados en el que se pretende valorar la medida en que los experimentos en cuestión apoyan o no las hipótesis que susten-tan. Antes de comenzar el análisis, cabe mencionar que en opinión de los presentes autores los problemas de los estudios revisados difie-

https://www.researchgate.net/publication/226452832_Marking_and_bridging_versus_conditioned_reinforcement?el=1_x_8&enrichId=rgreq-5ebfa79b27c5434f4f970ec2af46a12e-XXX&enrichSource=Y292ZXJQYWdlOzI2NDE5NTEwO0FTOjk5NDY4MDUzNTgxODM0QDE0MDA3MjY0NDA3MDM=


335

ren dependiendo del punto de vista teórico que les dio origen. Así, generalmente los problemas con las hipótesis cognitivas se deben so-bre todo a la falta de grupos control; por otro lado, el principal pro-blema de los estudios de orientación conductual es la falta de una agenda ordenada de investigación para abordar el fenómeno. Con la finalidad de tener más claridad, se discutirán en primer lugar las li-mitaciones de los experimentos de orientación cognitiva.

En el estudio de reactivación mnémica de Cronin (1980), por ejem-plo, se argumenta que dos señales iguales (una al ocurrir la res-puesta y la otra al entregar el reforzador) facilitan el aprendizaje rela-tivo a condiciones en las cuales no hay señal o se presentan dos se-ñales diferentes. Para dar mayor peso a su argumento, esta autora debió someter a los sujetos experimentales a condiciones en las que las dos señales se colocaran en diferentes posiciones durante el in-tervalo de demora. Si al añadir estas condiciones de control el apren-dizaje sigue siendo más rápido con las señales en los extremos, el ar-gumento de Cronin resultaría más convincente.

En lo que respecta a los estudios de Lieberman y cols. (1979, 1985), aunque están diseñados para mostrar la supremacía de la hipótesis de señalización sobre la de reforzamiento condicionado, sus resultados son difíciles de interpretar. La principal dificultad radica en la ausencia de un grupo control en el cual solamente se señale la respuesta procuradora; dado que en los procedimientos que producen efectos de reforzamiento condicionado solamente se señala la res-puesta “correcta”, tales estudios carecen del grupo de comparación adecuado.

Las deficiencias en los trabajos sobre reactivación mnémica y señalización se corrigen en la investigación de Williams (1991). Bajo las condiciones experimentales de dicho autor, son los procedimien-tos característicos del reforzamiento condicionado los que parecen facilitar en mayor medida el aprendizaje. El estudio de Williams es difícil de evaluar; no obstante, dado que se desconoce el grado de co-varianza entre sus procedimientos de discriminación condicional y los procedimientos de la-berintos utilizados en muchos de los estudios de orientación cognitiva.


336

Por último, el estudio de Schaal y cols. (2000) resulta difícil de interpretar sin ambigüedades como evidencia de la importancia de factores mnémicos en los programas de demora señalada. En breve, en el procedimiento de igualación a la muestra utilizado por dichos investigadores, el estímulo de muestra se separa gradualmente del estímulo de comparación y, como consecuencia, el incremento en la separación reduce la eficacia del sujeto. La demora del reforzador dis-minuye el “recuerdo” del estímulo de comparación, pero también se-para la señal del reforzador y reduce así la posibilidad de que los dos eventos se asocien. En síntesis, los hallazgos del estudio son con-gruentes tanto con una interpretación mnémica como con una basa-da en reforzamiento condicionado.

Si la literatura de orientación cognitiva revisada no permite rea-lizar afirmaciones teóricas contundentes por la falta de grupos de control adecuados, los estudios de orientación conductual producen información incompleta para comprender cabalmente el efecto de las señales en programas de reforzamiento demorado. Por ejemplo, los trabajos de Leung y Winston (1986), Schaal y cols. (1992) y Schaal y cols. (2000) sugieren que los efectos de las señales varían de acuerdo con, al menos, dos parámetros del programa: la duración del primer componente del encadenado y su periodicidad. A la fecha, sólo se han evaluado dos duraciones del primer componente (IV 20" e IV 120"). Por otro lado, aún no existen investigaciones en las cuales se compa-re directamente el efecto de la periodicidad del primer componente sobre los efectos de las señales en programas de reforzamiento demo-rado. La falta de estudios como los sugeridos imposibilita saber si los efectos interpretados tradicionalmente como evidencia de reforza-miento condicionado no son sino casos especiales dentro de toda una familia de diferentes efectos conductuales. Por ejemplo, la compara-ción entre los resultados de Leung y Winston (1986) con los de Fan-tino (1969) indican que, bajo ciertas circunstancias, las señales du-rante la demora podrían dificultar el aprendizaje, no facilitarlo, posi-bilidad que Neuringer (1969) ya había sugerido.

La literatura de orientación conductual ha adoptado el principio de analogía en sus intentos por evaluar la hipótesis del reforzamiento condicionado. El principio de analogía consiste en evaluar si las ma-


337

nipulaciones que tienen efectos conocidos sobre los reforzadores pri-marios tienen los mismos efectos sobre los reforzadores condiciona-dos putativos. En el estudio de Royalty y cols. (1987), por ejemplo, se sugiere que demorar señales durante el periodo de espera entre la respuesta y el reforzador disminuye su capacidad para mantener el palanqueo en ratas. En dicho estudio, sin embargo, se evaluó un solo valor de demora (3") y de intervalo entre reforzadores (99"). Dado que se ha demostrado que conforme se aleja el reforzador de la respuesta procuradora las funciones de las señales cambian (Tombaugh y Tom-baugh, 1971), y que también se ha establecido que la duración del intervalo entre reforzadores afecta asimismo la función de las señales (Schaal y cols., 1992), los resultados de Royalty y cols. (1987) son po-co concluyentes.

Otra variable que, según se sabe, disminuye la capacidad de re-forzadores primarios para mantener la conducta es la ausencia de una relación de contingencia entre la respuesta procuradora y el re-forzador. Los resultados de Lattal (1984) revelan que las señales no contingentes durante el intervalo de demora son menos efectivas que las contingentes para mantener la conducta. El resultado, empero, no es concluyente debido a que en dicho trabajo las señales no contin-gentes podían también ocurrir durante el primer componente del programa de reforzamiento. Adicionalmente, en el estudio de Lattal sólo una pequeña

proporción de las señales ocurrieron durante la demora y, por ende, el bajo porcentaje de demoras señaladas podría explicar asimismo el efecto documentado por él.

Los estudios de Schaal y Branch (1988, 1990) denotan que, al igual que lo que ocurre con los reforzadores primarios, los incremen-tos en la “magnitud” de los reforzadores condicionados (por ejemplo, en la longitud de la señal) favorecen el condicionamiento. Sin embar-go, tal interpretación de los resultados de dichos investigadores es cuestionable por al menos dos razones. En primer lugar, no queda claro en qué sentido el alargar una señal es equivalente a incremen-tar su magnitud; también podría entenderse como un cambio en la magnitud un aumento en los decibeles de una señal auditiva o en los vatios de una señal luminosa. En segundo término, al aumentar la




338

duración de la señal se facilita al sujeto la discriminación entre los periodos en los cuales sus respuestas son efectivas y aquellos en los que no lo son. La mejor discriminación de las oportunidades de res-puesta seguramente aumenta la frecuencia de reforzamiento y, en consecuencia, la tasa de respuesta.

En fin, la investigación basada en el principio de analogía no resuelve satisfactoriamente la cuestión de si las señales utilizadas en programas de demora señalada funcionan o no como reforzadores condicionados. La base de este problema es, como se sugirió ante-riormente, la falta de extensiones paramétricas, de controles adecua-dos y de verdaderos experimentos “cruciales” (quizá con la excepción del estudio de Williams, 1991) .

Una última reflexión relativa a los estudios de demora señalada revisados tiene que ver con la gran cantidad de variables dependien-tes que se utilizan como putativamente equivalentes. En trabajos re-cientes se ha mostrado, por ejemplo, que los efectos de los mismos programas de demora no señalada son diferentes sobre adquisición y estado estable (Bruner, Pulido y Escobar, 1999, 2000; Weil, 1984). Los resultados tan contrastantes obtenidos por Lieberman y cols. (1979, 1985) con laberintos y de Williams (1991) con procedimientos de discriminación condicional también plantean dudas acerca de la covarianza entre las variables dependientes. Los presentes autores sugieren que, en tanto una mayor cantidad de estudios confirmen o no la intercambiabilidad de las diferentes variables dependientes em-pleadas en el área, las comparaciones entre ellas deben ser, por lo menos, cautelosas.

REFERENCIAS

Ávila, R. y Bruner, C. (1995). Adquisición de la respuesta bajo demoras largas de reforzamiento señalado y no señalado. Revista Mexicana de Análisis de la Con-ducta, 21: 117-127.

Azzi, R., Fix, D.S.R., Keller, F.S. y Rocha e Silva, M.I. (1964). Exteroceptive control of response under delayed reinforcement. Journal of the Experimental Analysis of Behavior, 7: 159-162.

https://www.researchgate.net/publication/6973255_The_effects_of_delayed_reinforcement_on_free-operant_responding?el=1_x_8&enrichId=rgreq-5ebfa79b27c5434f4f970ec2af46a12e-XXX&enrichSource=Y292ZXJQYWdlOzI2NDE5NTEwO0FTOjk5NDY4MDUzNTgxODM0QDE0MDA3MjY0NDA3MDM=


339

Baum, W.M. (1995). Introducción al análisis molar de la conducta. Revista Mexicana de Análisis de la Conducta, 21: 17-35.

Bruner, C., Pulido, M.A. y Escobar, R. (1999). Response acquisition and mainte-nance with a temporally defined schedule of delayed reinforcement. Revista Mexicana de Analisis de la Conducta, 25: 379-391.

Bruner, C., Pulido, M.A. y Escobar, R. (2000). La adquisición del palanqueo con pro-gramas temporales de reforzamiento demorado. Revista Mexicana de Análisis de la Conducta, 26: 91-103.

Critchfield, T.S. y Lattal, K.A. (1993). Acquisition of a spatially defined operant with delayed reinforcement. Journal of the Experimental Analysis of Behavior, 59: 373-387.

Cronin, P. B. (1980). Reinstatement of postresponse stimuli prior to reward in de-layed-reward discrimination learning by pigeons. Animal Learning and Behav-ior, 8: 352-358.

Fantino, E. (1969). Conditioned reinforcement, choice and the psychological di s-tance to reward. En D.P. Hendry (Ed.): Conditioned Reinforcement. Homewood, IL: Dorsey Press: 163-191.

Ferster, C.B. (1953). Sustained behavior under delayed reinforcement. Journal of Ex-perimental Psychology, 45: 27-45.

Hull, C.L. (1952). A behavior system. New Haven: Yale University Press.

Kelleher, R.T. y Gollub, L.R. (1962). A review of positive conditioned reinforcement. Journal of the Experimental Analysis of Behavior, 5: 543-597.

Lattal, K.A. (1984). Signal functions in delay of reinforcement. Journal of the Experi-mental Analysis of Behavior, 42: 239-253.

Lattal, K.A. (1987). The effect of delay and of intervening events on reinforcement value. En M.L. Commons, J.E. Mazur, J.A. Nevin y H. Rachlin (Eds.): Quantita-tive Analysis of Behavior (vol 5). New Jersey: Lawrence, Erlbaum Associates Publisher.

Lett, B.T. (1973). Delayed reward learning: Disproof of the traditional theory. Learn-ing and Motivation, 4: 237-246.

Lett, B.T. (1975). Long delay learning in the T maze. Learning and Motivation, 6: 80-90.

Leung, J.P. y Winton, A.S. (1986). Preference for less segmented fixed-time compo-nents in concurrent schedules of reinforcement. Journal of the Experimental Analysis of Behavior, 46: 175-183.




https://www.researchgate.net/publication/232336250_Long_delay_learning_in_the_T-maze?el=1_x_8&enrichId=rgreq-5ebfa79b27c5434f4f970ec2af46a12e-XXX&enrichSource=Y292ZXJQYWdlOzI2NDE5NTEwO0FTOjk5NDY4MDUzNTgxODM0QDE0MDA3MjY0NDA3MDM=

https://www.researchgate.net/publication/232336250_Long_delay_learning_in_the_T-maze?el=1_x_8&enrichId=rgreq-5ebfa79b27c5434f4f970ec2af46a12e-XXX&enrichSource=Y292ZXJQYWdlOzI2NDE5NTEwO0FTOjk5NDY4MDUzNTgxODM0QDE0MDA3MjY0NDA3MDM=

https://www.researchgate.net/publication/14744270_Acquisition_of_a_spatially_defined_operant_with_delayed_reinforcement?el=1_x_8&enrichId=rgreq-5ebfa79b27c5434f4f970ec2af46a12e-XXX&enrichSource=Y292ZXJQYWdlOzI2NDE5NTEwO0FTOjk5NDY4MDUzNTgxODM0QDE0MDA3MjY0NDA3MDM=





https://www.researchgate.net/publication/232336242_Delayed_reward_learning_Disproof_of_the_traditional_theory?el=1_x_8&enrichId=rgreq-5ebfa79b27c5434f4f970ec2af46a12e-XXX&enrichSource=Y292ZXJQYWdlOzI2NDE5NTEwO0FTOjk5NDY4MDUzNTgxODM0QDE0MDA3MjY0NDA3MDM=

https://www.researchgate.net/publication/232336242_Delayed_reward_learning_Disproof_of_the_traditional_theory?el=1_x_8&enrichId=rgreq-5ebfa79b27c5434f4f970ec2af46a12e-XXX&enrichSource=Y292ZXJQYWdlOzI2NDE5NTEwO0FTOjk5NDY4MDUzNTgxODM0QDE0MDA3MjY0NDA3MDM=

https://www.researchgate.net/publication/6973354_Preference_for_less_segmented_fixed-time_components_in_concurrent-chain_schedules_of_reinforcement?el=1_x_8&enrichId=rgreq-5ebfa79b27c5434f4f970ec2af46a12e-XXX&enrichSource=Y292ZXJQYWdlOzI2NDE5NTEwO0FTOjk5NDY4MDUzNTgxODM0QDE0MDA3MjY0NDA3MDM=



https://www.researchgate.net/publication/10488738_Sustained_behavior_under_delayed_reinforcement?el=1_x_8&enrichId=rgreq-5ebfa79b27c5434f4f970ec2af46a12e-XXX&enrichSource=Y292ZXJQYWdlOzI2NDE5NTEwO0FTOjk5NDY4MDUzNTgxODM0QDE0MDA3MjY0NDA3MDM=

https://www.researchgate.net/publication/10488738_Sustained_behavior_under_delayed_reinforcement?el=1_x_8&enrichId=rgreq-5ebfa79b27c5434f4f970ec2af46a12e-XXX&enrichSource=Y292ZXJQYWdlOzI2NDE5NTEwO0FTOjk5NDY4MDUzNTgxODM0QDE0MDA3MjY0NDA3MDM=

https://www.researchgate.net/publication/9534966_A_Review_of_Positive_Conditioned_Reinforcement1?el=1_x_8&enrichId=rgreq-5ebfa79b27c5434f4f970ec2af46a12e-XXX&enrichSource=Y292ZXJQYWdlOzI2NDE5NTEwO0FTOjk5NDY4MDUzNTgxODM0QDE0MDA3MjY0NDA3MDM=

https://www.researchgate.net/publication/9534966_A_Review_of_Positive_Conditioned_Reinforcement1?el=1_x_8&enrichId=rgreq-5ebfa79b27c5434f4f970ec2af46a12e-XXX&enrichSource=Y292ZXJQYWdlOzI2NDE5NTEwO0FTOjk5NDY4MDUzNTgxODM0QDE0MDA3MjY0NDA3MDM=


340

Lieberman, D.A., McIntosh, D.C. y Thomas, G.V. (1979). Learning when reward is delayed: A marking hypothesis. Journal of Experimental Psychology: Animal Behavior Processes, 5: 224-242.

Lieberman, D.A., Davidson, F.H. y Thomas, G.V. (1985). Marking in pigeons: The role of memory in delayed reinforcement. Journal of Experimental Psychology: Animal Behavior Processes, 11: 611-624.

Marcatilio, A.J.M. y Richards, R.W. (1981), Preference for signaled versus unsig-naled reinforcement delay in concurrent-chain schedules. Journal of the Ex-perimental Analysis of Behavior, 36: 221-229.

Neuringer, A.J. (1969). Delayed reinforcement versus reinforcement after a fixed interval. Journal of the Experimental Analysis of Behavior, 12: 375-383.

Pavlov, I.P. (1927). Conditioned reflexes. London, Oxford University Press.

Perkins, C.C. (1947). The relation of secondary reward to gradients of reinforce-ment. Journal of Experimental Psychology, 37: 377-392.

Renner, K.E. (1964). Delay of reinforcement: A historical review. Psychological Bulle-tin, 61: 341-361.

Rescorla, R.A. (1982). Effect of a stimulus intervening between CS and US in auto-shaping. Journal of Experimental Psychology: Animal Behavior Processes, 8: 131-141.

Richards, R.W. (1981). A comparison of signaled and unsignaled delay of reinforce-ment. Journal of the Experimental Analysis of Behavior, 35: 145-152.

Roberts, W.A. (1976). Failure to replicate visual discrimination with a 1-min delay of reward. Learning and Motivation, 7: 313-325.

Royalty, P., Williams, B.A. y Fantino, E. (1987). Effects of delayed conditioned rein-forcement in chain schedules. Journal of the Experimental Analysis of Behav-ior, 47: 41-56.

Schaal, D.W. y Branch, M.N. (1988). Responding of pigeons under variable-interval schedules of unsignaled, briefly signaled, and completely signaled delays to reinforcement. Journal of the Experimental Analysis of Behavior, 50: 33-54.

Schaal, D.W. y Branch, M.N. (1990). Responding of pigeons under variable-interval schedules of signaled-delayed reinforcement: Effects of delay-signal dura-tion. Journal of the Experimental Analysis of Behavior, 53: 103-121.

Schaal, D.W., Schuh, K.J. y Branch, M.N. (1992). Key pecking of pigeons under vari-able interval schedules of briefly signaled delayed reinforcement: Effects of variable-interval value. Journal of the Experimental Analysis of Behavior, 58: 277-286.

https://www.researchgate.net/publication/6974266_Delayed_reinforcement_versus_reinforcement_after_a_fixed_interval?el=1_x_8&enrichId=rgreq-5ebfa79b27c5434f4f970ec2af46a12e-XXX&enrichSource=Y292ZXJQYWdlOzI2NDE5NTEwO0FTOjk5NDY4MDUzNTgxODM0QDE0MDA3MjY0NDA3MDM=

https://www.researchgate.net/publication/6974266_Delayed_reinforcement_versus_reinforcement_after_a_fixed_interval?el=1_x_8&enrichId=rgreq-5ebfa79b27c5434f4f970ec2af46a12e-XXX&enrichSource=Y292ZXJQYWdlOzI2NDE5NTEwO0FTOjk5NDY4MDUzNTgxODM0QDE0MDA3MjY0NDA3MDM=

https://www.researchgate.net/publication/232509127_Marking_in_Pigeons_The_Role_of_Memory_in_Delayed_Reinforcement?el=1_x_8&enrichId=rgreq-5ebfa79b27c5434f4f970ec2af46a12e-XXX&enrichSource=Y292ZXJQYWdlOzI2NDE5NTEwO0FTOjk5NDY4MDUzNTgxODM0QDE0MDA3MjY0NDA3MDM=



https://www.researchgate.net/publication/22613177_Learning_when_reward_is_delayed_A_marking_hypothesis?el=1_x_8&enrichId=rgreq-5ebfa79b27c5434f4f970ec2af46a12e-XXX&enrichSource=Y292ZXJQYWdlOzI2NDE5NTEwO0FTOjk5NDY4MDUzNTgxODM0QDE0MDA3MjY0NDA3MDM=



https://www.researchgate.net/publication/16130420_Effect_of_a_stimulus_intervening_between_CS_and_US_in_autoshaping?el=1_x_8&enrichId=rgreq-5ebfa79b27c5434f4f970ec2af46a12e-XXX&enrichSource=Y292ZXJQYWdlOzI2NDE5NTEwO0FTOjk5NDY4MDUzNTgxODM0QDE0MDA3MjY0NDA3MDM=





https://www.researchgate.net/publication/6973107_Preference_for_signaled_versus_unsignaled_reinforcement_delay_in_concurrent-chain_schedules?el=1_x_8&enrichId=rgreq-5ebfa79b27c5434f4f970ec2af46a12e-XXX&enrichSource=Y292ZXJQYWdlOzI2NDE5NTEwO0FTOjk5NDY4MDUzNTgxODM0QDE0MDA3MjY0NDA3MDM=



https://www.researchgate.net/publication/19601383_Effects_of_delayed_conditioned_reinforcement_in_chain_schedules?el=1_x_8&enrichId=rgreq-5ebfa79b27c5434f4f970ec2af46a12e-XXX&enrichSource=Y292ZXJQYWdlOzI2NDE5NTEwO0FTOjk5NDY4MDUzNTgxODM0QDE0MDA3MjY0NDA3MDM=






https://www.researchgate.net/publication/232516236_Delay_of_reinforcement_A_historical_review?el=1_x_8&enrichId=rgreq-5ebfa79b27c5434f4f970ec2af46a12e-XXX&enrichSource=Y292ZXJQYWdlOzI2NDE5NTEwO0FTOjk5NDY4MDUzNTgxODM0QDE0MDA3MjY0NDA3MDM=

https://www.researchgate.net/publication/232516236_Delay_of_reinforcement_A_historical_review?el=1_x_8&enrichId=rgreq-5ebfa79b27c5434f4f970ec2af46a12e-XXX&enrichSource=Y292ZXJQYWdlOzI2NDE5NTEwO0FTOjk5NDY4MDUzNTgxODM0QDE0MDA3MjY0NDA3MDM=

https://www.researchgate.net/publication/42285861_The_relation_of_secondary_reward_to_gradients_of_reinforcement?el=1_x_8&enrichId=rgreq-5ebfa79b27c5434f4f970ec2af46a12e-XXX&enrichSource=Y292ZXJQYWdlOzI2NDE5NTEwO0FTOjk5NDY4MDUzNTgxODM0QDE0MDA3MjY0NDA3MDM=

https://www.researchgate.net/publication/42285861_The_relation_of_secondary_reward_to_gradients_of_reinforcement?el=1_x_8&enrichId=rgreq-5ebfa79b27c5434f4f970ec2af46a12e-XXX&enrichSource=Y292ZXJQYWdlOzI2NDE5NTEwO0FTOjk5NDY4MDUzNTgxODM0QDE0MDA3MjY0NDA3MDM=

https://www.researchgate.net/publication/6973063_A_comparison_of_signaled_and_unsignaled_delay_of_reinforcement?el=1_x_8&enrichId=rgreq-5ebfa79b27c5434f4f970ec2af46a12e-XXX&enrichSource=Y292ZXJQYWdlOzI2NDE5NTEwO0FTOjk5NDY4MDUzNTgxODM0QDE0MDA3MjY0NDA3MDM=

https://www.researchgate.net/publication/6973063_A_comparison_of_signaled_and_unsignaled_delay_of_reinforcement?el=1_x_8&enrichId=rgreq-5ebfa79b27c5434f4f970ec2af46a12e-XXX&enrichSource=Y292ZXJQYWdlOzI2NDE5NTEwO0FTOjk5NDY4MDUzNTgxODM0QDE0MDA3MjY0NDA3MDM=




https://www.researchgate.net/publication/21752317_Key_pecking_of_pigeons_under_variable-interval_schedules_of_briefly_signaled_delayed_reinforcement_effects_of_variable-interval_value?el=1_x_8&enrichId=rgreq-5ebfa79b27c5434f4f970ec2af46a12e-XXX&enrichSource=Y292ZXJQYWdlOzI2NDE5NTEwO0FTOjk5NDY4MDUzNTgxODM0QDE0MDA3MjY0NDA3MDM=





341

Schaal, D.W., Odum, A.L. y Shahan, T.A. (2000). Pigeons may not remember the stimuli that reinforced their recent behavior. Journal of the Experimental Analysis of Behavior, 73: 125-139.

Schlinger, J.R., Henry, D. y Blakely, E. (1994). The effects of delayed reinforcement and a response-produced auditory stimulus on the acquisition of operant be-havior in rats. Psychological Record, 44: 391-419.

Sizemore, O.J. y Lattal, K.A. (1977). Dependency, temporal contiguity and response independent reinforcement. Journal of the Experimental Analysis of Behavior, 25: 119-125.

Sizemore, O.J. y Lattal, K.A. (1978). Unsignaled delay of reinforcement in variable-interval schedules. Journal of the Experimental Analysis of Behavior, 30: 169-175.

Skinner, B.F. (1938). The behavior of organisms. New York: Appleton-Century-Crofts.

Spear, N.E. (1978). The processing of memories: Forgetting information. New York: Er l-baum.

Spence, K.W. (1947). The role of secondary reinforcement in delayed reward learn-ing. Psychological Review, 54: 1-8.

Spence, K.W. (1956). Behavior theory and conditioning. New Haven: Yale University Press.

Tarpy, R.M. y Sawabini, F.L. (1974). Reinforcement delay: A selective review of the last decade. Psychological Bulletin, 81: 984-997.

Tombaugh, J.W. y Tombaugh, T.N. (1971). Effects on performance of placing a visual cue at different temporal locations within a constant delay interval. Journal of Experimental Psychology, 87: 220-224.

Weil, J.L. (1984). The effects of delayed reinforcement on free-operant responding. Journal of the Experimental Analysis of Behavior, 41: 143-155.

Williams, B.A. (1991). Marking and bridging versus conditioned reinforcement. Ani-mal Learning and Behavior, 19: 264-269.

Williams, B.A. (1994). Conditioned reinforcement: Experimental and theoretical issues. The Behavior Analyst, 17: 261-285.

https://www.researchgate.net/publication/12532781_Pigeons_may_not_remember_the_stimuli_that_reinforced_their_recent_behavior?el=1_x_8&enrichId=rgreq-5ebfa79b27c5434f4f970ec2af46a12e-XXX&enrichSource=Y292ZXJQYWdlOzI2NDE5NTEwO0FTOjk5NDY4MDUzNTgxODM0QDE0MDA3MjY0NDA3MDM=







https://www.researchgate.net/publication/232590743_Behavior_Theory_and_Conditioning?el=1_x_8&enrichId=rgreq-5ebfa79b27c5434f4f970ec2af46a12e-XXX&enrichSource=Y292ZXJQYWdlOzI2NDE5NTEwO0FTOjk5NDY4MDUzNTgxODM0QDE0MDA3MjY0NDA3MDM=

https://www.researchgate.net/publication/232590743_Behavior_Theory_and_Conditioning?el=1_x_8&enrichId=rgreq-5ebfa79b27c5434f4f970ec2af46a12e-XXX&enrichSource=Y292ZXJQYWdlOzI2NDE5NTEwO0FTOjk5NDY4MDUzNTgxODM0QDE0MDA3MjY0NDA3MDM=

https://www.researchgate.net/publication/223960005_Conditioned_reinforcement_Experimental_and_theoretical_issues?el=1_x_8&enrichId=rgreq-5ebfa79b27c5434f4f970ec2af46a12e-XXX&enrichSource=Y292ZXJQYWdlOzI2NDE5NTEwO0FTOjk5NDY4MDUzNTgxODM0QDE0MDA3MjY0NDA3MDM=

https://www.researchgate.net/publication/223960005_Conditioned_reinforcement_Experimental_and_theoretical_issues?el=1_x_8&enrichId=rgreq-5ebfa79b27c5434f4f970ec2af46a12e-XXX&enrichSource=Y292ZXJQYWdlOzI2NDE5NTEwO0FTOjk5NDY4MDUzNTgxODM0QDE0MDA3MjY0NDA3MDM=

https://www.researchgate.net/publication/232594300_The_role_of_secondary_reinforcement_in_delayed_reward_learning?el=1_x_8&enrichId=rgreq-5ebfa79b27c5434f4f970ec2af46a12e-XXX&enrichSource=Y292ZXJQYWdlOzI2NDE5NTEwO0FTOjk5NDY4MDUzNTgxODM0QDE0MDA3MjY0NDA3MDM=

https://www.researchgate.net/publication/232594300_The_role_of_secondary_reinforcement_in_delayed_reward_learning?el=1_x_8&enrichId=rgreq-5ebfa79b27c5434f4f970ec2af46a12e-XXX&enrichSource=Y292ZXJQYWdlOzI2NDE5NTEwO0FTOjk5NDY4MDUzNTgxODM0QDE0MDA3MjY0NDA3MDM=

https://www.researchgate.net/publication/6972797_Dependency_temporal_contiguity_and_response-independent_reinforcement?el=1_x_8&enrichId=rgreq-5ebfa79b27c5434f4f970ec2af46a12e-XXX&enrichSource=Y292ZXJQYWdlOzI2NDE5NTEwO0FTOjk5NDY4MDUzNTgxODM0QDE0MDA3MjY0NDA3MDM=



https://www.researchgate.net/publication/221943410_The_Behavior_of_Organisms?el=1_x_8&enrichId=rgreq-5ebfa79b27c5434f4f970ec2af46a12e-XXX&enrichSource=Y292ZXJQYWdlOzI2NDE5NTEwO0FTOjk5NDY4MDUzNTgxODM0QDE0MDA3MjY0NDA3MDM=



https://www.researchgate.net/publication/6972948_Unsignaled_delay_of_reinforcement_in_variable_interval_schedules?el=1_x_8&enrichId=rgreq-5ebfa79b27c5434f4f970ec2af46a12e-XXX&enrichSource=Y292ZXJQYWdlOzI2NDE5NTEwO0FTOjk5NDY4MDUzNTgxODM0QDE0MDA3MjY0NDA3MDM=



https://www.researchgate.net/publication/232524269_Reinforcement_delay_A_selective_review_of_the_last_decade?el=1_x_8&enrichId=rgreq-5ebfa79b27c5434f4f970ec2af46a12e-XXX&enrichSource=Y292ZXJQYWdlOzI2NDE5NTEwO0FTOjk5NDY4MDUzNTgxODM0QDE0MDA3MjY0NDA3MDM=

https://www.researchgate.net/publication/232524269_Reinforcement_delay_A_selective_review_of_the_last_decade?el=1_x_8&enrichId=rgreq-5ebfa79b27c5434f4f970ec2af46a12e-XXX&enrichSource=Y292ZXJQYWdlOzI2NDE5NTEwO0FTOjk5NDY4MDUzNTgxODM0QDE0MDA3MjY0NDA3MDM=

https://www.researchgate.net/publication/232542496_Effects_on_performance_of_placing_a_visual_cue_at_different_temporal_locations_within_a_constant_delay_interval?el=1_x_8&enrichId=rgreq-5ebfa79b27c5434f4f970ec2af46a12e-XXX&enrichSource=Y292ZXJQYWdlOzI2NDE5NTEwO0FTOjk5NDY4MDUzNTgxODM0QDE0MDA3MjY0NDA3MDM=




342


343

EL EFECTO DE LAS SEÑALES EN PROGRAMAS DE REFORZAMIENTO DEMORADO: UNA REVISIÓN CONTEMPORÁNEA...

Documents

Transcript of EL EFECTO DE LAS SEÑALES EN PROGRAMAS DE REFORZAMIENTO DEMORADO: UNA REVISIÓN CONTEMPORÁNEA...