Programas de Reforzamiento LA LEY EMPÍRICA DEL EFECTO Contingencia de respuesta-reforzador y Organización de la conducta
Una respuesta operante es una respuesta que controla la presentación de una consecuencia (contingencia positiva) o que previene o termina el estímulo al que controla (contingencia negativa). El reforzamiento puede crear una nueva respuesta, modificar una respuesta existente o producir variabilidad conductual.
Por el tipo de contingencia entre la respuesta-consecuencia y el tipo de estímulo empleado, existen cuatro procedimientos de condicionamiento operante: a)reforzamiento positivo, la respuesta produce una consecuencia apetitiva, b)reforzamiento negativo, la respuesta evita una consecuencia aversiva, c) castigo positivo, la respuesta produce una consecuencia aversiva y d) castigo negativo, la respuesta evita una consecuencia apetitiva. Los programas de reforzamiento son las reglas que indican cuándo y cómo se presentará la consecuencia después de que se ejecuta la respuesta operante. Existen cuatro tipos de programas de reforzamiento: •Razón Fija, •Razón Variable, •Intervalo Fijo •Intervalo Variable. En los programas de razón, la entrega del reforzador depende del número de respuestas que hace el animal. En un programa de Razón Fija, el reforzador se entrega después de que se emite un número fijo de respuestas(ejemplo, en un RF5 el reforzador se entrega después de que el animal da 5 respuestas); en los programas de Razón Variable, el reforzador se entrega después de que se emite un número variable de respuestas que se encuentran alrededor de un promedio (ejemplo, en un RV5 el reforzador se entregará en promedio cada 5 respuestas, esto es, en ocasiones después de 4 respuestas, otras veces después de 6, otras de 5, etc.). En los programas de intervalo, el reforzador está disponible hasta después de que transcurre un intervalo de tiempo y se entrega en el momento en que se ejecuta la respuesta operante una vez transcurrido el intervalo. En un programa de Intervalo Fijo el reforzador está disponible después de un intervalo fijo de tiempo y se entrega sólo si el animal da una respuesta después de transcurrido el intervalo(ejemplo, en un IF3min, el reforzador sólo está disponible después de que transcurren 3 min, por lo que la primer respuesta que da el animal después de que pasan los 3 min, será reforzada). En un programa de Intervalo Variable, el reforzador está disponible después de un tiempo promedio (ejemplo, en un IV3min el reforzador estará disponible en promedio cada 3 minutos, puede ser a los 2, 3 y 4 minutos).
Es importante no confundir los programas de Intervalo con los de Tiempo. En los programas de Tiempo (fijo o variable), el reforzador se entrega después de que transcurra el intervalo establecido y no es necesario que el animal emita una respuesta. Mientras que en los programas de Intervalo se necesitan 2 condiciones para recibir el reforzador: a) que transcurra el tiempo establecido y b) que el animal ejecute la respuesta (no importa si es justo al terminar el intervalo o mucho tiempo después). Si se hace una gráfica de registro acumulativo de las respuestas ante los 4 programas de reforzamiento, se obtienen distintos patrones (ver Figura 1). En los programas de RF los animales responden de manera rápida y constante hasta alcanzar el criterio de reforzamiento, sin embargo, una vez que obtienen el reforzador hacen una pausa post-reforzamiento. En los programas de RV los animales responden más rápido que en los de RF y lo hacen de manera constante sin hacer pausas predecibles.
Fig. 1. Se muestran los patrones de respuestas que se generan bajo los 4 diferentes programas de reforzamiento: RF, RV, IF e IV
Bajo los programas de IF los animales no responden mientras transcurre el intervalo y sólo cuando el intervalo va a llegar a su final comienzan a responder de manera muy rápida y constante, generando una curva que se conoce como festón. Bajo programas de IV, los sujetos responden de manera muy lenta pero constante (sin pausas predecibles y es el programa en el que se responde más lento). Durante la extinción, la respuesta operante ya no es seguida de la consecuencia. El patrón conductual en la extinción es un incremento en la respuesta operante llamado “ráfaga de respuestas” seguido de la disminución en la tasa de la respuesta. Cuando se extingue una conducta y se vuelve a colocar al sujeto ante la misma situación, se vuelve a presentar la respuesta operante; a este fenómeno se le conoce como “recuperación espontánea”.
Objetivo: El alumno entrenará al comedero a una rata virtual, le moldeará la respuesta de palanqueo, la reforzará bajo un programa de reforzamiento, le extinguirá la conducta y observará el efecto de recuperación espontánea.
Lugar: Laboratorio de Cómputo. Material: •Programa “Sniffy The Virtual Rat” •Computadora •Memoria USB Duración: 4 horas.
Desarrollo: A) Cada alumno trabajará en una computadora. B) La práctica consistirá en 5 pasos que cada alumno debe realizar con Sniffy: 1. Entrenamiento a comedero, 2. Moldeamiento a la palanca, 3. Programa de reforzamiento, 4. Extinción y 5. Recuperación espontánea. C) Entrar al programa “Sniffy The Virtual Rat”. Te encontrarás con las siguientes ventanas en la pantalla:
D) Realiza los siguientes pasos: 1. ENTRENAMIENTO AL COMEDERO a) Graba tu archivo como “comedero”. Para guardarlo, en la barra de Menú entra a: File Save As comedero aprieta “OK” b) Cada vez que la rata se aproxime al comedero entrégale un pellet de comida (aprieta la barra espaciadora o da un “click” con el mouse sobre la palanca de la caja operante). c) Sniffy estará condicionada clásicamente al comedero cuando la barra “sound-food” de la gráfica de Asociación Operante llegue al máximo. d) Guarda el archivo (NO OLVIDAR ESTE PASO)
2. MOLDEAMIENTO A LA PALANCA a) Abre el archivo “comedero” b) Guarda el archivo como “palanca” c) Moldea a la rata por aproximaciones sucesivas para que apriete la palanca. Sniffy estará condicionada operantemente a la palanca cuando la barra “barsound” de la gráfica de Asociación Operante llegue al máximo. d) Guarda el archivo.
3. PROGRAMA DE REFORZAMIENTO a) Abre el archivo “palanca” b) Se le asignará a cada persona un programa de reforzamiento. Para entrenar a Sniffy deberán ir incrementando la razón (si es un programa de RF o RV) o el tiempo (IF o IV) poco a poco. Por ejemplo, si deben entrenar a Sniffy en un programa RF25, háganlo con los pasos intermedios: RF2, RF5, RF10, RF15, RF20 para terminar con RF25, de otra manera se extinguirá la conducta de palanqueo (si intentan dar saltos muy grandes pues para la rata será como si no hubiera reforzador por apretar la palanca). c) Guarda el archivo para cada paso de tu entrenamiento con el nombre que corresponda al programa que vas a emplear (ejemplo, “RF2”). d) En la barra de Menú entra a las opciones: Experiment Design Operant Experiment. Saldrá una ventana, marca la opción “Fixed” si vas a emplear un programa fijo y “Variable” si vas a emplear un programa variable. Escribe en la ventana el valor de la razón o el tiempo en segundos. Marca la opción “Seconds” si vas a emplear un programa de intervalo y “Responses” si vas a emplear un programa de razón. Aprieta el botón “OK”.
e) Sniffy estará condicionada al programa de reforzamiento cuando la barra “bar-sound” de la gráfica de Asociación Operante llegue al máximo y se mantenga ahí.
f) Guarda el archivo. g) Entrena el siguiente paso (ejemplo RF5 y repite los puntos del “a” al“g” hasta que alcances el valor que se te pidió entrenar, por ejemplo RF25).
NOTA: Al introducir los datos para programar el experimento, la caja operante entregará a Sniffy los reforzadores en el momento adecuado (número y tiempo), tú ya no tienes que entregar los reforzadores, la computadora lo hace (si llegas a entregar un reforzador será como “regalarle” uno a Sniffy y dificultarás su entrenamiento). Tu papel en el punto 3 sólo será el de observar cómo aprende Sniffy e ir introduciendo los datos para cada uno de los pasos que se entrenarán (ej, RV2, RV5, RV10, RV15, RV20, RV25). No te asustes si al empezar a entrenar el programa de reforzamiento baja el nivel de la barra “bar-sound”, esto es normal pues inicia un nuevo aprendizaje por lo que se pierde por un tiempo la asociación entre la palanca y el reforzador, la barra deberá volver a su nivel máximo cuando la rata aprenda la nueva contingencia (ejemplo RF2).
Truco: Al iniciar el entrenamiento de los diferentes programas de reforzamiento, te darás cuenta que en ocasiones Sniffy tarda mucho en aprender (la barra “bar-sound” sube a su máximo pero no se mantiene ahí sino que sube y baja constantemente). Lo que puedes hacer para “apresurar” el aprendizaje es cerrarle a Sniffy la puerta de la caja operante, así no se distraerá y aprenderá más rápido. Para hacer esto debes ir al Menú y elegir Experiment Isolate Sniffy. Verás cómo se cierra la puerta y cómo el registro acumulativo avanza rápidamente. Cuando la Sniffy aprenda a responder en el programa que le pediste puedes volver a verla seleccionando en el Menú: Experiment Show Sniffy. Puedes repetir esto para cada paso del entrenamiento (también para la extinción).
4. EXTINCIÓN a) Abre el último archivo que empleaste (por ejemplo, RF25) b) Guarda el archivo como “extinción” c) En la barra de Menú entra a las opciones: Experiment Design Operant Experiment: - marca la opción “Extinction” - marca la opción “Mute Dispenser” - Aprieta el botón “OK” d) La conducta de Sniffy se extinguirá cuando la barra “bar-sound” de la gráfica de Asociación Operante llegue al mínimo. e) Guarda el archivo.
5. RECUPERACIÓN ESPONTÁNEA a) Abre el archivo “extinción” b) Guarda el archivo como “recuperación espontánea” c) En la barra de Menú entra a las opciones: Experiment Remove Sniffy for Time-Out aprieta “OK”. Esta opción simulará que retiraste a Sniffy de la caja operante y que después de un tiempo, la volviste a colocar en la caja. d) Observa la recuperación espontánea de la conducta. e) Guarda el archivo. E) REPORTE ESCRITO Hacer un análisis de lo observado en cada uno de los pasos (1-5) en los que se entrenó Sniffy. Para los pasos del 2 al 5 se deberá copiar la gráfica de registro acumulativo y pegarla en un Documento de Word. Se incluirá en el reporte de la práctica un análisis del patrón de conducta que se observa en cada una de las gráficas (del paso 2 al 5). Para copiar la gráfica seleccionen la ventana del registro acumulativo (hacer click en cualquier parte de la gráfica de manera que la barra superior se vea de azul más brillante que el de las demás ventanas). Ir al Menú y en Edición seleccionar “copiar ventana actual”. Posteriormente abrir un documento nuevo en Word y pegar la imagen. Las conclusiones deberán incluir una breve discusión sobre lo aprendido en la práctica así como las dificultades encontradas para entrenar a Sniffy en relación a la teoría revisada en clase.