CAPITULO 10 CONTROL AVERSIVO: EVITACIÓN Y CASTIGO Evitación: El individuo realiza una respuesta específica para impedir la presentación de un estímulo aversivo. Este procedimiento incluye una contingencia negativa entre la respuesta instrumental y el estímulo aversivo, por lo que si se realiza la respuesta se omite el estímulo aversivo. Castigo: Involucra una contingencia positiva, por lo que la respuesta objetivo produce el resultado aversivo. Los procedimientos de evitación incrementan la ocurrencia de la conducta instrumental. Mientras que los procedimientos de castigo suprimen la respuesta instrumental. Sin embargo, en ambos procedimientos el resultado es un contacto menor con el estímulo aversivo, ambos procedimientos implican periodos crecientes de seguridad.
Evitación activa Se logra haciendo algo Evitación pasiva En el castigo, la mayor seguridad se consigue dejando de hacer de algo En el trascurso de la investigación sobre evitación y castigo, se han encontrado ciertas diferencias, los investigadores de la evitación se han centrado en cuestiones teóricas y en qué mecanismos son responsables de la conducta, cuya consecuencia principal es la ausencia de estimulación aversiva. Mientras que los investigadores del castigo se han centrado en cuestiones prácticas y éticas. CONDUCTA DE EVITACIÓN ORÍGENES DEL ESTUDIO DE LA CONDUCTA DE EVITACIÓN Las investigaciones experimentales de la conducta de evitación se originaron con los estudios de condicionamiento clásico. Los primeros experimentos fueron realizador por Vladimir Bechterevcomo una extensión de la investigación de Pavlov. Bechterev se interesó en el estudio del aprendizaje asociativo en seres humanos. Hay un aspecto importante de resaltar, el procedimiento usado era distinto al usado anteriormente por Pavlov, ya que en el condicionamiento clásico estándar la realización de la respuesta condicionada no cancela (ni cambia) la presentación del EI, mientras que en este caso si al agregarle estimulación aversiva. EL PROCEDIMIENTO DE EVITACIÓN DISCRIMINADA La evitación discriminada (evitación señalada) es un procedimiento de condicionamiento de evitación en que la presentación del estímulo aversivo es señalada por un estímulo condicionado. La respuesta emitida durante el estímulo condicionado termina el EC e impide la entrega del estímulo
Características: Se utilizan ensayos discretos. Cada ensayo es iniciado por el estímulo de advertencia o EC Ensayo de evitación exitoso: Si el sujeto emite la respuesta objetivo antes de que se aplique la descarga, el EC termina y el EI se omite en ese ensayo Ensayo de escape: Si el sujeto no emite la respuesta requerida durante el intervalo EC-EI, la descarga programada se presenta y se mantiene hasta que ocurra la respuesta, momento en el que terminan el EC y el EI. La respuesta instrumental resulta en el escape de la descarga. Los procedimientos de evitación discriminada suelen llevarse a cabo en una caja de vaivén, la cual consta de dos compartimientos separados por una abertura a nivel del piso. Existen dos tipos de procedimiento de evitación de vaivén: Evitación de vaivén en dos sentidos El animal se desplaza de izquierda a derecha en el primer ensayo y en segundo lo hace de manera inversa.
Evitación de vaivén en un sentido El animal empieza cada ensayo en el mismo lado del aparato y siempre se mueve en la misma dirección.
TEORÍA DE LOS PROCESOS DE LA EVITACIÓN Se supone que la ausencia del estímulo aversivo es la razón para que se realicen las respuestas de evitación. Pero, ¿Cómo puede la ausencia de algo proporcionar reforzamiento para la conducta instrumental? La teoría de los dos procesos supone que en el aprendizaje de evitación participan dos mecanismos:
1. El primero es un proceso de condicionamiento clásico activado por los emparejamientos del estímulo de advertencia (el EC) con el evento aversivo (El) en los ensayos en que el organismos no realiza la respuesta de evitación. (Dado que el EI es un estímulo aversivo, el EC llega a provocar miedo y lo que se produce es un condicionamiento clásico del miedo al EC). 2. El segundo proceso, se basa en el reforzamiento negativo. Mowrer, suponía que el aprendizaje de la respuesta instrumental de evitación ocurre cuando la respuesta termina con el EC y por lo tanto reduce el miedo condicionado que provoca el EC. (Por eso, el segundo componente es el reforzamiento instrumental de la respuesta de evitación por medio de la reducción del miedo). Aspectos que se deben tomar en cuenta: Hay una dependencia mutua entre los procesos clásico e instrumental. El reforzamiento instrumental por medio de la reducción del miedo no es posible hasta que el miedo se ha condicionado al EC Explica la conducta de evitación en términos del escape del miedo condicionado más que en términos de la prevención de la descarga. Se considera el hecho de que la respuesta de evitación impida la descarga es una consecuencia incidental y no el determinante principal de la conducta de evitación. El escape del miedo es el factor más importante, esto permite que la respuesta instrumental sea reforzada por un evento tangible (reducción del miedo) en lugar que por la mera ausencia de algo. ANÁLISIS EXPERIMENTAL DE LA CONDUCTA DE EVITACIÓN - Experimentos sobre la pulsión adquirida. La meta de estos experimentos es demostrar la eficacia de la evitación en un procedimiento en donde no se mezclen los procedimientos clásico e instrumental. 1. Condicionar primero el miedo a un EC con un procedimiento de condicionamiento clásico puro en el que el EC se empareje con el EI sin importar lo que haga el sujeto. 2. Los sujetos son expuestos periódicamente al EC que provoca miedo y se les permite realizar una respuesta instrumental que elimine al EC y por consecuencia reduzca el miedo (No se programan descargas) Pulsión adquirida: Fuente de motivación para la conducta instrumental ocasionada por la presentación de un estímulo que antes se condicionó con un reforzador
La motivación para realizar la respuesta instrumental no es innata, sino aprendida
Los experimentos de escape del miedo generalmente confirman la hipótesis de la teoría de los procesos, es decir la terminación de un estímulo aversivo condicionado es un reforzador eficaz de la conducta instrumental. - Medición independiente del miedo durante la adquisición de la conducta de evitación. Se basa en la suposición de que si el miedo motiva y refuerza la respuesta de evitación, entonces el condicionamiento de éste y el condicionamiento de la conducta instrumental de evitación deberían ir de la mano. Contrario a esta predicción, el miedo condicionado y la respuesta de evitación no siempre correlacionan de forma elevada. Los estudios indican que la conducta de evitación exitosa está asociada con bajos niveles de miedo y bajas expectativas de peligro. La disminución del miedo ante el EC con el entrenamiento exhaustivo de evitación supone
- Extinción de la conducta de evitación por medio del impedimento de la respuesta y la exposición al EC solo. Un procedimiento de extinción de la conducta de evitación que resulta eficaz y ha sido ampliamente investigado se denomina inundación o prevención de respuesta: El procedimiento implica la presentación del EC en una situación de evitación sin el EI, pero con el aparato modificado de tal forma que el sujeto no puede realizar la respuesta de evitación.
El sujeto es expuesto al EC sin poder terminarlo, es “inundado” por el EC. Los procedimientos de inundación tienen dos componentes: La exposición al EC sin un estímulo aversivo y el bloqueo del acceso a la respuesta de evitación Estos procedimientos pueden ser eficaces para extinguir la conducta de evitación, pues permiten el regreso del miedo y por ende lo hacen más accesible a la extinción. El bloqueo de la respuesta también deja claro la imposibilidad de emitir la respuesta ya no tiene como resultado una descarga y eso debería facilitar el reajuste de
- Evitación no discriminada (operante libre). Sidman, ideó un procedimiento de evitación que no implicaba un estímulo de advertencia denominado evitación no discriminada o de operante libre: Las presentaciones del estímulo aversivo no son señaladas por un estímulo externo. Si no se realiza la respuesta de evitación, el estímulo aversivo se presenta de manera periódica, según lo establecido por el intervalo E-E. Cada vez que el participante realiza la respuesta de evitación obtiene un período de seguridad, durante el cual no se presentan descargas.
La repetición de la respuesta de evitación antes que finalice el periodo libre de descargas permite reiniciar el periodo de seguridad. Este procedimiento se construye a partir de dos intervalos: - Intervalo E-E (Descarga-descarga): Intervalo entre descargas en ausencia de la respuesta - Intervalo (R-E) (Respuesta-descarga): Intervalo entre la respuesta de evitación y la siguiente descarga programada. Es el periodo de seguridad creado por cada respuesta. La respuesta de evitación puede ocurrir en cualquier momento y siempre reiniciará el intervalo R-E (de ahí el término de operante libre). Si el sujeto responde justo antes del final de cada intervalo R-E puede reiniciar el intervalo R-E y de ese modo prolongar indefinidamente su período de seguridad. Los diversos estudios sobre la evitación de operante libre, han descubierto los siguientes factores: 1. La tasa de respuesta es controlada por la duración de los intervalos E-E y R-E 2. Entre mayor sea la frecuencia con que se programa la descarga en ausencia de la respuesta (intervalo E-E) más probable es que el sujeto aprenda la respuesta de evitación 3. El incremento de los periodos de seguridad producidos por la respuesta de (intervalo R-E) también facilita la conducta de evitación 4. Es importante el valor relativo de los intervalos E-E y R-E, el periodo de seguridad producido por cada respuesta (intervalo R-E) tiene que ser más largo que el intervalo entre las descargas que podrían ocurrir sin la respuesta (Intervalo E-E) - La evitación de operante libre y la teoría de los dos procesos. La conducta de evitación suponía un desafío para la teoría de los dos procesos debido a que no hay un EC explicito que provoque el miedo condicionado y no queda clara la manera en la cual la respuesta de evitación reduce el miedo. Los intervalos E-E y R-E son breves y por lo general se mantienen constantes por lo que son fáciles predecirlos. La suposición del condicionamiento temporal permite la aplicación de la teoría de los dos procesos a los procedimientos de evitación de operante libre. Las señales temporales que predicen la descarga pueden cumplir en los procedimientos de operante libre la misma función que cumple el EC explícito en una evitación discriminada. Un problema sería, hacer que los intervalos E-E y R-E resulten impredecibles lo que hace más difícil utilizar el paso del tiempo como señal de la descarga. EXPLICACIONES TEÓRICAS ALTERNATIVAS DE LA CONDUCTA DE EVITACIÓN En la teoría de los dos procesos, la disminución del miedo es lo que refuerza la respuesta de evitación,. Se trata de un caso de reforzamiento negativo en el cual el reforzamiento se debe a la eliminación de un estímulo aversivo. Varios tratamientos teóricos han propuesto que los procedimientos de evitación también proporcionan un reforzamiento negativo y otros que plantean en donde ninguno de los reforzamientos es importante.
1. REFORZAMIENTO POSITIVO A TRAVÉS DE LA INHIBICIÓN CONDICIONADA DEL MIEDO O DE LAS SEÑALES CONDICIONADAS DE SEGURIDAD. El desempeño de una respuesta de evitación siempre tiene como resultado estímulos de retroalimentación distintivos, como las señales espaciales involucradas en el desplazamiento de un lado a otro en la caja de vaivén o los estímulos táctiles involucrados en la presión de la palanca. Los estímulos de retroalimentación de la respuesta pueden adquirir propiedades inhibitorias condicionadas y convertirse en señales de la ausencia de estimulación aversiva. Señales de seguridad. Estímulo que señala la ausencia de estimulación aversiva La hipótesis de la señal de seguridad plantea que estas señales que acompañan a las respuestas de evitación pueden proporcionar reforzamiento positivo para la conducta de evitación. Predice que la introducción de un estímulo de retroalimentación explicito facilitara el aprendizaje de una respuesta de evitación. - Un estímulo de retroalimentación que ha sido condicionado para inhibir el miedo durante el entrenamiento de evitación es un eficaz reforzador positivo para nuevas respuestas Las señales de retroalimentación asociadas con la respuesta pueden llegar a proporcionar reforzamiento 2. positivo para la respuesta de evitación de operante libre.
3. REFORZAMIENTO DE LA EVITACIÓN A TRAVÉS DE LA REDUCCIÓN DE LA FRECUENCIA DE DESCARGA. Por definición, las respuestas de evitación impiden la presentación de la descarga y por lo tanto reducen la frecuencia de las descargas que recibe un organismo. La hipótesis de la reducción de la frecuencia de la descarga considera que la reducción de la descarga es fundamental para el reforzamiento de la conducta de evitación. Varios experimentos han demostrado que los animales pueden aprender a emitir una respuesta de evitación incluso si la respuesta no disminuye la frecuencia de descarga que reciben. Esta evidencia sugiere que la reducción de frecuencia de la descarga no es necesaria para el aprendizaje de evitación, aún cuando puede ser un factor que contribuye a dicho aprendizaje. 4. EVITACIÓN Y REACCIONES DE DEFENSA ESPECIFICAS DE LA ESPECIE (RDEE) La falta de interés por lo que hace un organismo en los primeros ensayos del condicionamiento de evitación es un punto débil en cualquier teoría. Un mecanismo de evitación tiene que generar con rapidez respuesta de evitación exitosa para resultar útil. Bolles, se enfocó en lo que controla la conducta de un organismo en las primeras etapas del entrenamiento por evitación. Bolles, suponía que las situaciones y estímulos aversivos provocan fuertes respuestas incondicionadas o innatas, las cuales supuestamente evolucionaron, ya que son una defensa exitosa en contra del dolor y el daño. Reacciones de defensa específicas de la especie (RDEE): Respuestas típicas de la especie que realizan los animales en una situación aversiva. Las respuestas pueden incluir congelamiento,
La configuración del ambiente determina qué reacción de defensa específica de la especie es la que ocurre. Por ejemplo, la huida puede prevalecer cuando se dispone de una ruta de escape evidente y el congelamiento puede predominar si no hay salida de la situación. - La inminencia depredadora y las conductas defensivas y de recuperación De acuerdo con el continuo de inminencia depredadora, ocurren diferentes respuestas defensivas dependiendo del nivel de peligro que enfrenta un animal. Se supone que en diferentes niveles de la inminencia depredadora ocurren diferentes tipos de respuestas de defensa específicas de la especie. La hipótesis de la inminencia depredadora supone que la conducta defensiva ocurre al principio como una respuesta incondicionada. Las respuestas defensivas también pueden llegar a ser provocadas por un estímulo condicionado si éste se asocia con un evento aversivo. Ninguna de las teorías principales puede explicar todos los aspectos de la evitación. No obstante, cada una ofrece ideas que nos ayudan a entender algunos de esos aspectos. Por ejemplo: La teoría de los dos procesos es útil para explicarlos resultados del escape de los experimentos de miedo La teoría de la señal de seguridad es útil para explicar el aprendizaje de evitación de operante libre Y el concepto de inminencia depredadora es útil para estudiar lo que sucede durante las primeras etapas del
CASTIGO ANÁLISIS EXPERIMENTAL DEL CASTIGO Procedimiento básico: Se presenta un estímulo aversivo después de una respuesta instrumental objetivo Si el procedimiento es eficaz, la respuesta objetivo es suprimida Los estudios del castigo por lo regular comienzan con una fase preliminar en la que se establece la respuesta objetivo con reforzamiento positivo. Luego se sobrepone un procedimiento de castigo al programa de reforzamiento positivo, lo cual produce un conflicto entre responder para obtener el reforzador y no hacerlo para evitar el castigo. Factores del castigo: 1. Características del estímulo aversivo y método con el que se introduce. El castigo tiene que ser en el momento en el que ocurre la conducta y de gran intensidad. En los experimentos de castigo se utilizan diversos estímulos aversivos (descargas, ráfaga repentina de aire, ruido fuerte, una bofetada, etc), la utilización de otros métodos han implicado la pérdida de ref. Positivo, tiempo fuera de reforzamiento positivo, sobre corrección y restricción manual. -Tiempo fuera Eliminación de la oportunidad de obtener reforzamiento positivo
-Sobrecorrección Pedir a la persona no sólo que corrija lo que hizo mal, sino que
El otro aspecto es la forma la cual se introduce el estímulo aversivo, la exposición a un castigo de baja intensidad genera resistencia e inmuniza al sujeto contra los efectos del castigo más severo. La manera en la que los organismos responden a la exposición inicial al castigo determina la manera en que responderán más tarde al mismo. 2. Efectos de la demora del castigo. Aumentar la demora del castigo produce menos supresión de la conducta. 3. Efectos de los programas de castigo. El grado de la supresión de la respuesta producida por el castigo dependerá de la proporción de respuestas que son castigadas. Es más efectivo cuando el programa es continuo. Los programas de razones fijas más altas permiten que más respuestas se queden sin castigo. 4. Tipos y programas de reforzamiento positivo. Los efectos del castigo dependen del reforzador que mantiene la respuesta objetivo. Ejemplo: Cuando el reforzador son las drogas la gente sigue consumiéndolas aun cuando esto le ocasione la pérdida de trabajo, familia, casa y salud. - Cuando la conducta es mantenida por un programa de intervalo fijo o variable de reforzamiento positivo, el castigo produce una disminución en la tasa total de respuestas. Sin embargo, la distribución temporal de la conducta no se ve alterada. El ref positivo de IV produce una tasa de respuestas suprimida pero estable, el ref positivo de IF produce el típico patrón festoneado de respuestas.El castigo suele incrementar la duración de la pausa post reforzamiento pero tiene poco efecto sobre la carrera de razón. 5. Disponibilidad de fuentes alternativas de reforzamiento positivo. Si la respuesta castigada es la única actividad que dispone el sujeto para obtener reforzamiento, el castigo será menos eficiente que si además de castigar al sujeto se le proporciona una fuente alternativa de reforzamiento. 6. Efectos de un estímulo discriminativo para el castigo. Castigo discriminado Cuando la respuesta es castigada en presencia de un estímulo discriminativo pero no se castiga en ausencia de ese estímulo En muchas situaciones, la persona que aplica el castigo se convierte en un estímulo discriminativo del mismo. 7. El castigo como señal de la disponibilidad de reforzamiento positivo. Es posible que se busque el castigo si sólo se dispone de reforzamiento positivo cuando la respuesta instrumental también es castigada. Si eso sucede, el castigo incrementará la respuesta en lugar de suprimirla. Desventajas del castigo:
- Supresión general de conductas. - Efectos emocionales negativos (ira, miedo) - Efectos conductuales (agresión) TEORÍAS DEL CASTIGO - La teoría de la respuesta emocional condicionada (Propuesta por Estes) Se basa en el supuesto de que un estímulo condicionado que es emparejado con una descarga suprimirá el desempeño de la conducta instrumental reforzada con comida. Propuso que el castigo suprime la conducta por medio del mismo mecanismo que produce la supresión condicionada ante un estímulo condicionado con el miedo. Los procedimientos de castigo por lo regular no involucran un EC explicito que señale la presentación inminente de un estímulo aversivo. Según esta teoría, a medida que esas señales adquieren propiedades aversivas condicionadas, llegarán a provocar congelamiento, que es incompatible con la conducta castigada, por consiguiente la respuesta castigada será suprimida. Las respuestas emocionales condicionadas tienen mayor probabilidad de interferir con la respuesta castigada. - Teoría de la evitación del castigo. Considera al castigo como una forma de conducta de evitación. Se propuso que los organismos aprenden a escapar de los estímulos aversivos condicionados relacionados con la conducta castigada realizando alguna otra conducta que sea incompatible con la actividad castigada. La teoría de la evitación explica el castigo en términos de la adquisición de respuestas de evitación incompatibles. Dado que explica el castigo en términos de mecanismos de evitación, los problemas teóricos del análisis de la conducta de evitación también los presenta esta perspectiva del castigo. Otro dificultad es que sus elementos fundamentales no están planteados de una forma que se puedan comprobar. - El castigo y la ley negativa del efecto Thorndike, propuso originalmente que el reforzamiento positivo y el castigo involucran procesos simétricamente opuestos. Premack, iniciaron la aproximación a la versión de la ley negativa del efecto. Premack propuso que el reforzamiento positivo ocurre cuando la oportunidad para realizar una actividad muy valorada se hace depender del desempeño previo de una actividad que se valora menos. De acuerdo a esto, la contingencia de castigo invierte esa relación. En el castigo, una actividad poco valorada ocurre de manera contingente al desempeño de una conducta altamente valorada. EL CASTIGO FUERA DEL LABORATORIO Los procedimientos del castigo son susceptibles al abuso, y por lo general no se aplican de forma adecuada: Cuando se introduce, suele hacerse con intensidades bajas El estímulo aversivo no se presenta inmediatamente después Se aplica con un programa intermitente No es acompañado por fuertes alternativas de reforzamiento Existen muchos estímulos claros discriminativos para el castigo El castigo puede ser la única fuente de atención, lo que lo convierte en un Estímulo discriminativo del reforzamiento positivo