ESCUELA DE PSICOLOGÍA
PRÁCTICA N° 08 CURSO: PSICOLOGÍA EXPERIMENTAL
Docente: Ps. Karla Azabache Alvarado
Ejercicio 45: Moldear a Sniffy para rodar 1. OBJETIVOS 1.1.
Generales
Desarrollar la conducta “rodar” en la rata virtual llamada Sniffy.
Desarrollar el moldeado de la conducta conducta del sujeto experimental para que ruede. Específicos
1.2.
Observar qué llega a ocurrir tras reforzar una conducta mediante el grado de moldeado. Aplicar la técnica de reforzamiento para condicionar a Sniffy
2. BASE TEÓRICA
Condicionamiento Operante Reynolds,G(1968). Explica que el término condicionamiento operante se refiere a un proceso en el cual la frecuencia con que está ocurriendo una conducta, se modifica o se altera debido a las consecuencias que esa conducta produce; es la teoría conductista formulada por B. F. Skinner quien, en los años treinta, publica una serie de artículos con los resultados de sus estudios de laboratorio con animales, en los cuales identifico los diversos componentes del condicionamiento operante. Buena parte de sus primeros trabajos se encuentra resumida en su muy influyente libro de 1938, The Behavior of Organisms. Y luego fue utilizado por Thorndike, quien sugiere que la conducta sirve de "instrumento" para conseguir un fin y se da por ensayo ensayo y error, a error, a diferencia del condicionamiento operante planteado por Skinner, que establece que aquellas respuestas que se vean reforzadas tienen tendencia a repetirse y aquellas que reciban un castigo tendrán menos probabilidad de repetirse.
Refuerzo De acuerdo con Schunk, D. (1997) el refuerzo es el proceso responsable del fortalecimiento de las respuestas, el que incrementa su tasa o hace que sea más probable que ocurran. EI reforzador (o estimulo reforzante) es el estímulo o acontecimiento que sigue a la respuesta y la fortalece: “ La única característica definitoria del estímulo reforzador es que refuerza ”. Guerrero, J. (1973) explica que:
Refuerzo positivo: es todo aquel evento que al ser representado
después de una conducta determinada produce consistentemente un aumento en la probabilidad de la ocurrencia futura de esa conducta. Refuerzo negativo: es todo aquel evento que, al ser retirado como producto de una conducta, aumenta la probabilidad futura de ocurrencia de esa conducta.
Programas de reforzamiento
Según Becerra, R (2010) En condicionamiento operante, los programas de reforzamiento son reglas que indican el momento y la forma en que la aparición de la respuesta va a ir seguida de un reforzador sobre la administración del reforzador. Estos programas influyen en distintos aspectos del aprendizaje, como la rapidez con la que se aprende inicialmente la respuesta, la frecuencia con la que se ejecuta la respuesta aprendida, la frecuencia con la que se hacen las pausas después de los reforzamientos, o el tiempo que se sigue ejecutando la respuesta una vez que el refuerzo deja de ser predecible o se suspende.
Tipos: Existen dos tipos básicos de reforzamiento: el
reforzamiento continuo y el reforzamiento intermitente.
En el reforzamiento continuo cada una de las respuestas da lugar a la aparición de un reforzador, como en el caso de una paloma que recibe comida cada vez que picotea una tecla. Este tipo de
reforzamiento parece ser el modo más eficaz para condicionar inicialmente la conducta. Sin embargo, cuando el refuerzo cesa (por ejemplo, cuando desconectamos la entrega de alimento) la extinción también es rápida. Por su parte, en el reforzamiento intermitente las respuestas solo se refuerzan algunas veces, como en el caso de una persona que juega a las máquinas y recibe el refuerzo o premio cada varias jugadas. Este tipo de programa produce un patrón más persistente de respuestas que un programa continuo cuando el reforzamiento se vuelve impredecible o cesa. Una combinación de reforzamiento intermitente y de refuerzo continuo es muy eficaz cuando se trata de enseñar a los sujetos mediante condicionamiento operante: al principio se utiliza un reforzamiento continuo, para que se adquiera la respuesta, y luego se pasa a un reforzamiento intermitente, para que sea más difícil que se extinga.
El reforzamiento intermitente da lugar a los programas de reforzamiento, que pueden ser de dos tipos: de ra zón (en función del número de respuestas) y de intervalo (en función del tiempo). A su vez, cada uno de ellos admite dos tipos de administración: fija o variable.
Razón fija: El refuerzo se obtiene después de un número
fijo de respuestas. Un ejemplo se da cuando las fábricas pagan a sus obreros después de producir un determinado número de productos. En realidad, el reforzamiento continuo es un programa de este tipo de razón 1. Los individuos responden con una tasa relativamente mayor de respuestas cuando operan bajo programas de razón fija superior a 1 (dependerá del caso aplicar la razón más adecuada), pero por lo general hacen una pausa para descansar después de recibir el reforzamiento, antes de proseguir con la respuesta. Razón variable: En este caso, el número de respuestas para conseguir el reforzador varía aleatoriamente, aunque siempre dentro de un promedio determinado. Un ejemplo son las máquinas tragamonedas, que están programadas para otorgar el premio conforme a un
programa de razón variable. Muchos reforzadores naturales, como el logro o el reconocimiento, se acercan mucho a este tipo de programas. Los programas de razón variable producen una tasa de respuesta global elevada sostenida, y los individuos no hacen pausa después del refuerzo. Aparentemente, la incertidumbre de no saber cuándo va a llegar el siguiente reforzador mantiene a los organismos produciendo la respuesta constantemente. Intervalo fijo: El refuerzo aparece cada vez que trascurre una determinada cantidad de tiempo, siempre que durante el intervalo se haya dado la respuesta. Un ejemplo sería el de un padre que verifica cada media hora que su hijo está estudiando, y cuando es así le hace un halago. Los problemas de intervalo fijo producen una tasa de respuestas desigual. Una vez que se administra el refuerzo, la tasa de respuestas tiende a ser baja. Durante el intervalo, la conducta aumenta típicamente hasta alcanzar un nivel elevado inmediatamente antes del siguiente reforzador programado. La cantidad global de respuestas en un programa de intervalos fijos es moderada. Intervalo variable: El refuerzo está disponible después de un tiempo que varía aleatoriamente, pero alrededor de un promedio. Un ejemplo es el de un profesor que realiza exámenes sorpresa aproximadamente cada semana. Este tipo de programa por lo general produce una tasa de respuesta constante, pero moderada.
Moldeado La página web De Perros. Org menciona lo siguiente: El moldeado es una técnica que permite desarrollar conductas complejas que no están presen tes en el repertorio del individuo y, por tanto, no se pueden reforzar directamente. Por ejemplo, que un perro apoye sus patas traseras en la pared mientras mantiene las delanteras en el suelo. Esta conducta sería imposible de reforzar directamente porque el perro no la realiza nunca de forma espontánea. Para moldear una conducta final, tienes que reforzar pequeñas aproximaciones sucesivas a dicha conducta, hasta que ésta se produce. Por
ejemplo, para lograr que tu perro apoye sus patas traseras sobre la pared, puedes empezar reforzando cada vez que mueve hacia atrás una de esas patas. Luego, refuerzas cuando levanta una pata trasera. Después refue rzas que toque la pared con una pata trasera. Y así sucesivamente, hasta que levante las dos patas traseras y las apoye contra la pared. El moldeado de conductas es una técnica muy útil par a conseguir conductas que no son naturales, pero no es la única. Otras técnicas son igualmente efectivas, pero el moldeado tiene la ventaja de que favorece el aprendizaje futuro, desarrolla la creatividad y no necesita la manipulación física (forzar al perro). Para que mejorar la noción del tema: Es común que los adiestradores confundan moldeado con modelado. El modelado es una técnica diferente que consiste en manipular físicamente al perro hasta obligarlo a realizar la conducta deseada. Por su parte, el encadenamiento de conductas consiste en ordenar en una secuencia varias conductas que existen en el repertorio del individuo. La conducta compleja final es la secuencia completa, y se conoce como cadena de conductas. Por ejemplo, uno de los ejercicios del Schutzhund consiste en que el perro salte una valla y recoja un objeto que ha sido lanzado por el guía. Luego, salta la valla de vuelta y entrega el objeto a su guía. Este ejercicio es una cadena de conductas que involucra siete pasos: correr hacia la valla de ida, saltar la valla de ida, tomar el objeto con la boca, correr hacia la valla de vuelta, saltar la valla de vuelta, correr hacia el guía y entregar el objeto. Cada uno de estos pasos puede ser entrenado por separado y luego se unen en una sola cadena de conductas. A diferencia del moldeado, las cadenas de conductas se suelen construir de atrás para adelante. Es decir que primero se trabaja sobre el final de la cadena (en el ejemplo anterior sería entregar el objeto) y sucesivamente se van añadiendo las conductas anteriores.
Los organismos experimentales: La investigación en el condicionamiento operante requiere de un control detallado, extensivo y preciso del medio en el que se desarrollan los sujetos de un experimento (por lo mismo los seres humanos comúnmente no pueden ser usados como sujetos). Debido a razones de estandarización y conveniencia, por lo general es un pichón o una rata o un mono. Estos animales frecuentemente se crían específicamente con fines de investigación. De esa manera se llega al laboratorio del experimentador que
maneja técnicas de condicionamiento operante, también ahí tienen un medio bastante controlado.
El equipo programador: Los equipos de programación y de registro no varían en forma apreciable respecto a las diversas especies de animales experimentales. El equipo programador consta de interruptores operados eléctricamente, de relevadores, de contadores y de otros accesorios. Estos están conectados a circuitos para poder determinar la secuencia de eventos ambientales dentro de la cámara y para integrar la ocurrencia de eventos en relaciones específicas con la ocurrencia de respuestas. Hay muchas razones por las cuales resulta esencial el equipo eléctrico automático en la investigación conductual. En primer lugar, los programas y las alternativas dentro de los experimentos, a menudo son demasiado complejos como para que una sola persona los pueda manejar eficazmente. Además, las dos o tres horas que duran las sesiones pondrían serios obstáculos a la eficacia de una persona. El equipo automático realiza decisiones complejas en forma fácil, confiable y objetiva durante toda la sesión experimental. Otra ventaja del equipo automático es la libertad que le proporciona al experimentador. En lugar de pararse en una tediosa observación de un organismo, hora tras hora, o día tras día, el equipo automático libera al experimentador para que pueda utilizar su tiempo en forma más provechosa. Al eliminar la intervención humana durante la sesión experimental, se eliminan los prejuicios. El experimentador no tiene que estar adivinando si la palanca fue o no presionada cada vez que la rata la toca. El equipo decide esto, siempre de acuerdo al mismo criterio.
El registrador acumulativo: El aparato de registro más comúnmente utilizado en el condicionamiento operante es el registrador acumulativo. Este aparato proporciona una gráfica del número (total) acumulado de respuestas en función del tiempo. Durante una sesión experimental, el motor hace que el papel avance a una velocidad constante. Cada vez que se opera la palanca o la llave, la plumilla da un paso hacia arriba. De ese modo, el tiempo se mide a lo largo del papel (la abscisa), mientras que las respuestas son contadas a lo ancho (la ordenada). La gráfica resultante es un registro continuo de la conducta durante una sesión completa.
Los registradores acumulativos son especialmente útiles en el estudio de la tasa de ocurrencia de una respuesta, ya que permiten una lectura fácil de la tasa de respuestas y de los cambios asociados a ella que ocurren en el tiempo, a partir de la observación de la pendiente del registro. Dado que el papel avanza a una velocidad constante, cuando el animal responde con una tasa alta, se produce una gráfica bastante escarpada; cuando se responde con poca frecuencia, se produce una gráfica plana casi horizontal, y cuando se responde con una tasa intermedia, se producen gráficas con una pendiente intermedia. Los cambios en la tasa o probabilidad de respuesta dentro del tiempo, los cuales son considerados como una función de la manipulación experimental, se reflejan a través d e cambios en la pendiente del registro. En la mayoría de los experimentos, el registro acumulativo puede ser reemplazado por otros aparatos de registro, tales como contadores eléctricos que solo registran el número total de respuestas dentro de un determinado período de tiempo, y los cronómetros que pueden registrar el tiempo entre respuestas, el tiempo entre respuestas y estímulos o bien el tiempo entre dos eventos sucesivos. 3. HIPÓTESIS Primero reforzar la conducta de bajar la cabeza y luego la de esconder la cabeza entre las patas traseras, para lograr moldear la conducta y hacerla rodar 3.1. Variables:
Causa: Refuerzo de las conductas agachar la cabeza y esconderla entre las patas Efecto: Conducta de rodar.
4. PROCEDIMIENTO EXPERIMENTAL 4.1. Equipo utilizado: -
-
Caja experimental virtual de Skinner, es una celda completamente aislada a prueba de sonidos. Contiene un bebedero, un comedero y una palanca, la cual al presionarse cae una bolita de comida. Programa Sniffy Pro 2.0, es el resultado de la evolución de la tecnología informática, que permite configurar y realizar un amplio abanico de experimentos de condicionamiento clásico y operante y, además, ofrece la posibilidad de
-
recopilar y presentar datos de una forma que simula los métodos que siguen los psicólogos cuando realizan esta misma tarea en sus laboratorios. Además, como el programa simula y muestra algunos de los procesos psicológicos que, según expertos, son empleados por los animales, también presenta algunos elementos del aprendizaje que no se podrían observar si se trabajara con un animal vivo. Rata virtual, Sniffy, es el personaje animado que aparece en la pantalla del equipo. Este personaje blanco, se creó grabando en video a una rata de laboratorio viva mientras se movía de forma espontánea en una jaula de cristal dispuesta sobre un fondo azul. Se seleccionaron 40 secuencias breves de comportamiento de la rata y se produjo casi 600 fotogramas que muestran a Sniffy en diferentes posturas y orientaciones. Sniffy tendrá que ser condicionado con la recompensa de una galleta (comida) cada vez que realice la conducta esperada.
4.2. Procedimiento experimental: a) Cada vez que Sniffy agacha la cabeza se le otorga una bolita de comida. De ese modo hasta que se establezca la conducta. b) Cuando Sniffy esconde la cabeza entre las patas, se le otorga un reforzador hasta que la conducta esté bien reforzada. c) Se observa detenidamente hasta conseguir la conducta esperada y ésta será la única conducta que se reforzará (ya no cuando agacha la cabeza o la esconde entre las patas). 5. RESULTADOS Y ANÁLISIS DE LOS RESULTADOS IMAGEN 1: SNIFFY AL COMENZAR LA CONDUCTA DE RODAR
Como se muestra en la Figura 1, antes de desarrollar el procedimiento, Sniffy no relaciona el sonido del dispensador con la bola de alimento por rodar.
IMAGEN 2: SNIFFY RODANDO
Como se muestra en la figura 2, Sniffy llegó a desarrollar la asociación. La asociación es la relación que establece el animal entre el poder rodar para que se le de una bola de comida.
IMAGEN 3: VENTANA MENTAL ASOCIACIONES OPERANTES
En la imagen 3 se observa que la barra de Sonido comida, se mantiene al máximo, sin embargo, la barra de Barra-sonido desapareció y la de fuerza de la acción ha disminuido una cuarta parte. R egis tros A cumulativos
IMAGEN 4: A INICIOS DEL EXPERIMENTO
Como se muestra en la figura 4 se observa que al comenzar Sniffy no moldea la conducta rápidamente de rodar.
IMAGEN 5: AL PASAR UNOS MINUTOS DEL INICIO DEL EXPERIMENTO
Pasaron varios minutos desde el inicio del experimento hasta observar la primera voltereta del sujeto experimental. Ello se debió a que primero se reforzaron las conductas de bajar la cabeza y luego la de esconder la cabeza entre las patas. Fue así como luego de estar bien reforzadas las conductas anteriores Sniffy comenzó a rodar. Siendo esta la nueva conducta por reforzar.
IMAGEN 6: A MEDIADOS DEL EXPERIMENTO
Se puede observar cómo las conductas de dar volteretas se van instalando y se van repitiendo.
IMAGEN 7: AL FINALIZAR EL EXPERIMENTO
Se puede apreciar cómo la conducta de Sniffy se ha instalado de tal manera que ha llegado a realizar hasta 24 conductas durante 5 minutos. 5. CONCLUSIONES
Tras reforzar una conducta mediante la función de moldeado, se puede lograr que el sujeto experimental realice conductas complejas.
Se realizó el moldeado de la conducta del sujeto experimental, logrando que dé vueltas. Se logró al reforzar dos conductas: agachar la cabeza y esconderla entre las patas.
6. RECOMENDACIONES 7. BIBLIOGRAFÍA 1.
De Perros . Org. (2007). Moldeado y encadenamiento de conductas. Recuperado el 20 de junio de 2016. http://www.deperros.org/adiestramiento/moldeado-conducta-perros.html
2.
Alloway, T. (2006). Sniffy La Rata Virtual Pro versión 2.0 . Madrid: Thomson.
3.
Reynolds,G. (1968). COMPENDIO DE CONDICIONAMIENTO OPERANTE . San Diego. Universidad de California.
4.
Schunk, D. (1997). Teorias del Aprendizaje . 2 ed. Mexico. Prentice-Hall.
5.
Guerrero, J. (1973). “El sistema psicológico de B. F. Skinner ”. Revista Latinoamericana de Psicología, 5(2) pp. 191-216.