El documento resume las principales teorías del refuerzo de Thorndike y Hull, así como la teoría de Premack. Thorndike propuso la ley del efecto para explicar cómo el refuerzo aumenta la probabilidad de una respuesta, pero no especificó el mecanismo. Hull explicó que los refuerzos reducen los estados de impulso, pero no pudo explicar el refuerzo sensorial. Premack propuso que una respuesta de alta probabilidad puede reforzar una de baja probabilidad, independientemente del estado de impulso. Este principio revolucionó el
0 calificaciones0% encontró este documento útil (0 votos)
359 vistas7 páginas
El documento resume las principales teorías del refuerzo de Thorndike y Hull, así como la teoría de Premack. Thorndike propuso la ley del efecto para explicar cómo el refuerzo aumenta la probabilidad de una respuesta, pero no especificó el mecanismo. Hull explicó que los refuerzos reducen los estados de impulso, pero no pudo explicar el refuerzo sensorial. Premack propuso que una respuesta de alta probabilidad puede reforzar una de baja probabilidad, independientemente del estado de impulso. Este principio revolucionó el
El documento resume las principales teorías del refuerzo de Thorndike y Hull, así como la teoría de Premack. Thorndike propuso la ley del efecto para explicar cómo el refuerzo aumenta la probabilidad de una respuesta, pero no especificó el mecanismo. Hull explicó que los refuerzos reducen los estados de impulso, pero no pudo explicar el refuerzo sensorial. Premack propuso que una respuesta de alta probabilidad puede reforzar una de baja probabilidad, independientemente del estado de impulso. Este principio revolucionó el
El documento resume las principales teorías del refuerzo de Thorndike y Hull, así como la teoría de Premack. Thorndike propuso la ley del efecto para explicar cómo el refuerzo aumenta la probabilidad de una respuesta, pero no especificó el mecanismo. Hull explicó que los refuerzos reducen los estados de impulso, pero no pudo explicar el refuerzo sensorial. Premack propuso que una respuesta de alta probabilidad puede reforzar una de baja probabilidad, independientemente del estado de impulso. Este principio revolucionó el
Descargue como DOCX, PDF, TXT o lea en línea desde Scribd
Descargar como docx, pdf o txt
Está en la página 1de 7
Teoras del refuerzo
Thorndike y la ley del efecto
La primera teora sistmica del refuerzo fue brindada por Thorndike, pronto luego de su descubrimiento de condicionamiento instrumental (Bower & Hilgard, 1981). De acuerdo a Thorndike, un refuerzo positivo es un estmulo que produce estado satisfactorio de asuntos, Sin embargo, Thorndike no fue a decirnos qu era satisfactorio. Por lo tanto, su respuesta a la pregunta Qu hace a algo efectivo como reforzador? no era muy iluminadora. Uno puede determinar si un estmulo como una caricia en la cabeza de un perro era satisfactorio viendo si un perro incrementa su respuesta que resulta en poder ser alimentado. Sin embargo, esa evidencia no revela porqu una caricia en la cabeza es un reforzador. Llamando a los reforzadores satisfactores, Thorndike puso una etiqueta a los reforzadores pero no daba una explicacin de porqu algo era efectivo como reforzador. Thorndike estaba ms seguro sobre la pregunta Cmo un reforzador produce un incremento en la probabilidad de la respuesta reforzada?, su respuesta fue dada en la Ley del efecto. Como coloqu en el captulo 7, de acuerdo a la ley del efecto, un reforzador establece una asociacin o conexin entre la respuesta instrumental R y los estmulos S en la presencia de la respuesta establecida. El reforzador produce una asociacin R- S. Ver figura 9.1. La ley del efecto explica como un reforzador incrementa la futura probabilidad de la respuesta instrumental. Porque de la asociacin S R que es establecida por el refuerzo, los estmulos S producen la respuesta instrumental R, en la manera en que una respuesta elicitada es producida por sus estmulos elicitantes. El mecanismo bsico de la ley del efecto fue considerado una explicacin razonable para la respuesta instrumental incrementada y fue aceptado por los tericos del comportamiento durante los siguientes 50 aos. Sin embargo, retrospectivamente, la aceptacin generalizada de la ley del efecto es bastante notable. Aunque la ley del efecto predice una respuesta instrumental incrementada respondiendo en el ambiente de entrenamiento, es un poco mgico ms que un proceso bien establecido. Thorndike no dijo mucho acerca de como un reforzador despus de una respuesta instrumental puede actuar retrospectivamente hasta lograr una asociacin entre la respuesta y los estmulos en la presencia de cual la respuesta fue hecha. Esa parte de la ley del efecto tuvo que ser tomada con fe. Adems, la aceptacin general de la ley del efecto durante los siguientes 50 aos, nadie ha llenado el vaco dejado por Thorndike. Los mecanismos donde un reforzador acta hacia atrs en el tiempo para fortalecer una asociacin S-R que se mantenga especificada. En resumen, Thorndike dio un poco ms que un nombre en respuesta a la pregunta: Qu hace a algo efectivo como reforzador?, su respuesta a la pregunta, Cmo un reforzador produce un incremento en la probabilidad de una respuesta reforzada? Fue exitosa en el sentido que predeca los efectos del refuerzo. Pero la respuesta fue superficial porque simplemente comenzaba con una asociacin S-R formada sin especificar exactamente como lleg eso. Hull y la teora de reduccin del impulso El siguiente gran terico que consideraremos es Clark Hull. Hull acept que el mecanismo de asociacin de la teora de la ley del efecto, se concentr en la pregunta que Thorndike ignor (Qu hace a algo efectivo como reforzador?) Para responder esta pregunta, Hull us el concepto de homeostasis. Segn esto, el organismo busca un estado de estabilidad con respecto a los factores biolgicos. Para sobrevivir, los organismos deben mantener un estado estable u ptimo abasto de nutrientes. Cuando el sujeto ha sido privado de comida, tendr una necesidad de comida. Se pensar tambin en un estado motivacional o estado de impulso de hambre, que es la ingesta de comida. Para Hull, la comida es un reforzador porque reduce el impulso de hambre. Para Hull, el reforzador es lo que reduce un estado de impulso. Por lo tanto, su teora se llama la teora de la reduccin del impulso. Reforzadores primarios Los estmulos que son efectivos para reducir una necesidad biolgica sin entrenamiento previo son llamados reforzadores primarios (comida, agua). Sin embargo, existen otros estmulos que no son primarios y pueden servir de reforzadores. Reforzadores secundarios y Manejos adquiridos El refuerzo secundario es el que gana las propiedades reforzadoras mediante la asociacin con un reforzador primario (el olor de la comida italiana puede ser un reforzador secundario). Hull tambin extendi su teora a los estados de impulso condicionados. Los estmulos que son asociados con un estado de impulso provocan un impulso adquirido o condicionado. Este concepto se ha usado mucho en motivacin. Un ejemplo se da si vas en una escalera elctrica y te caes de ellas muy fuerte, es probable que te de miedo volver a subir en unas escaleras elctricas. Este miedo condicionamiento es un impulso adquirido. De acuerdo con Hull, reducir la intensidad del impulso adquirido ser reforzante. Por lo tanto, cualquier respuesta que te permita escapar del miedo condicionado de las escaleras ser reforzante. Alejarse de las escaleras en un centro comercial puede ser reforzante o usar un ascensor porque reduce el miedo condicionado provocado por las escaleras. Reforzamiento sensorial A la teora de Hull le falta explicar algunas instancias del reforzamiento. Por ejemplo, los investigadores han encontrado que las ratas mantenidas en la oscuridad presionarn una palanca para prender una luz y que las ratas mantenidas en una cmara iluminada presionar la palanca para producir periodos de oscuridad. Los chimpancs tendrn respuestas instrumentales que son reforzadas por nada ms que la oportunidad de mirar un tren elctrico de juguete moverse. Estos son ejemplos de reforzamiento sensorial. En muchas situaciones, la estimulacin sensorial con ninguna relacin aparente a una necesidad o impulso biolgico puede servir de reforzador. El creciente peso de la evidencia de reforzamiento sensorial, junto con el xito de las conceptualizaciones alternativas del refuerzo, llevaron al abandono de la teora de Hull. Las teoras que emergieron fueron altamente creativas, envolviendo nuevas maneras de pensar sobre el refuerzo instrumental. Reforzadores como respuestas El principio de Premack Cul es la diferencia entre comer y presionar una palanca de respuesta en una normal caja de Skinner?, En general que comer se puede hacer en cualquier lado, no hay lmites mientras que presionar la palanca s. De acuerdo a Premack, la precondicin del refuerzo no es un estado de impulso. Es en realidad, la existencia de dos respuestas que difieren en su parecido de ocurrencia cuando un organismo tiene acceso libre a ambas actividades. Dadas estas dos respuestas, Premack propuso que la respuesta que es ms probable que el sujeto haga ser la reforzadora de la respuesta menos probable, esto es en general el principio de Premack o tambin el principio diferencial de probabilidad. No importa para Premack la respuesta instrumental o reforzadora o ser primario o secundario, lo nico que se necesita es que una respuesta sea ms probable que la otra. La revolucin de Premack Los cientficos se comenzaron a emocionar por esta teora debido a su impacto en el entendimiento del refuerzo. Se comenz a usar el principio para ambientes escolares, hospitales, para el retraso mental y para correccionales. Aplicaciones del principio de Premack En la educacin, a los sujetos se les pide realizar nuevas conductas. La meta es lograr que una respuesta de baja probabilidad aumente su probabilidad de suceder. El condicionamiento instrumental es efectivo pero se debe buscar el correcto reforzador. No se poda entonces privar a los chicos de su alimento o darles caramelos pues es un alimento que no colabora con su desarrollo. Premack propuso una salida, lo nico que se deba hacer era asegurarle al estudiante que si realizaba la tarea de menos probabilidad luego podra realizar lo que sea que para l tenga mayor probabilidad (lo que ms disfrute). As, se poda preparar un condicionamiento instrumental para cada estudiante. Problemas tericos El principio de Premack contina siendo usado en las escuelas. Pero presenta dos problemas. El primero tiene que ver con la manera de medir o calcular la probabilidad de respuestas. Todos tenemos un sentido intuitivo de lo que significa decir que una respuesta es ms probable que la otra pero asignar un nmero preciso es algo difcil. Tambin, la probabilidad de una respuesta dada puede cambiar inesperadamente. Un joven puede disfrutar de nadar una maana pero luego querer jugar videojuegos. Hay maneras prcticas de pensar que esto se puede resolver. Por ejemplo, se puede utilizar un sistema en el que a los sujetos se les da puntos por responder correctamente y luego pueden cambiar los puntos por actividades que disfruten. Esto se llama economa de fichas, si se utiliza, no habra porqu preocuparse porque solo se puede elegir una respuesta. El segundo problema del principio de Premack es que es simplemente una frmula o regla para identificar reforzadores. No nos habla de cmo trabajan los reforzadores, responde a la pregunta qu hace a algo efectivo como un reforzador? Pero no responde a la pregunta cmo un reforzador produce un incremento en la probabilidad de la respuesta reforzada? La hiptesis de privacin de respuesta Fue el siguiente gran paso en la teora, propuesta por Timberlake y Allison en 1974. La hiptesis de privacin de respuesta fue creada para resolver los problemas del principio de Premack. Tmberlake y Allison, como Premack, pensaron en los reforzadores como respuestas ms que estmulos. Su punto de comienzo fue pensar la diferencia entre una respuesta instrumental y una respuesta reforzadora. Su respuesta fue que los participantes tienen acceso libre a la respuesta instrumental pero son restringidos al realizar la respuesta reforzadora. Timberlake y Allison sugirieron que estas restricciones (la de la rata cuando no puede comer pellets libremente en una caja de Skinner) son lo que hacen que comer sea un reforzador efectivo. Desde su punto de vista, el condicionamiento instrumental priva a los participantes del acceso libre a la respuesta reforzadora. Privacin de respuesta y la ley del efecto Timberlake y Allison proponen la siguiente situacin, imagnense que ponen a una rata en la caja de Skinner donde solo le pondrn comida una vez a la semana y ella podr observar eso. Segn Thorndike, ese sera un estado satisfactorio donde la rata presionara la palanca pero esto tiene poco sentido, lo que Timberlake y Allison proponen es que la rata presionar solo una vez a la semana, cuando ya est la comida. Segn la hiptesis de privacin de respuesta, lo que hace a la comida un reforzador no es que satisface el hambre o que comer sea una respuesta de alta probabilidad. En realidad, es para ellos un reforzador porque en el condicionamiento instrumental existen restricciones para comer. Por ello, cuando no hay privacin de respuesta, la rata es libre a elegir, no existir incremento en la respuesta de la rata. Privacin de respuesta y la probabilidad de respuesta La hiptesis de privacin de respuesta no hace un cmputo sobre las probabilidades de respuesta, as evita el primer problema del principio de Premack. Para aplicar la privacin de respuesta, se debe determinar la tasa de una respuesta durante una lnea de base cuando no hay restricciones y luego limitar el acceso al reforzador. Para Timberlake y Allison, incluso una respuesta de poca probabilidad puede ser un reforzador si se priva la respuesta. Esta afirmacin ha sido confirmada de manera experimental. La privacin de respuesta y el locus de los efectos del refuerzo Esta teora cambia el locus de la explicacin del refuerzo. En teoras anteriores, los refuerzos eran explicados como factores fuera del condicionamiento instrumental, (el impulso o la probabilidad de respuesta), con esta nueva teora, el usaban elementos de la interaccin del sujeto con el procedimiento instrumenta (restricciones). Pero la hiptesis de privacin de respuesta tampoco poda responder cmo puede un reforzar incrementar la probabilidad de una respuesta reforzada. Por esto surge la teora de la regulacin conductual. La teora de la regulacin conductual De muchas maneras la teora de la regulacin conductual se parece a la hiptesis de privacin de respuesta. Ambas rechazan que los reforzadores sean tipos especficos de respuestas o estmulos. La teora de la regulacin conductual acepta que los efectos del refuerzo son determinados por como un procedimiento instrumental restringe las actividades del organismo. De hecho, esta nueva teora responde as el segundo problema del principio de Premack. (cmo puede un reforzar incrementar la probabilidad de una respuesta reforzada). La teora de la regulacin conductual tom el concepto de la homeostasis para llevarla a la eleccin de respuesta. As, la homeostasis conductual busca un estado ptimo en el sistema. El BLISS POINT conductual Dentro de la regulacin conductual, se defendi que el organismo prefera repartir sus actividades en un punto ptimo (donde pueda disfrutar ms), su llamado Bliss point comportamental. Este trmino se refiere a cmo un organismo distribuye sus actividades en la ausencia de restricciones en el procedimiento. Un ejemplo, una nia adolescente (KIM) sola un da en su casa dedicar el tiempo que ella desee a las actividades que ella desee hacer, su Bliss point ser la forma en que distribuya ptimamente su tiempo. Imponer una contingencia instrumental Los padres de Kim notaron que cuando estaba sola dedicaba una hora a hacer la tarea y quieren aumentar ese tiempo. Podran lograrlo restringiendo el acceso al tiempo que pasa escuchando msica. Podran crear una situacin donde Kim pueda escuchar un minuto de msica por cada minuto que haya pasado haciendo tareas. Antes de la contingencia instrumental, escuchar msica y hacer tareas eran actividades independientes para Kim. Antes no exista relacin entra estas actividades y como no haba restriccin, ella estableca su bliss point. Pero ahora con esa peticin de los padres, se forma en la grfica 9.3 (VER LAS COPIAS) un SCHEDULE LINE (lnea programada). Con esta restriccin, la adolescente debe redistribuir sus actividades para que pueda lograr la restriccin, es un reto para el bliss point. Esto es anlogo a como un manejo del impulso es un reto para la homeostasis fisiolgica. Estas contingencias obligan al sujeto a moverse de su bliss point y ubicarlo en otro lado para poder disfrutar de sus actividades. Ya el sujeto no puede regresar al bliss point, as son la mayora de casos, la contingencia instrumental restringe las opciones. Respondiendo a las restricciones programadas Existen varias posibilidades de responder a las restricciones. Si Kim piensa que hacer tareas es mucho ms desagradable que perder la msica entonces dejar de escuchar msica pero si Kim piensa que la idea de no escuchar msica es muy aversiva, comenzar a hacer tareas. Por esto, siempre se debe tener en cuenta que no existan opciones sustitutas para el evento que se ha restringido. Por ejemplo, si a Kim tambin le gusta mucho ver televisin entonces probablemente no comienza a hacer ms tareas y no le importe la prdida de la msica.
Contribuciones de la regulacin conductual Este modelo nos invita a pensar sobre como una contingencia instrumental puede tener aplicaciones tan amplias sin conceptualizarlo demasiado. Nos ayuda a pensar en todas las actividades posibles de un participante. Nos avisa que es difcil saber qu ser un reforzante si no conocemos el ambiente del sujeto, las restricciones, sus actividades posibles y sus sustitutos