B.F. Skinner: Teoría Del Conductismo y Condicionamiento Operante
B.F. Skinner: Teoría Del Conductismo y Condicionamiento Operante
B.F. Skinner: Teoría Del Conductismo y Condicionamiento Operante
Breve biografía
Nacido en Pennsylvania en 1904, Skinner comenzó a trabajar en sus ideas del comportamiento
humano después de obtener su doctorado en Harvard. Sus trabajos incluyen El comportamiento
de los organismos (1938) y una novela basada en sus teorías, Walden dos (1948). Exploró el
conductismo en relación con la sociedad en libros posteriores, incluyendo Beyond Freedom and
Human Dignity (1971).
Como estudiante en el Hamilton College, Skinner desarrolló una pasión por escribir. Intentó
convertirse en escritor profesional después de graduarse en 1926, pero obtuvo poco éxito. Dos
años más tarde, decidió seguir una nueva dirección para su vida; se matriculó en la Universidad
de Harvard para estudiar psicología.
Skinner consideraba el libre albedrío una ilusión y la acción humana como dependiente de las
consecuencias de las acciones anteriores. Si las consecuencias son malas, existe una alta
probabilidad de que la acción no se repita. Por el contrario, si las consecuencias son buenas, es
probable que se repita la acción. Skinner llamó a esto el principio del refuerzo.
En la década de 1920, Watson había dejado la psicología académica y otros conductistas estaban
empezando a ser influyentes, proponiendo nuevas formas de aprender aparte del
condicionamiento clásico.
La forma de pensar de Skinner era ligeramente menos extrema que la de Watson. Skinner creía
que tenemos mente, pero que simplemente es más productivo estudiar los comportamientos
observables en lugar de los eventos mentales internos.
Introducción al conductismo
John Watson
El conductismo fue el paradigma principal de la psicología entre 1920 y 1950, fundado por John
Watson y basado en la creencia de que las conductas pueden ser medidas, entrenadas y
cambiadas. El conductismo podría resumirse con la siguiente cita de Watson, considerado el
“padre” de esta corriente psicológica:
“Dame una docena de niños sanos, bien formados, para que pueda educarlos, y me comprometo
a elegir uno al azar y adiestrarlo para convertirlo en un especialista de cualquier cosa que yo
pueda escoger: médico, abogado, artista, hombre de negocios, mendigo o ladrón, prescindiendo
de su talento, inclinaciones, tendencias, aptitudes, vocaciones y raza de su sus antepasados”.
Según los principios del conductismo, todas las conductas se aprenden del ambiente en el que
crecemos. Los conductistas no creían en las determinaciones biológicas.
Además, se ocupaban principalmente de las conductas que podían ser observadas y creían que
no había mucha diferencia entre el aprendizaje que tiene lugar en los humanos y el que tiene
lugar en los animales.
Pavlov y perro
1-El perro saliva viendo la comida. 2-El perro no saliva con el sonido de la campana. 3-Se le
muestra el sonido de la campana junto a la comida. 4-Tras el condicionamiento, el perro saliva
con el sonido de la campana.
Esta teoría fue más tarde desarrollada por Watson (1913), que fue el psicólogo estadounidense
que fundó la escuela psicológica conductista, publicando un artículo llamado “La psicología tal y
como la ve un conductista”. Más tarde, condicionó a un niño para que temiera a una rata blanca.
Fuente: emaze.com.
El trabajo de Skinner tuvo sus raíces en la visión del condicionamiento clásico como algo
demasiado simple como para constituir una explicación completa del comportamiento humano
complejo. Skinner creía que la mejor forma de comprender la conducta humana era comprobar
las causas de una acción y sus consecuencias. Llamó a este planteamiento “condicionamiento
operante”.
El condicionamiento operante tiene que ver con los operantes: acciones intencionales que tienen
un efecto en el ambiente que nos rodea. Skinner comenzó a identificar los procesos que hacían
la ocurrencia de ciertas conductas operantes más o menos probables.
Como hemos dicho, Skinner es considerado el padre del condicionamiento operante, pero su
trabajo está basado en la ley del efecto de Thorndike. Skinner introdujo un nuevo término en la
ley del efecto: el refuerzo. La conducta que es reforzada tiende a repetirse; la conducta que no
es reforzada tiende a extinguirse (se debilita).
Skinner acuñó el término “condicionamiento operante”, que implica cambiar una conducta
utilizando refuerzos dados después de la respuesta deseada. Skinner identificó tres tipos de
respuestas u operantes que pueden seguir al comportamiento:
Todos hemos experimentado ejemplos de conductas que han sido afectadas por refuerzos y
castigos. Cuando éramos niños, por ejemplo, si hablábamos durante una clase, el profesor nos
mandaba callar. Esta respuesta por parte del profesor constituye un castigo que, al menos
supuestamente, debería debilitar la conducta de hablar con el compañero durante la clase.
Durante la adolescencia, por ejemplo, llevar un determinado estilo o marca de ropa podría ser
reforzado positivamente por los compañeros de misma edad mediante halagos, aceptación social
o simplemente algún gesto amable. Esto refuerza y hace que sea más probable que se repita la
conducta de llevar puesta una ropa de marca determinada.
El refuerzo positivo
Skinner demostró cómo funcionaba el refuerzo positivo colocando una rata hambrienta en su
caja de Skinner. La caja contenía una palanca en un lado y la rata, conforme se iba moviendo
por la caja, presionaba accidentalmente a la palanca. Inmediatamente, un gránulo de comida
caía en un pequeño contenedor al lado de la palanca.
Las ratas aprendieron rápidamente a ir directamente a la palanca después de haber estado unas
pocas veces en la caja. La consecuencia de recibir la comida si presionaban la palanca aseguraba
que repitieran la conducta una y otra vez.
El refuerzo positivo fortalece una conducta proporcionando una consecuencia que el individuo
considera recompensante. Por ejemplo, si tu profesor te da dinero cada vez que completas los
deberes, es más probable que repitas la conducta de hacer los deberes en el futuro,
fortaleciendo esta conducta.
Refuerzo negativo
Por ejemplo, cuando tienes dolor de cabeza, tomas una aspirina para aliviarlo. El hecho de que
desaparezca el dolor constituye un reforzador negativo para la conducta de tomar una aspirina,
haciendo más probable que se repita en un futuro cuando tengas dolor de cabeza.
Skinner estudió cómo funcionaba el refuerzo negativo, de nuevo, colocando una rata en su caja
de Skinner y exponiéndola a una corriente eléctrica desagradable que le causaba cierto grado de
malestar. Esta vez, la palanca de la caja hacía que la corriente eléctrica se detuviese.
Las ratas, al principio, presionaban la palanca por accidente, pero al poco tiempo aprendieron a
presionarla para detener la corriente eléctrica. La consecuencia de escapar a la corriente
aseguraba que repitieran la acción cada vez que eran colocadas en la caja o cada vez que
sentían la electricidad.
De hecho, Skinner enseñó a las ratas incluso a evitar la corriente eléctrica encendiendo una luz
justo antes de que la corriente eléctrica apareciese. Las ratas aprendieron pronto a presionar la
palanca cuando la luz se encendía porque sabían que esto evitaría que la corriente eléctrica
fuera encendida.
Estas dos respuestas aprendidas son conocidas como “aprendizaje por escape” y “aprendizaje
por evitación”.
Castigo
El castigo se define como lo contrario al refuerzo, ya que está diseñado para debilitar o eliminar
una respuesta en lugar de aumentar su probabilidad. Es un evento aversivo que disminuye la
conducta que le sigue.
Tal y como ocurre con el refuerzo, el castigo puede funcionar tanto aplicando directamente un
estímulo desagradable, como un shock eléctrico después de una respuesta, como eliminando un
estímulo potencialmente recompensante.
Por ejemplo, descontando dinero de la paga de alguien para castigar conductas indeseables. Es
necesario señalar que no siempre es fácil distinguir entre castigos y refuerzos negativos.
Existen varios problemas a la hora de utilizar castigos, como son los siguientes:
Modelado de conductas
Para que este resultado se produzca, las condiciones (o contingencias) requeridas para recibir la
recompensa deberían cambiar cada vez que el organismo dé un paso para estar más cerca de la
conducta deseada.
Según Skinner, la mayor parte de la conducta humana (incluyendo el lenguaje) puede ser
explicada como un producto de este tipo de aproximación sucesiva.
Modificación de conductas
Sin embargo, esto no es tan simple como suena. Reforzar siempre un comportamiento deseado,
por ejemplo, es básicamente sobornar a alguien.
Existen varios tipos de refuerzo positivo. El refuerzo primario se da cuando una recompensa
fortalece una conducta por sí misma. El refuerzo secundario se da cuando algo refuerza una
conducta porque lleva a un reforzador primario.
Por ejemplo, si un profesor quisiera animar a sus estudiantes a responder preguntas en clase,
debería elogiarlos en cada intento, sin importar si la respuesta es correcta o no. Gradualmente,
el profesor sólo elogiará a los alumnos cuando sus respuestas son correctas y, con el tiempo, tan
solo las respuestas excepcionales serán elogiadas.
Las conductas indeseadas, tales como los retrasos al llegar a clase y dominar las discusiones en
clase, pueden ser extinguidas siendo ignoradas por el profesor, en lugar de ser reforzadas
atrayendo la atención de éste hacia dichas conductas.
Saber que se ha tenido éxito también es importante, ya que motiva los aprendizajes futuros. Sin
embargo, es importante variar el tipo de refuerzo que se proporciona, de forma que la conducta
se mantenga. Esto no es una tarea sencilla, ya que el profesor puede parecer poco sincero si
piensa demasiado la forma en la que debe comportarse a la hora de elogiar a un alumno.
El condicionamiento operante puede ser utilizado para explicar una gran cantidad de conductas,
desde el proceso de aprendizaje hasta la adicción y la adquisición del lenguaje. También tiene
aplicaciones prácticas, como las educativas que hemos descrito previamente, y en prisiones,
hospitales psiquiátricos y en economía.
Durante sus experimentos, lo que le llamó la atención era que, tras repetidos
ensayos, los perros segregaban la saliva incluso ante su presencia (la de
Pávlov), independientemente de que le diera de comer o no. Esto ocurría
porque los animales habían aprendido que cuando Pávlov entraba por la puerta
iban a recibir comida en cualquier momento.
Si quieres saber más sobre este autor, puedes visitar este artículo: “John B.
Watson: vida y obra del psicólogo conductista”
Aprendizaje y refuerzo
Por un lado, Bandura admite que cuando aprendemos estamos ligados a
ciertos procesos de condicionamiento y refuerzo positivo o negativo. Del
mismo modo, reconoce que no puede entenderse nuestro comportamiento si
no tomamos en consideración los aspectos de nuestro entorno que nos están
influyendo a modo de presiones externas, tal y como dirían los conductistas.
Ambiente
Ciertamente, para que exista una sociedad, por pequeña que esta sea, tiene
que haber un contexto, un espacio en el que existan todos sus miembros. A
su vez, ese espacio nos condiciona en mayor o menor grado por el simple
hecho de que nosotros estamos insertados en él.
Es difícil no estar de acuerdo con esto: resulta imposible imaginar a un jugador
de fútbol aprendiendo a jugar por sí sólo, en un gran vacío. El jugador refinará
su técnica viendo no sólo cuál es la mejor manera de marcar goles, sino
también leyendo las reacciones de sus compañeros de equipo, el árbitro e
incluso el público. De hecho, muy probablemente ni siquiera habría empezado
a interesarse por este deporte si no le hubiera empujado a ello una cierta
presión social. Muchas veces son los demás quienes fijan parte de nuestros
objetivos de aprendizaje.
El factor cognitivo
Sin embargo, nos recuerda Bandura, también hay que tener en cuenta la otra
cara de la moneda de la Teoría del Aprendizaje Social: el factor cognitivo. El
aprendiz no es un sujeto pasivo que asiste desapasionadamente a la
ceremonia de su aprendizaje, sino que participa activamente en el proceso e
incluso espera cosas de esta etapa de formación: tiene expectativas. En un
contexto de aprendizaje interpersonal somos capaces de prever los resultados
novedosos de nuestras acciones (de manera acertada o equivocada), y por lo
tanto no dependemos totalmente del condicionamiento, que se basa en la
repetición. Es decir: somos capaces de transformar nuestras experiencias en
actos originales en previsión de una situación futura que nunca antes se había
producido.
Aprendizaje vicario
El pináculo del aspecto social es el aprendizaje vicario remarcado por
Bandura, en el que un organismo es capaz de extraer enseñanzas a partir de la
observación de lo que hace otro. Así, somos capaces de aprender haciendo
algo difícilmente medible en un laboratorio: la observación (y atención) con la
que seguimos las aventuras de alguien. ¿Recuerdas las polémicas que se
desatan periódicamente sobre la conveniencia o no de que los niños y niñas
vean ciertas películas o series de televisión? No son un caso aislado: muchos
adultos encuentran tentador participar en Reality Shows al ponderar los pros y
los contras de lo que les pasa a los concursantes de la última edición.
Un término medio
En definitiva, Bandura utiliza su modelo de la Teoría del Aprendizaje Social para
recordarnos que, como aprendices en continua formación, nuestros procesos
psicológicos privados e impredecibles son importantes. Sin embargo, a pesar
de que son secretos y nos pertenecen sólo a nosotros, estos procesos
psicológicos tienen un origen que, en parte, es social. Es precisamente gracias
a nuestra capacidad de vernos a nosotros mismos en la conducta de los demás
por lo que podemos decidir qué funciona y qué no funciona.
Somos capaces de prever cosas a partir de lo que les pasa a otros, del mismo
modo en el que el hecho de vivir en un medio social nos hace plantearnos
ciertos objetivos de aprendizaje y no otros.