Skinner CIENCIA Y CONDUCTA HUMANA

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 25

muchas circunstancias distintas pueden coincidir en mostrar ciertas

propiedades generales. Por ejemplo, cuando se mide de esta forma, el


aprendizaje es generalmente <<acelerado negativamente>>, es decir, el
progreso en los resultados se produce cada vez más lentamente hasta que
llega un momento en que un progreso ulterior es imposible. Pero de aquí no se
sigue que la aceleración negativa sea una característica del proceso básico.
Supongamos, por analogía, que llenamos un jarro de cristal con grava que ha
sido tan mezclada que las piezas de una medida determinada se distribuye
regularmente; entonces agitamos suavemente el jarro y examinamos cómo las
piezas vuelven a disponerse, las mayores van hacia arriba y las más pequeñas
hacia el fondo. Este proceso es también <<acelerado negativamente>>. Al
principio la mezcla se separa rápidamente, pero a medida que la separación
prosigue se llega cada vez más lentamente a una situación en la cual no habrá
ningún cambio ulterior. Esta curva puede ser muy regular y reproducible, pero
este solo hecho no tiene ninguna importancia especial. La curva es el resultado
de ciertos procesos fundamentales que implican el contacto de esferas de
distintos tamaños, la disposición de fuerzas resultantes de la agitación, etc.,
pero no constituye de ningún modo el registro más directo de estos procesos.

Las curvas de aprendizaje muestran cómo las diversas clases de


conducta suscitadas en situaciones complejas son elegidas, puestas de relieve
y ordenadas de nuevo. El proceso básico de impresión de un solo acto trae
consigo este cambio, pero no se manifiesta directamente por el cambio mismo.

CONDICIONAMIENTO OPERANTE

Para llegar hasta las últimas consecuencias de la ley del efecto de


Thorndike necesitamos poner en claro la noción de <<probabilidad de
respuesta>>; este es un concepto sumamente importante y, por desgracia, es
también muy difícil. Al hablar de la conducta humana nos referimos a menudo a
<<tendencias>> o <<predisposiciones>> a comportarse de forma determinada.
Caso todas las teorías de la conducta utilizan términos como <<potencial de
excitación>>, <<fuerza del hábito>> o <<tendencia determinante>>, pero
¿cómo podemos observar una tendencia? ¿Cómo medirla?

Si un ejemplo dado de conducta tuviera lugar solamente en dos


situaciones de modo que en una de ellas ocurriera siempre y en la otra nunca,
no tendría ninguna utilidad seguir un programa de análisis funcional. Una
materia de estudio a base de todo o nada se presta solamente a formas muy
toscas de descripción. Constituye, en cambio, una ventaja suponer que la
probabilidad de que la respuesta se produzca oscila continuamente entre los
extremos del todo o nada. Podemos entonces tratar con variables que, al
contrario del estímulo que provoca el reflejo, no <<hacen que una conducta
dada ocurra>>, sino que simplemente hacen su suceso más probable. En este

73
caso, es también posible, por ejemplo, estudiar el efecto combinado de más de
una de estas variables.

Las expresiones diarias que implican la noción de probabilidad,


tendencia o predisposición describen la frecuencia como tal. Decimos de
alguien que es un <<entusiasta>> del bridge cuando observamos que participa
en dicho juego con frecuencia o habla a menudo de él. Estar <<muy
interesado>> en música equivale a interpretar, escuchar y hablar mucho sobre
música. El jugador <<inveterado>> es el que juega con frecuencia. Al
<<aficionado>> a la fotografía se le encuentra sacando fotos, revelándolas y
mirando las que él u otros han hecho. La persona <<altamente sexuada>>, con
frecuencia practica una conducta sexual. El <<dipsómano>> bebe con
frecuencia.

Al caracterizas la conducta de un hombre en términos de frecuencia,


damos por supuesto que ciertas condiciones se encuentran normalizadas: debe
ser capaz de ejecutar y repetir un acto dado y otra conducta no debe
interferirse de manera susceptible. No podemos estar seguros del grado de
interés de una persona por la música, por ejemplo, si está necesariamente
ocupada en otras cosas. Cuando llegamos a precisar la noción de probabilidad
de la respuesta para un uso científico descubrimos que, también aquí, nuestros
datos son frecuencias y que hay que especificar las condiciones bajo las cuales
son observados. El principal problema técnico al planear un experimento
controlado es tomar medidas para la observación e interpretación de
frecuencias. Eliminamos, o al menos mantenemos constante, cualquier
condición que estimule un comportamiento que rivaliza con la conducta que
vamos a estudiar. En una caja silenciosa se sitúa un organismo cuya conducta
puede ser observada a través de una pantalla de visibilidad en un solo sentido
o registrada mecánicamente. Esto no es en modo alguno vacío ambiental,
puesto que el organismo reaccionará de muchas maneras ante los rasgos
distintivos de la caja; pero su conducta alcanzará finalmente un nivel bastante
estable a partir del cual puede investigarse la frecuencia de una respuesta
elegida.

Para estudiar el proceso que Thorndike llamó impresión debemos tener


una <<consecuencia>>. Dando de comer a un organismo hambriento la
tendremos. Podemos alimentar convenientemente al sujeto mediante un
pequeño depósito de alimento que funcione eléctricamente. Cuando dicho
depósito actúe por primera vez, el organismo reaccionará probablemente de
manera que se interferirán con el proceso que queremos observar. Por fin,
después de ser alimentado de esta forma repetidas veces, comerá ya con
rapidez y estaremos entonces preparados para hacer que esta consecuencia
sea contingente respecto a la conducta y observar el resultado.

74
Seleccionamos una conducta relativamente simple, que pueda ser
repetida libre y rápidamente, y susceptible de ser observada y registrada con
facilidad. Si el sujeto del experimento es una paloma, por ejemplo, la conducta
de levantar la cabeza por encima de una altura dada es adecuada. Podemos
observarla mirando la cabeza de la paloma sobre una escala colocada en la
pared opuesta de la caja. Primero estudiamos la altura a la que se mantiene
normalmente la cabeza y fijamos en la escala un punto que se alcanza sólo
raramente; al tiempo que observamos la escala empezamos sólo raramente; al
tiempo que observamos la escala empezamos a abrir el depósito de la comida
muy rápidamente cada vez que la cabeza se levanta por encima de la línea. Si
el experimento se efectúa de acuerdo con las especificaciones el resultado es
invariable: observamos un cambio inmediato en la frecuencia con que la
cabeza sube por encima de la línea; también observamos}, y esto tiene en
teoría cierta importancia, que ahora se sobrepasan líneas más altas. Podemos
pasar casi inmediatamente a una línea más alta determinando cuándo deber
ser mostrada la comida. En uno o dos minutos la postura del ave ha cambiado
de tal forma que la posición de la cabeza raramente está por debajo de la línea
que elegimos al principio.

Cuando demostremos el proceso de impresión de esta forma


relativamente simple vemos que ciertas interpretaciones comunes del
experimento de Thorndike son superfluas. La expresión <<aprendizaje
mediante ensayo-y-error>> que se asocia con frecuencia a la Ley del Efecto
está visiblemente fuera de lugar aquí. Aprehendemos algo en nuestras
observaciones cuando a cualquier movimiento ascendente de la cabeza le
llamamos <<ensayo>>, y no existe ninguna razón para llamar <<error>> a
cualquier movimiento que no consiga una consecuencia determinada. Incluso
el término <<aprendizaje>> es engañoso. La afirmación de que la paloma
<<aprende que va a conseguir comida estirando el cuello>> es un relato
inexacto de lo que ha sucedido. Decir que ha adquirido el <<habito>> de estirar
el cuello es tan solo recurrir a una invención explicativa, puesto que la única
prueba que tenemos del hábito es la tendencia que ha adquirido a llevar a cabo
dicha acción. La afirmación más exacta posible acerca de este proceso es ésta:
hacemos contingente una consecuencia dada ante ciertas propiedades físicas
de la conducta (el movimiento ascendente de la cabeza), y entonces
observamos que la conducta se produce con más frecuencia.

Es habitual referir cualquier movimiento del organismo como una


<<respuesta>>. Este término procede del campo del acto reflejo e implica un
acto que, por decirlo así, responde a un hecho anterior, es estímulo. Pero
podemos hacer que un acontecimiento sea contingente con la conducta, sin
identificar, o sin ser capaces de identificar, un estímulo previo. No alteramos el
medio ambiente de la paloma para provocar el movimiento ascendente de la
cabeza. Es probablemente imposible probar que cualquier estímulo aislado

75
precede, de una manera invariable, este movimiento. Una conducta de este
tipo puede caer bajo el control de estímulos, pero la relación no es la de
provocación automática. El término <<respuesta>> no es, por tanto, del todo
apropiado, pero se encuentra tan bien establecido que vamos a utilizarlo a
continuación. Una respuesta que ya se ha producido no puede, desde luego,
predecirse o controlarse. Podemos predecir solamente qué respuestas
similares se producirán en el futuro. La unidad de una ciencia predictiva no es,
por tanto, una respuesta, sino una clase de respuesta. La palabra
<<operante>> es la que utilizaremos para designar esta clase. El término pone
de relieve el hecho de que la conducta opera sobre el medio ambiente para
producir consecuencias. Las consecuencias definen las propiedades respecto a
las cuales las respuestas se llaman similares. El término se utilizará tanto como
adjetivo (conducta operante), cuanto como sustantivo para designar la
conducta definida por una consecuencia dada.

Un solo caso en el que la paloma levanta la cabeza es una respuesta.


Es un fragmento de historia que puede ser incluido dentro de cualquier marco
de referencia que queramos usar. La conducta llamada <<levantar la
cabeza>>, independientemente de cuantas veces ocurra, es una operante.
Puede ser descrita, no como un acto cumplido, sino más bien como un
conjunto de hechos definidos por la propiedad de la altura hasta la que se
levanta la cabeza. En este sentido una operante se define por un efecto que
puede especificarse en términos físicos; el <<tope>> a una altura determinada
es una propiedad de la conducta.

El término <<aprendizaje>> puede mantenerse provechosamente en su


sentido tradicional para describir la recolección de respuestas en una situación
compleja. Los términos para el proceso de impresión pueden tomarse de los
análisis de Pavlov sobre el reflejo condicional. El mismo Pavlov llamó
<<refuerzo>> a todo hecho que fortaleciera la conducta, y a todo cambio
resultante, <<condicionamiento>>. En el experimento de Pavlov, sin embargo,
un refuerzo es asociado con un estímulo, mientras que la conducta operante es
contingente con una respuesta. El refuerzo operante es, por tanto, un proceso
separado y requiere un análisis aparte. En ambos casos, al fortalecimiento de
la conducta que resulta de un refuerzo se le llama, de una manera apropiada,
<<condicionamiento>>. En el condicionamiento operante, <<fortalecemos>>
una operante en el sentido de hacer que la respuesta, sea más probable o, de
hecho, más frecuente. En el condicionamiento Pavloviano o <<respondente>>
simplemente incrementamos la magnitud de la respuesta provocada por el
estímulo condicionado y acortamos el tiempo que transcurre entre estímulo y
respuesta. (Observamos, de manera incidental, que estos dos casos agotan las
posibilidades: un organismo está condicionado cuando un refuerzo [1]
acompaña otro estímulo o, [2] sigue en el tiempo a la propia conducta del
organismo. Cualquier suceso que no haga ni una cosa ni otra no tiene ningún

76
efecto para cambiar una probabilidad de respuesta.) En el experimento de la
paloma, por tanto, la comida es el refuerzo y el presentar la comida cuando se
emite una respuesta es el acto de reforzar. La operante es definida por la
propiedad respecto a la cual es contingente el refuerzo, es decir, la altura a la
cual la cabeza ha de ser levantad. El cambio en la frecuencia con la cual la
cabeza es levantada hasta esta altura, es el proceso de condicionamiento
operante.

Cuando estamos despiertos actuamos constantemente sobre el medio


ambiente, y muchas de las consecuencias de nuestras acciones constituyen
para nosotros un refuerzo. A través del condicionamiento operante, el medio
ambiente forma el repertorio básico con el que mantenemos nuestro equilibrio,
andamos, jugamos, manejamos herramientas y utensilios, hablamos,
escribimos, conducimos una embarcación, un coche o pilotamos un avión. Un
cambio en el medio ambiente – un nuevo coche, un nuevo amigo, un nuevo
campo de interés, un trabajo nuevo, una vivienda nueva- puede cogernos
desprevenidos, pero nuestra conducta en general se adapta rápidamente a
medida que adquirimos nuevas respuestas y desechamos las antiguas. Vamos
a ver en el capítulo siguiente que el refuerzo operante hace algo más que
proporcionar un repertorio de conductas. Mejora la eficacia de la conducta y la
mantiene en vigor mucho después de que su adquisición o eficacia haya
dejado de interesarnos.

PROPIEDADES CUANTITATIVAS

No es fácil obtener una curva para el condicionamiento operante. No


podemos aislar completamente una operante, ni podemos eliminar todas las
particularidades arbitrarias. En nuestro ejemplo, podemos trazar una curva
mostrando cómo la frecuencia con que la cabeza de la paloma se eleva a una
altura determinada cambia con el tiempo o el número de veces que se ha
suministrado un refuerzo, pero el efecto total es desde luego más amplio que
esto. Existe un cambio en un modelo de conducta más amplio que esto. Existe
un cambio en un modelo de conducta más amplio, y para describirlo
completamente tendríamos que seguir todos los movimientos de la cabeza.
Pero, incluso en este caso, nuestro informe no sería completo. Se escogió
arbitrariamente la altura hasta la que debía levantarse la cabeza y el efecto del
refuerzo depende de esta selección. Si reforzamos una altura, que rara vez es
alcanzada, el cambio efectuado en el modelo de medida será mucho mayor
que si hubiésemos escogido una altura más corriente. Para una descripción
adecuada necesitamos una serie de curvas que incluya todas las posibilidades.
Todavía aparece otro elemento arbitrario si forzamos la cabeza a elevarse cada
vez más, puesto que podemos seguir distintos programas al elevar la línea
seleccionada para reforzar. Cada programa producirá su propia curva y el
cuadro solamente sería completo si incluyera todos los programas posibles.

77
No podemos evitar estos problemas seleccionando una respuesta que
las características ambientales delimiten más exactamente –por ejemplo, el
acto de manipular una cerradura. Cualquier indicador mecánico de la conducta
constituye, desde luego, una ventaja –al ayudarlos, por ejemplo, a reforzar en
el momento adecuado. Podríamos registrar la altura de la cabeza de la paloma
por un procedimiento fotoeléctrico, pero es más simple seleccionar una
respuesta que produzca un cambio que pueda ser registrado con mayor
facilidad en el medio ambiente. Si la paloma está condicionada a picotear un
pequeño disco situado sobre la pared de la caja experimental, podemos utilizar
el movimiento del disco para cerrar un circuito eléctrico con el fin de, por una
parte, accionar el depósito de la comida y, por otra, contar o registrar las
respuestas. Semejante respuesta parece diferir de la de estirar el cuello en que
tiene un carácter de todo-o-nada. Pero vamos a ver en seguida que las
características mecánicas de golpear un interruptor no definen una
<<respuesta>> que sea algo menos arbitraria que la de alargar el cuello.

Una situación experimental no necesita ser perfecta para proporcionar


datos cuantitativos importantes en el condicionamiento operante. Nos
encontramos ya en disposición de valorar muchos factores. La importancia del
feed-back esta clara. El organismo tiene que ser estimulado por los
consecuencias de su propia conducta si el condicionamiento tiene que
realizarse. Por ejemplo, para aprender a mover las orejas es necesario saber
cuándo éstas se mueven, si queremos que las respuestas que producen dicho
movimiento sean reforzadas en comparación con las que no son útiles para
dicho objetivo. Al reeducar al paciente en el uso de un miembro parcialmente
paralizado, puede servir de ayuda ampliar el < a partir de movimientos ligeros,
ya sea mediante instrumentos o a través de la información de un instructor. El
sordomudo aprende a hablar solamente cuando recibe un feed-back de su
propia conducta que puede ser comparado con la estimulación que recibe
procedente de otras personas que hablan. Una función del educador es la de
proporcionar consecuencias arbitrarias (a veces falsas) en provecho del feed-
back. El condicionamiento depende también de la clase, cantidad y proximidad
temporal del refuerzo, así como de otros muchos factores.

Un solo refuerzo puede tener un efecto considerable. En


condiciones favorables la frecuencia de una respuesta pasa de un nivel
predominante bajo a un elevado nivel establece en un solo paso brusco. Más a
menudo observamos un aumento sustancial como resultado de un primer
refuerzo, e incrementos adicionales como resultado de refuerzos ulteriores. La
observación no es incompatible con la suposición de un cambio instantáneo
hacia la probabilidad máxima, puesto que no hemos aislado en absoluto una
sola operante. La frecuencia gradualmente incrementada debe interpretarse
con respecto a otra conducta característica de la situación. El hecho de que el
condicionamiento pueda ser tan rápido en un organismo tan <<inferior>> como

78
el ratón o la paloma, tiene interesantes implicaciones. Las diferencias en lo que
se suele llamar inteligencia son atribuidas, en parte, a diferencias en la rapidez
con que se aprende; pero no puede haber aprendizaje más rápido que un
incremento instantáneo en la probabilidad de la respuesta. La superioridad de
la conducta humana debe ser, por tanto, de algún otro tipo.

EL CONTROL DE LA CONDUCTA OPERANTE

El procedimiento experimental es el mejor para el estudio del


condicionamiento operante. Preparamos una contingencia de refuerzo y
exponemos a la misma un organismo durante un período determinado;
explicamos entonces la frecuente emisión de la respuesta refiriéndonos a este
proceso. Pero, ¿Cuánto se ha mejorado en la predicción y control de la futura
conducta?, ¿qué variables nos permiten predecir si el organismo responderá o
no?, ¿qué variables debemos controlar ahora para inducirle a responder?

Hemos experimentado con una paloma hambrienta. Como veremos en


el capítulo IX, se trata de una paloma a la que hemos privado de alimento
durante un cierto período de tiempo o hasta que el peso normal de su cuerpo
se ha reducido ligeramente. Al contrario de lo que se podría esperar, los
estudios experimentales han demostrado que la magnitud del efecto reforzante
del alimento puede no depender del grado de privación en el momento en que
se observa la respuesta. Incluso aunque hayamos condicionado una paloma a
estirar el cuello, no lo estirará si no está hambrienta. Tenemos por tanto un
nuevo tipo de control sobre su conducta: para hacer que la paloma estire el
cuello, simplemente hacemos que tenga hambre. Hemos añadido una operante
elegida entre toda la gama de conductas que una paloma hambrienta
desarrolla normalmente. Nuestro control sobre la respuesta ha sido combinado
con nuestro control sobre la privación de alimento. Veremos en el capítulo VII
que la operante puede también encontrarse bajo el control de un estímulo
externo, que es otra variable que puede ser utilizada para predecir y controlar
la conducta. Hemos de advertir, sin embargo, que ambas variables han de ser
distinguidas del refuerzo en sí mismo.

EXTINCION OPERANTE

Cuando el refuerzo deja de producirse, la respuesta ocurre cada vez con


menos frecuencia según el proceso llamado <<extinción operante>>. Si
cesamos de darle comida, la paloma dejará finalmente de levantar la cabeza.
En general, cuando practicamos una conducta que ya no <<vale la pena>>,
nos sentimos menos inclinados a comportarnos de nuevo de esta manera. Si
perdemos una estilográfica, metemos la mano cada vez menos en el bolsillo
que la contenía; si nadie responde a nuestras llamadas telefónicas, acabamos
por dejar de telefonear; si el piano está desafinado, lo tocamos cada vez
menos; si nuestro aparato de radio hace ruido o si los programas son cada vez
peores, dejamos de escuchar la radio.
79
Puesto que la extinción operante se produce mucho más lentamente que
el condicionamiento operante, el proceso puede seguirse con mayor facilidad.
En condiciones adecuadas se obtienen curvas suaves en las que se ve el
porcentaje de respuestas disminuye lentamente, tal vez a lo largo de un
período de muchas horas. Las curvas revelan propiedades que no sería posible
observar mediante una inspección causal. Podemos <<tener la impresión>> de
que un organismo responde cada vez con menos frecuencia, pero la
regularidad del cambio puede verse solamente cuando se registra la conducta.
Las curvas sugieren que tiene lugar un proceso bastante uniforme que
determina la producción de conducta durante la extinción.

Bajo ciertas circunstancias, un efecto emocional perturba la curva. El


fracaso en el refuerzo de una respuesta conduce no solamente a la extinción
operante sino también a una reacción conocida comúnmente como frustración
o ira. Una paloma que no ha conseguido refuerzo se aparta de la llave,
arrullando, moviendo las alas y practicando otras conductas emotivas (capítulo
X). El organismo humano muestra un doble efecto similar; el niño cuyo triciclo
no responde al pedaleo no solamente deja de pedalear sino que muestra
desagrado de manera posiblemente violenta. La persona que encuentra
atascado un cajón de la mesa del despacho puede que deje pronto de tirar
pero puede también que golpee la mesa, exclame <<maldita sea>>, o muestre
otras señales de ira. De la misma forma que el niño vuelve finalmente al triciclo
y el adulto al cajón, también la paloma aceptará de nuevo la llave cuando la
respuesta emotiva haya disminuido. Cuando otras respuestas permanecen sin
reforzar, pueden suceder otros episodios emocionales. Las curvas de extinción
bajo tales circunstancias muestran una oscilación cíclica al tiempo que la
respuesta emocional se produce, desaparece y se produce de nuevo. Si
eliminamos la emoción mediante una repetida exposición a la extinción o de
cualquier otra forma, la curva aparece de una manera más simple.

La conducta durante la extinción es el resultado del condicionamiento


que la ha precedido, y en este sentido la curva de extinción da una idea
adicional del efecto del refuerzo. Si se ha reforzado solamente una pocas
respuestas, la extinción se produce rápidamente. Un largo proceso de refuerzo
va seguido por un largo período de respuesta. La resistencia a la extinción no
se puede predecir a partir de la probabilidad de la respuesta observada en un
momento dado. Debemos conocer el proceso de refuerzo. Por ejemplo, aunque
hayamos sido reforzados con una excelente comida en un nuevo restaurante,
una mala comida puede reducir a cero nuestra confianza en él; pero si en un
restaurante durante años hemos encontrado la comida excelente, tendríamos
que comer mal algunas veces, sin que otras circunstancias variasen, antes de
que perdiéramos nuestra confianza en él.

N o existe ninguna relación simple entre el nuero de respuestas


reforzadas y el número que aparece en la extinción. Tal como veremos en el

80
capítulo VI, la resistencia a la extinción motivada por un refuerzo intermitente
puede ser mucho mayor que si el mismo número de refuerzos fuese dado en
respuestas consecutivas. De esta forma, si sólo ocasionalmente reforzaos a un
niño para que se comporte bien, el comportamiento persiste después de
interrumpir el refuerzo durante mucho más tiempo que si hubiésemos reforzado
cada caso concreto hasta llegar al mismo número total de refuerzos. Esto tiene
una importancia práctica en los casos en que se dispone de refuerzos
limitados. Problemas de este tipo surgen en la educación, la industria, la
economía y en muchos otros campos. En algunos programas de refuerzo
intermitente podemos contabilizar hasta 10.000 respuestas en la conducta de
una paloma antes de que la extinción sea completa.

La extinción es una manera eficaz de eliminar una operante del


repertorio de un organismo. No debería confundirse con otros procedimientos
pensados para surtir el mismo efecto. La técnica comúnmente preferida es el
castigo, el cual, como veremos en el capítulo XII, implica procesos diferentes y
es de una eficacia discutible. El olvido se conduce con frecuencia con la
extinción. En el olvido el efecto del condicionamiento se pierde simplemente a
medida que pasa el tiempo, mientras que la extinción requiere que la respuesta
sea admitida sin refuerzo. Generalmente, el olvido no se produce rápidamente;
se ha obtenido curvas de extinción apreciables en palomas aun después de
seis años de que la respuesta fuera reforzada por última vez; seis años son
aproximadamente la mitad de la vida normal de una paloma. Durante el
intervalo, la paloma vivió bajo circunstancias en las cuales la respuesta no
pudo posiblemente ser reforzada. En la conducta humana las respuestas
aprendidas producidas por contingencias relativamente precisas, se mantienen
con frecuencia latentes durante más de la mitad de la vida. La afirmación de
que las experiencias tempranas determinan la personalidad del organismo
maduro presupone que el efecto de un refuerzo operante es de larga duración.
De esta forma si, a causa de experiencias en su primera infancia, un hombre se
casa con una mujer que se parece a su madre, el efecto de ciertos refuerzos
tiene que haber sobrevivido durante largo tiempo. La mayoría de los casos de
olvido implican una conducta operante bajo el control de estímulos específicos
y no pueden ser expuestos adecuadamente hasta que dicho control haya sido
tratado en el capítulo VII.

Los efectos de la extinción

La situación en la que extinción es más o menos completa nos es


familiar, incluso a menudo mal entendida. La extinción extrema es a veces
llamada <<abulia>>. Definirla como <<falsa de voluntad>> sirve de poco,
puesto que la presencia o ausencia de voluntad se deduce de la presencia o
ausencia de conducta. Sin embargo, el término parece ser útil en tanto implica
una falta de conducta por alguna razón especial, y siempre podemos hacer la
misma distinción de otra forma. La conducta es fuerte o débil a causa de

81
muchas variables distintas, que una ciencia de la conducta debe identificar y
clasificar. Definimos cualquier caso dado en términos de variables. La situación
que resulta de una extinción prolongada se parece superficialmente a la
inactividad resultante de toras causas. La diferencia radica en la historia del
organismo Un aspirante a escritor que ha enviado a los editores manuscritos
tras manuscritos sólo para verlos rechazados, puede decir que <<no es capaz
de escribir ni una palabra más>>. Puede verse parcialmente paralizado por lo
que llamamos <<falta de inspiración del escritor>>. Es posible que insista
todavía en que <<quiere escribir>>, y podemos estar de acuerdo con él en que
su probabilidad extremadamente baja de respuesta se debe principalmente a la
extinción. Se encuentran todavía operando otras variables que si la extinción
no se hubiera producido, podrían conducir a una alta probabilidad de
respuesta.

La situación de una fuerza operante débil como resultado de la extinción


requiere a menudo tratamiento. Algunos procedimientos de psicoterapia son
sistemas de refuerzo ideados para reinstaurar la conducta que se ha perdido a
través de la extinción. El terapeuta mismo puede proporcionar el refuerzo, o
puede disponer las condiciones de vida en las que la conducta es probable que
se vea reforzada. En la terapéutica por medio del trabajo, por ejemplo, se
anima al paciente a practicar formas simples de conducta que reciban un
refuerzo inmediato y bastante consecuente. No sirve para gran cosa decir que
tal terapéutica ayuda al paciente al proporcionarle una <<sensación de éxito>>,
o que levanta su <<moral>>, configura su <<interés>>, o elimina o previene el
<<desanimo>>. Términos como éstos no hacen que engrosar el creciente
número de explicaciones ficticias. El que lleva a cabo de buena gana una
actividad dada, no da muestras de interés, muestra el efecto del refuerzo. No le
proporcionamos una sensación de éxito, sino que reforzamos una acción
concreta. Desanimarse es simplemente dejar de responder porque el refuerzo
no se producirá. Nuestro problema es simplemente describir la probabilidad de
la respuesta en términos de una historia de refuerzo y extinción.

¿QUÉ HECHOS SON REFORZANTES?

Al tratar con nuestros semejantes en la vida diaria, en la clínica y el


laboratorio, puede que necesitemos conocer precisamente cuán reforzante es
un hecho determinado. A menudo empezamos advirtiendo hasta qué punto
nuestra conducta se ve reforzada por el mismo acontecimiento. Esta práctica
fracasa con frecuencia, incluso se cree todavía comúnmente que los refuerzos
pueden ser identificados al margen de los efectos que producen en un
organismo concreto. Sin embargo, tal como utilizamos aquí el término, la única
característica que define un estímulo reforzante es que refuerza.

Solo existe una manera de conocer si un hecho dado refuerza o no a un


organismo concreto en una condiciones determinadas, y cosiste en hacer una

82
prueba directa. Observemos la frecuencia de una respuesta seleccionada,
hacemos que un hecho sea contingente a ella y observamos cualquier cambio
en la frecuencia. Si hay un camino, clasificamos el hecho como reforzante del
organismo en las condiciones presentes. No es un círculo vicioso clasificar a
los hechos en términos de sus efectos; el criterio es empírico y objetivo. Sin
embargo, sería vicioso si luego pasaremos a afirmar que un hecho dado
fortalece una operante por qué es reforzante. Si tenemos cierto éxito al
conjuntar acerca de las potencias reforzantes es debido a que hemos hecho en
cierta forma un examen imperfecto; hemos calibrado el efecto reforzante de un
estímulo sobre nosotros mismos y suponemos que el mismo efecto se produce
en los demás. Acertamos solamente cuando nos parecemos al organismo que
estamos estudiando y cuando hemos observado correctamente nuestra propia
conducta.

Los hechos reforzantes son de dos tipos. Algunos refuerzos presentan


estímulos, añaden algo a la situación- por ejemplo, comida, agua, contacto
sexual-. A estos le llamamos refuerzos positivos. Otros suprimen algo de la
situación – por ejemplo, un ruido fuerte, una luz muy brillante, frío o calor
extremado, una sacudida eléctrica-. A estos le llamamos negativos. En ambos
casos el efecto del refuerzo es el mismo: aumentar la probabilidad de la
respuesta. No podemos eludir esta distinción alegando que lo reforzante en el
caso negativo es la ausencia de la luz brillante, el ruido fuerte, etc.; se trata de
una ausencia después de una presencia efectiva, y esto no es más que otra
forma de decir que suprimimos el estímulo. La diferencia entre los dos casos
aparecerá más clara si consideramos la presentación de un refuerzo negativo o
la retirada de uno positivo. En realidad, esto es lo que normalmente llamamos
castigo (capítulo XII).

En la aplicación práctica del condicionamiento operante se requiere a


menudo un examen de los hechos que son reforzantes para un individuo dado.
En todos los campos en los que la conducta humana figura de forma
prominente –educación, gobierno, familia, medicina, industria, arte, literatura,
etc.-, constantemente estamos cambiando las probabilidades de respuesta
disponiendo consecuencias reforzantes. La industria que requiere que sus
empleados trabajen conscientemente y sin absentismo, debe asegurarse de
que la conducta de aquéllos se encuentre convenientemente reforzada, no solo
por los salarios sino por unas condiciones de trabajo adecuadas. La muchacha
que dese a continuar saliendo con un compañero debe asegurarse de que la
conducta de su amigo al invitarla y acudir a la cita, se verá convenientemente
reforzada. Para enseñar a un niño a leer, a cantar o un determinado juego, de
una manera eficaz, debemos elaborar un programa de refuerzo educativo en el
cual las respuestas apropiadas <<tengan precio>> con frecuencia. Si el
paciente ha de volver para una consulta posterior, el psiquiatra debe estar
seguro de que la conducta de volver se encuentra reforzada en cierta medida.

83
Valoramos la fuerza de los hecho que refuerzan cuando intentamos
descubrir lo que alguien <<consigue de la vida>>. ¿Qué consecuencias son las
responsables de su repertorio de conductas presente y de las frecuencias
relativas de las respuestas que se producen en el mismo? Sus opiniones
acerca de varios temas comunes de conversación nos dice algo, pero su
conducta diaria es una guía mejor. Deducimos refuerzos importantes de cosas
tan corrientes como su <<interés>> por un escritorio que trata ciertos temas,
por almacenes o museos que exponen ciertos objetos, por amigos que
comparten determinados tipos de conducta, por restaurantes que sirven
determinados tipos de comida, etc. El <<interés>> hace referencia a la
probabilidad que resulta, al menos en parte, de las consecuencias de la
conducta de <<tener interés>>. Podemos estar casi seguros de la importancia
de un refuerzo si observamos las variaciones de la conducta, al tiempo que el
refuerzo se produce o deja de producirse, puesto que entonces es menos
verosímil que el cambio en la probabilidad se deba a un cambio incidental de
cualquier otro tipo. La conducta de relacionarse con un amigo determinado
varía según él va caminando en proporcionar refuerzos. Si observamos esta
covariación, podemos entonces estar bastante seguros de <<lo que significa
esta amistad>> o de <<lo que nuestro sujeto ve en su amigo>>.

Esta técnica de valoración puede ser mejorada para uso clínico e


investigación de laboratorio. Un inventario directo puede efectuarse haciendo
que un sujeto mire una serie de cuadros y registrando el tiempo que emplea en
cada uno de ellos. La conducta d mirar un cuadro está reforzada por lo que en
él se ve; mirar un cuadro puede estar más reforzado que mirar otro, y el tiempo
empleado variará de acuerdo con ello. La información puede ser valiosa si por
cualquier razón necesitamos reforzar o extinguir la conducta de nuestro sujeto.

La literatura, arte y diversiones son refuerzos especialmente


proyectados. El hecho de que el público compre libros, localidades u obras de
arte depende de si estos libros, obras de teatro, conciertos o cuadros
constituyen para él un refuerzo. Frecuentemente, el artista también se limita a
una exploración de lo que es reforzante para él; cuando lo hace así, su obra
<<refleja su propia individualidad>> y entonces es un accidente (o una medida
de su universalidad) si su libro, obras de teatro, composición musical o cuadro
son reforzantes para otros. Puede que haga un estudio directo de la conducta
de los demás en la medida en que el éxito comercial sea importante. (La
exploración de los poderes reforzantes de ciertos medios de comunicación será
tratada en el capítulo XVI).

No podemos solucionar las cosas preguntando directamente a los


individuos sobre lo les refuerza; sus respuestas pueden tener un cierto valor,
pero no son en absoluto necesariamente fidedignas. Una conexión reforzante
no necesita resultar evidente para el individuo reforzado. A menudo, sólo
retrospectivamente se ve que las tendencias de alguien a comportarse de una

84
forma determinada son el resultado de ciertas consecuencias, y, como veremos
en el capítulo XVIII, es posible que él mismo nunca se dé cuenta de esta
relación aunque sea evidente para los demás.

Hay, por supuesto, grandes diferencias entre individuos en cuanto a lo


que constituye un refuerzo. Las diferencias entre especie son tan grandes que
raramente suscitan interés, es obvio que lo reforzante para un caballo no lo es
necesariamente para un perro o para un hombre. Entre los miembros de una
misma especie, es poco probable que las diferencias importantes se deban a la
herencia y, en general, pueden ser atribuidas a circunstancias de la historia del
individuo. El hecho de que los organismos hereden evidentemente la capacidad
de ser reforzados por ciertos hechos no nos ayuda a predecir el efecto
reforzante de un estímulo no experimentado. Tampoco la relación entre el
hecho reforzante y la privación o cualquier otra condición del organismo, dota al
hecho reforzante de una propiedad física peculiar. Es particularmente
improbable que hechos que han adquirido el poder de reforzar aparezcan
marcados de una manera especial. Con todo, estos hechos constituyen una
especie importante de refuerzo.

REFUERZOS CONDICIONADOS

El estímulo presentado en el refuerzo operante puede ser asociado con


otro en el condicionamiento respondente. En el capítulo IV hemos considerado
la adquisición del poder de provocar una respuesta, ahora nos interesa el poder
de reforzar. Aunque el refuerzo es una función de un estímulo diferente, el
proceso resultante de la asociación de estímulo parece ser el mismo. Si hemos
presentado con frecuencia un plato de comida a un organismo hambriento, el
plato vacío provocará la salivación. Hasta cierto punto, el plato vacío reforzará
también una operante.

Podemos demostrar mejor el refuerzo condicionado mediante estímulos


que puedan ser controlados mejor. Si cada vez que encendemos una luz
damos de comer a una paloma hambrienta, la luz se convertirá finalmente en
un refuerzo condicionado. Puede utilizarse para condicionar una operante de la
misma forma que se utiliza la comida. Empezamos a conocer en qué
condiciones la luz adquiere esta propiedad: cuanto más se asocia la luz a la
comida, más adquiere el carácter del refuerzo; la comida no debe seguir a la
luz después de un intervalo de tiempo demasiado largo, y el poder de refuerzo
se pierde rápidamente cuando dejamos de presentar la comida. Deberíamos
esperar todo esto de nuestro conocimiento del estímulo condicionado.

Los refuerzos condicionados son frecuentemente el producto de


contingencias naturales. Generalmente, la comida y el agua se obtienen
solamente después de que el organismo ha practicado una conducta

85
<<precurrente>> tras haber actuado sobre el medio ambiente para crear la
posibilidad de comer o beber. Por tanto, los estímulos generales por esta
conducta precurrente se convierten en refuerzos. De esta forma, antes de que
podamos llevar la comida del plato a la boca con éxito, debemos estar cerca
del plato, y cualquier conducta que nos lleve cerca de él se ve reforzada
automáticamente. La conducta precurrente se encuentra, por tanto, apoyada.
Esto es importante por cuanto solamente una pequeña parte de nuestra
conducta se ve reforzada de forma inmediata por comida, agua, contacto
sexual u otros hechos de importancia biológica obvia. Aunque es característico
de la conducta humana que los refuerzos primarios sean eficaces después de
un largo período de tiempo, esto sólo se debe probablemente a que los hechos
que intervienen se convierten en refuerzos condicionados. Cuando alguien
coloca postigos en su casa en octubre porque una conducta similar en el
octubre anterior fue seguida de una casa caldeada en enero, necesitamos
cubrir la laguna que existe entre su conducta de octubre y el efecto de enero.
Entre los refuerzos condicionados responsables de la intensidad de su
conducta, se encuentran ciertas consecuencias verbales proporcionadas por sí
mismo o por los vecinos. A menudo es importante introducir una serie de
hechos entre un acto y un refuerzo primario fundamentalmente para controlar la
conducta con fines prácticos. En la educación, industria, psicoterapia y muchos
otros campos, nos encontramos con técnicas pensadas para crear refuerzos
condicionados adecuados. El efecto de proporcionar consecuencias afectivas
inmediatas allí donde las consecuencias fundamentales aparecerán retrasadas,
equivale a <<elevar la moral>>, <<elevar el interés>>, <<prevenir el
desánimo>> o corregir la intensidad operante baja que hemos llamado abulia,
etc. Más concretamente, esto sirve para inducir a los estudiantes a estudiar, a
los empleados a acudir al trabajo, a los pacientes a practicar una conducta
social aceptable, etc.

Refuerzos generalizados

Un refuerzo condicionado se generaliza cuando se halla asociado con


más de un refuerzo primario. El refuerzo generalizado es útil porque la
situación momentánea en que normalmente se encuentra el organismo no es
probablemente la más adecuada para impulsarle a la acción. La intensidad
operante generada por un solo refuerzo puede ser observada solamente bajo
condiciones apropiadas de privación –cuando le reforzamos con comida,
incrementamos nuestro control sobre un hombre hambriento-. Pero si un
refuerzo condicionado ha sido asociado a refuerzos adecuados en muchas
situaciones, es más probable que, en una ocasión posterior, prevalezca un
estado adecuado de privación; por tanto, es más probable que tenga lugar una
respuestas. Cuando reforzamos con dinero, por ejemplo, nuestro control
subsiguiente es relativamente independiente de privaciones momentáneas. Un
refuerzo generalizado se crea porque muchos refuerzos primarios solamente

86
pueden obtenerse después de que el medio ambiente físico ha sido
manipulado eficazmente. Una forma de conducta precurrente puede preceder a
diferentes tipos de refuerzos en diferentes ocasiones. La estimulación
inmediata a partir de tal conducta se convertirá entonces en un refuerzo
generalizado. Nos vemos automáticamente reforzados, independientemente de
cualquier privación concreta, cuando controlamos con éxito el mundo físico.
Esto puede explicar nuestra tendencia a llevar a cabo trabajos de habilidad,
creación artística y práctica de deportes como los bolos, billar o tenis.

Es posible, sin embargo, que parte del efecto reforzante del <<feed back
sensorial>> no esté condicionado. Un niño parece sentirse reforzado por una
estimulación del medio ambiente que no ha ido seguida de un refuerzo
primario; el sonajero es un ejemplo. La capacidad de recibir refuerzos de este
modo podría haber surgido durante el proceso evolutivo, y puede tener un
paralelo en el refuerzo que recibimos al <<hacer que el mundo se mueva>>.
Cualquier organismo reforzado por su éxito al manipular la naturaleza,
independientemente de las consecuencias momentáneas, estará en una
posición favorable cuando se figan consecuencias importantes.

Aparecen varios refuerzos generalizados importantes cuando la


conducta es reforzada por otras personas. Un caso simple es la atención; es
familiar el caso del niño que se porta mal <<solo para llamar la atención>>. La
atención de la gente constituye un refuerzo porque es una condición necesaria
para otros refuerzos por parte de la misma. En general, solamente las personas
que nos prestan atención refuerzan nuestra conducta. La atención de alguien
particularmente susceptible de proporcionar refuerzo- un padre, profesor o ser
querido- constituye un refuerzo generalizado especialmente bueno y fija una
conducta para-llamar-la-atención especialmente intensa. Muchas respuestas
verbales solicitan atención especialmente- por ejemplo, <<Mira>>, <<Ten>>, o
el uso del nombre en vocativo-. Otras formas características de conducta
normalmente intensas porque reciben atención son fingirse enfermo, ponerse
pesado o mostrarse conspicuo (exhibicionismo).

A menudo, la atención no basta. Es probable que otra persona refuerce


solamente aquella parte de nuestra conducta que aprueba y cualquier signo de
aprobación se convierte por tanto en refuerzo por derecho propio. La conducta
que provoca una sonrisa o la respuesta <<Eso está bien>> o <<Conforme>> o
cualquier elogio, se ve fortalecida. Utilizamos este refuerzo generalizado para
establecer y formar la conducta de otros, particularmente en educación. Por
ejemplo, enseñamos a hablar correctamente a niños y adultos diciendo >>Está
bien>> cuando se produce la conducta apropiada.

Un refuerzo generalizado aún más fuerte es el afecto. Puede estar


relacionado especialmente con el contacto sexual como refuerzo primario,

87
pero, cuando cualquiera que muestre afecto proporciona también otros tipos de
refuerzo, el efecto es generalizado.

Es difícil definir, observar y medir la atención, la aprobación y el afecto.


En realidad, no son cosas sino aspectos de la conducta de otros. Sus sutiles
dimensiones físicas presentan dificultades no solamente para el científico que
debe estudiarlas, sino también para el individuo reforzado por ellas. Si no
vemos claramente que alguien nos presta atención, aprueba nuestras acciones
o se muestra cordial con nosotros, nuestra conducta nos estará reforzada
firmemente; por tanto, se puede ser débil, tender a producirse en un momento
inoportuno, etc. No <<sabemos qué hacer para llamar la atención o provocar
afecto ni cuando hacerlo>>. La lucha del niño por llamar la atención, del
enamorado por una señal de afecto y del artista por el reconocimiento
profesional, muestra la conducta perseverante que, como veremos en el
capítulo VI, solamente es resultado de un refuerzo intermitente.

Otro refuerzo generalizado es la sumisión de los demás. Cuando se ha


obligado a alguien a proporcionar varios refuerzos, cualquier indicación de
aquiescencia por parte suya se convierte en refuerzo generalizado. El fanfarrón
es reforzado por signos de cobardía y los miembros de la clase dominante por
signos de deferencia. El prestigio y la estima solamente son refuerzos
generalizados mientras garantizan que otras personas se comportan de forma
determinada. Que <<seguir su propio camino>> es reforzante queda
demostrado por la conducta de quienes desean ejercer control sobre los demás
por el gusto de controlar. Las dimensiones físicas de la sumisión no son
generalmente tan sutiles como las de la atención, aprobación o afecto. El
fanfarrón puede insistir en un signo claro de su dominación, y las prácticas
rituales ponen de relieve la deferencia y el respeto.

Un refuerzo generalizado que se distingue fácilmente por su


característica física es la moneda. El ejemplo más común es el dinero,
Constituye el refuerzo generalizado por excelencia porque, aunque <<no se
puede comprar todo con dinero>>, puede ser cambiado por una gran variedad
de refuerzos primarios. La conducta reforzada con dinero es relativamente
independiente de la privación momentánea del organismo, y la utilidad general
del dinero como refuerzo depende en parte de este hecho. Su efectividad se
debe asimismo a sus dimensiones físicas. Estas permiten una contingencia
más acusada entre conducta y consecuencia: cuando nos pagan con dinero
sabemos lo que nuestra conducta ha realizado y qué conducta lo ha realizado.
El efecto reforzante puede ser también condicionado con más éxito: el valor de
cambio de la moneda es más evidente que el de la atención, aprobación, afecto
o incluso que el de la sumisión.

El dinero no es el único tipo de moneda. En el campo de la educación,


por ejemplo, el individuo actúa, en parte, debido a las notas, graduaciones y

88
diplomas que recibe. Estos no son tan fácilmente cambiables por refuerzos
primarios como el dinero, pero la posibilidad de cambio existe. Las monedas
educativas forman una serie en la que una puede ser cambiada por la siguiente
y el valor comercial o de prestigio de la última, el diploma, está muy claro. Por
regla general, los premios, medallas y becas concedidos por calificaciones
altas o realizaciones o habilidades especializadas no se hallan asociados
explícitamente a refuerzos primarios, pero las dimensiones físicas claramente
definidas de tales premios representan una ventaja para la preparación de
contingencias. Generalmente el refuerzo esencial es similar al del prestigio o
estima.

Es fácil olvidar los orígenes de los refuerzos generalizados y considerar


que constituyen refuerzo por derecho propio. Hablamos de la <<necesidad de
atención, aprobación o de afecto>>, la <<necesidad de dominar>> y del
<<amor al dinero>> como si fueran condiciones primarias de privación. Pero la
capacidad de verse reforzado de esta forma podría difícilmente haber
evolucionado en el breve período de tiempo durante el cual se han mantenido
las condiciones requeridas. La atención, el afecto, la aprobación y la sumisión
presumiblemente sólo han existido durante un breve período de tiempo en la
sociedad humana, a medida que avanzó el proceso de evolución. Además no
representan formas fijas de estimulación puesto que dependen de la
idiosincrasia de grupos concretos. En tanto que el afecto es principalmente
sexual, puede estar relacionado con una condición de privación primeria que
hasta cierto punto es independiente de la historia personal del individuo, pero
las <<muestras de afecto>> que se convierten en refuerzos a causa de su
asociación con el contacto sexual o con otros refuerzos, difícilmente pueden
resultar reforzantes por razones genéticas. La moneda es aún de más reciente
advenimiento y no se insinúa seriamente que la necesidad de la misma sea
heredada. Generalmente, podemos observar el proceso a través del cual el
dinero se convierte en refuerzo para un niño. Sin embargo, el <<amor al
dinero>> a menudo parece gozar de tanta autonomía como la <<necesidad de
aprobación>> y si nos limitaremos a la efectividad observada de estos
refuerzos generalizados, deberíamos tener muchas razones para presuponer
como heredadas tanto la necesidad de dinero como las de atención,
aprobación, afecto o dominación.

Finalmente los refuerzos generalizados son efectivos aun en el caso de


que los refuerzos primarios en que se basan no les acompañen ya. Nos gustan
los juegos de habilidad por sí mismos; llamamos la atención o la aprobación
por así hacerlo; el efecto no va siempre seguido por un refuerzo sexual más
explícito; la sumisión de otros es reforzante aunque no hagamos uso de ella; un
avaro puede verse tan reforzado por el dinero que se dejará morir de hambre
antes que abandonarlo. Estos hechos observables deben tener su lugar en
cualquier consideración teórica o práctica. Sin embargo, no significan que los

89
refuerzos generalizados sean algo más que las propiedades físicas de los
estímulos observados en cada saso o que existan entidades no físicas que
deban ser tenidas en cuenta.

¿POR QUÉ REFUERZA UN REFUERZO?

La ley del Efecto no es una teoría, es simplemente una regla para


fortalecer la conducta. Cuando reforzamos una respuesta y observamos un
cambio en su frecuencia podemos decir fácilmente lo que ha sucedido en
términos objetivos. Pero al explicar por qué ha sucedido, es probable que
recurramos a la teoría. ¿Por qué refuerza un refuerzo? Una teoría nos dice que
el organismo repetido una respuesta porque encuentra que las consecuencias
son <<agradables>> o <<satisfactorias>>. ¿Pero en qué sentido es esto una
explicación dentro del marco de ciencia natural? <<Agradable>> o
<<satisfactorio>> son términos que no se refieren aparentemente a
propiedades físicas de hechos reforzantes, puesto que las ciencias físicas no
utilizan ni estos términos ni sus equivalentes. Los términos deben referirse a
algún efecto sobre el organismo, pero ¿podeos definirlo de tal manera que sea
útil para dar razón de un refuerzo?

A veces se argumenta que una cosa es agradable si un organismo se


aproxima o mantiene contacto con ella y que es desagradable si el organismo
la evita o la mantiene a raya. Existen muchas variantes en este intento de
encontrar una definición objetiva, pero todas están sujetas a la misma crítica: la
conducta especificada puede ser meramente otro producto del efecto
reforzante. Decir que un estímulo es agradable en el sentido de que un
organismo tiende a acercarse a él o a prolongarlo puede ser solamente otra
forma de decir que el estímulo ha reforzado la conducta del acercamiento o
prolongación. En lugar de definir un efecto reforzante en términos de su efecto
sobre la conducta en general, hemos especificado simplemente una conducta
común que es reforzada casi de manera inevitable y, por tanto, puede utilizarse
en general como indicador del poder reforzante. Si entonces decimos que un
estímulo es reforzante porque es agradable, lo que aparentemente parece ser
una explicación en términos de dos efectos, es en realidad una descripción
redundante de uno solo.

Otro intento de explicación alternativo es definir <<agradable>> y


<<desagradable>> (o <<satisfactorio>> y <<molesto>>), preguntando al sujeto
qué <<opina>>de ciertos hechos. Esto supone que el refuerzo tiene dos
efectos –fortalecer la conducta y produce <<pensamientos>>- y que el uno está
en función del otro. Pero la relación funcional puede establecerse en el otro
sentido. Cuando alguien manifiesta que un hecho es agradable, puede que
exprese solamente que éste es el tipo de hecho que le refuerza o hacia el que
tiende a moverse porqué él mismo ha reforzado tal movimiento. Veremos en el
capítulo XVII que probablemente no se podrían adquirir respuestas verbales

90
respecto al placer como un hecho puramente privado, a no ser que sucediera
algo parecido a esto. De todas formas, el mismo sujeto no está en una posición
ventajosa para hacer tales observaciones. Los <<juicios subjetivos>> acerca de
la agradabilidad o satisfacción proporcionada por estímulos son normalmente
inciertos e inconsistentes. Como ha puesto de relieve la doctrina del
inconsciente, puede que no seamos capaces en absoluto de informar acerca
de hechos que pueden demostrarse que constituyen para nosotros un refuerzo
o que hagamos un informe que esté en contradicción directa con las
observaciones objetivas; podemos calificar como desagradable un tipo de
hecho que puede demostrarse que es reforzante. Ejemplos de esta anomalía
van desde el masoquismo al martirio.

A veces, se argumenta que el refuerzo es eficaz porque reduce un


estado de privación. Aquí existe al menos un efecto colateral que no debe
confundirse con el refuerzo en sí mismo. Es evidente que la privación es
importante en el condicionamiento operante. Utilizamos una paloma hambrienta
en nuestro experimento, y no hubiéramos podido demostrar de otra forma el
condicionamiento operante. Cuanto más hambrienta esté el ave tanto mayor
será la frecuencia con que responderá como resultado del refuerzo. Pero a
pesar de esta relación, no es cierto que el refuerzo reduzca siempre la
privación. El condicionamiento puede tener lugar antes de que cualquier
cambio sustancial pueda producirse en la privación medida de otra manera.
Todo lo que podemos decir es que el tipo de acontecimiento que reduce la
privación es también reforzante.

La conexión entre refuerzo y saciedad debe buscarse en el proceso evolutivo.


Difícilmente podemos pasar por alto el importante significado biológico de los
refuerzos primarios. La comida, el agua y el contacto sexual al igual que la
huida de las situaciones peligrosas (capítulo XI) están obviamente relacionados
con el bienestar del organismo. Un individuo rápidamente reforzado por tales
sucesos adquirirá una conducta altamente eficaz. También es biológicamente
ventajoso que la conducta debida a un refuerzo dado sea especialmente
susceptible de ocurrir en un estado de privación adecuado. De esta forma es
importante, no solamente que cualquier conducta que lleve a la obtención de
comida se convierta en una parte importante de un repertorio, sino que esta
conducta sea particularmente intensa cuando el organismo esté hambriento.
Estas dos ventajas son probablemente responsables del hecho de que un
organismo pueda ser reforzado de manera concreta y de que el resultado se
observe en condiciones pertinentes de privación.

Algunas formas de estimulación son positivamente reforzantes aunque


no parezcan provocar una conducta que tenga importancia biológica. Un niño
es reforzado no solamente por la mida, sino también por el tintineo de una
campana o el centello de un objeto brillante. La conducta que precede
inmediatamente a tales estímulos muestra una probabilidad aumentada de que

91
se produzca de nuevo. Es difícil, si no imposible, atribuir estos efectos
reforzantes a una historia de condicionamiento. Más tarde es posible que
encontremos al mismo sujeto reforzada por una orquesta o por un brillante
espectáculo. Aquí es más difícil asegurar que el efecto reforzante no éste
condicionado. Sin embargo, podemos asegurar plausiblemente que una
capacidad de ser reforzado por cualquier feed-back procede del medio
ambiente sería biológicamente ventajosa, puesto que prepararía al organismo
para operar con éxito sobre el medio ambiente antes de que se diera un estado
de privación determinado. Cuando el organismo genera un feed-back táctil,
como al percibir el grueso de un tejido o la superficie de una escultura, el
condicionamiento es comúnmente considerado como resultante de un refuerzo
sexual, aunque el área estimulada no sea principalmente sexual. Es tentador
suponer que otras formas de estimulación producidas por la conducta están
relacionadas de manera similar con importantes hecho biológicos. Cuando el
medio ambiente cambia, la capacidad de verse reforzado por un hecho dado
puede significar una desventaja biológica. El azúcar es altamente reforzante
par la mayoría de los seres humanos, como muestra la amplia aceptación de
los caramelos. Su efecto a este respecto excede en gran manera las
exigencias biológicas comunes; sin embargo, esto no ocurrió hasta que el
azúcar fue cultivado y refinado en gran escala. Hasta hace unos pocos cientos
de años, el fuerte efecto reforzante del azúcar fue probablemente una ventaja
biológica. El medio ambiente ha cambiado. El sexo proporciona otro ejemplo.
Ya no hay una ventaja biológica en el importante efecto reforzante del contacto
sexual, pero no necesitamos retroceder muchos cientos de años para encontrar
situaciones de hambre y peste, bajo las cuales el poder del refuerzo sexual
ofrecía una ventaja decisiva. Una explicación biológica del poder reforzante es
quizá lo más que podemos hacer al intentar explicar por qué un hecho es
reforzante. Tal explicación probablemente es e poca ayuda en un análisis
funcional, ya que no nos suministran ninguna manera de identificar un estímulo
reforzante como tal, antes de haber probado su poder como refuerzo en un
organismo dado. Por tanto, debemos contentarnos con un examen en términos
de efectos de los estímulos sobre la conducta.

CONTINGENCIAS ACCIDENTALES Y CONDUCTA <<SUPERTICIOSA>>

Se ha dicho que el experimento de Thorndike no es típico del proceso de


aprendizaje, porque el gato no puede <<ver la conexión>> entre el hecho de
mover el cerrojo y escapar de una caja. Pero en el condicionamiento operante
no es esencial ver una conexión. Tanto durante el proceso de condicionamiento
como después de él, el sujeto habla con frecuencia acerca de su conducta en
relación con su medio ambiente (capítulo XVII). Sus informes pueden ser útiles
en una descripción científica, y en su reacción ante su propia conducta puede
ser incluso un eslabón importante en ciertos procesos complejos. Pero tales
informes o relaciones no son necesarios en el simple proceso del

92
condicionamiento operante. Esto resulta evidente en el hecho de que alguien
puede no ser capaz de describir una contingencia que ha surgido efecto de
manera clara.

Tampoco es necesarios que exista una conexión permanente entre una


respuesta y su refuerzo. Logramos que la obtención de comida sea contingente
con la respuesta de la paloma disponiendo conexiones mecánicas y eléctricas.
Fuera del laboratorio varios sistemas físicos son responsables de las
contingencias entre la conducta y sus consecuencias. Pero éstos no necesitan
–generalmente no lo hacen- afectar al organismo de otra forma. En lo que
concierne al organismo, la única propiedad importante de la contingencia es
temporal. El refuerzo sigue simplemente a la respuesta. No importa cómo este
proceso se lleve a cabo.

Debemos suponer que la introducción de un refuerzo refuerza siempre


algo, puesto que coincide necesariamente con alguna conducta. Hemos visto
también que un solo refuerzo puede tener un efecto considerable. Si existe
solamente una conexión accidental entre la respuesta y la aparición del
refuerzo, la conducta llamada <<supersticiosa>>. Podemos demostrar esto en
la paloma acumulando el efecto de varias contingencias accidentales.
Supongamos que le damos una pequeña cantidad de comida cada quince
segundos, sin tener en cuenta lo que ella esté haciendo. Cuando le demos la
comida por primera vez, la paloma se estará comportando de alguna manera –
aunque sólo sea estando de pie- y el condicionamiento tendrá lugar. Es
entonces más probable que la misma conducta se lleve adelante cuando le
demos de nuevo la comida. Si éste es el caso, la <<operante>> se verá así
fortalecida. Si no, será fortalecida cualquier otra conducta. Eventualmente, una
parte dada de conducta alcanzará una frecuencia tal que recibirá refuerzo a
menudo y se convertirá entonces en una parte permanente del repertorio del
ave, incluso en el caso de que la comida haya sido proporcionada por un reloj
no conectado con su conducta. Las respuestas manifiestas que han sido
establecidas de esta forma incluyen; volverse bruscamente hacia un lado, dar
saltos alternando las patas, doblarlas y rascarse, volverse, pavonearse y
levantar la cabeza. La topografía de la conducta puede continuar elaborándose
con refuerzos ulteriores, puesto que pueden coincidir ligeras modificaciones en
la forma de la respuesta con la obtención de la comida.

Para producir conducta supersticiosa son importantes los intervalos con


que se suministra la comida. Si damos comida cada sesenta segundos, el
efecto de un refuerzo se ha perdido considerablemente antes de que ocurra
otro, y es más probable que aparezca otra conducta. Por tanto, es menos
probable que se produzca la conducta supersticiosa, aunque puede ocurrir esto
si el experimento se pone en práctica durante un largo período de tiempo.
Generalmente, en intervalos de quince segundos el efecto es casi inmediato. Si

93
se ha establecido una respuesta supersticiosa, sobrevirá aun cuando sea
reforzada sólo raras veces.

La paloma no es un animal excepcionalmente estúpido. También la


conducta humana es fuertemente supersticiosa. Solamente una pequeña parte
de la conducta fortalecida por contingencias accidentales evoluciona hacia las
prácticas rituales que llamamos <<supersticiones>>, pero actúa el mismo
principio. Supongamos que encontramos un billete de diez dólares mientras
paseamos por el parque /y pongamos que éste es un hecho que tiene un efecto
reforzante considerable). Debemos suponer que lo que estamos haciendo en
aquel momento, o lo que hayamos estado haciendo, se ve reforzado en el
momento en que encontramos el billete. Desde luego sería difícil probar esto
de una manera rigurosa, pero es probable que estemos más dispuestos a ir de
nuevo a pasear, particularmente por el mismo parque o uno similar, que nos
sintamos ligeramente más inclinados a mirar al suelo precisamente tal como lo
hicimos cuando encontramos el dinero, etc. Esta conducta variará con
cualquier estado de privación en que el dinero sea importante. No deberíamos
llamar superstición a esto, pero es generado por una contingencia que sólo
raramente es <<funcional>>.

Algunas contingencias que producen conducta supersticiosa no son del


todo accidentales. A veces es probable que una respuesta sea seguida por una
consecuencia que ella, no obstante, no <<produce>>. Los mejores ejemplos de
ello implican un tipo de estímulo que es reforzante cuando es eliminado
(capítulo XI). El fin de un estímulo breve de este tipo puede ocurrir justo en el
momento oportuno para reforzar la conducta generada por su desaparición.
Aparece el estímulo aversivo y el organismo se vuelve activo, el estímulo
termina y refuerza una parte de la conducta. Ciertas enfermedades, cojeras y
reacciones alérgicas duran tanto que cualquier medida tomada para
<<curarlas>> es probable sea reforzada cuando aquella situación desaparece.
No es necesario que dicha medida sea responsable de la curación. Los
complicados rituales de medicina no científica parecen explicarse por esta
característica de muchas enfermedades.

En la conducta operante supersticiosa, lo mismo que en los reflejos


condicionales supersticiosos tratados en el capítulo IV, el proceso de
condicionamiento sigue senderos equivocados. El condicionamiento ofrece
tremendas ventajas al equiparar al organismo con una conducta que es eficaz
en un ambiente nuevo, pero parece que no hay forma de prevenir la
adquisición por accidente de una conducta no ventajosa. De manera curiosa,
esta dificultad debe haber aumentado al tiempo que el proceso de
condicionamiento se veía acelerado por el curso de la evolución. Si, por
ejemplo, fuera necesario que siempre coincidieran tres refuerzos para cambiar
la probabilidad de una respuesta, la conducta supersticiosa sería improbable.
Sólo debido a que los organismos han alcanzado un punto en el que una sola

94
contingencia ocasiona un cambio sustancial, son vulnerables ante las
coincidencias.

Los rituales supersticiosos en la sociedad humana traen consigo


fórmulas verbales y son transmitidos como parte de la cultura. En este punto
difieren del simple efecto del refuerzo operante accidental. Pero tienen que
haberse originado por el mismo proceso y son probablemente afianzados por
contingencias ocasionales que siguen la misma pauta.

METAS, PROPOSITOS Y OTRAS CAUSAS FINALES

No es correcto decir que el refuerzo operante <<fortalece la respuesta


que le precede>>, la respuesta se ha producido ya y no pueden cambiarse. Lo
que cambia es la probabilidad futura de respuestas de la misma clase de
conducta, más que la respuesta en un ejemplo concreto, que se encuentra
condicionada. Por tanto, no existe ninguna violación del principio fundamental
de la ciencia que desestima las <<causas finales>>. Se viola este principio
cuando se afirma que la conducta está bajo el control de un <<incentivo>>, una
<<meta>> que el organismo ha conseguido todavía o un <<propósito>> que no
ha cumplido. Las proposiciones que utilizan palabras como <<incentivo>> y
<<propósito>> son generalmente reducibles a proporciones sobre
condicionamiento operante, y se requiere solamente un ligero cambio para
introducirlas dentro del marco de una ciencia natural. En lugar de decir que un
hombre actúa a causa de las consecuencias que van a seguir su conducta,
decimos simplemente que actúa a causa de las consecuencias que han
seguido a una conducta similar en el pasado. Esto es, desde luego, la Ley del
Efecto o condicionamiento operante.

A veces se argüye que una respuesta no queda completamente descrita


hasta que señalamos su objetivo, como una más de sus propiedades. Pero
¿Qué significa <<describir>>? Si observamos a alguien andando por la calle,
podemos hablar de este hecho en el lenguaje de la física. Si luego añadimos
<<que su objetivo es echar una carta<<, ¿hemos dicho algo que estuviera
incluido en el primer relato? Evidentemente sí, puesto que puede andar por la
calle <<por muchas razones>>, y lo hará, físicamente, de la misma forma en
cada caso. Pero la distinción que debe hacerse no es entre ejemplos de
conducta sino entre las variables de las cuales la conducta es función. El
objetivo no es una propiedad de la conducta en sí misma, sino que es una
manera de referirse a las variables que la controlan. Si hacemos nuestro relato
después de haber sido visto al sujeto echar la carta y volverse, le atribuimos un
<<objetivo>>, porque la conducta de andar por la calle tuvo un desenlace. Este
hecho <<da un significado>> a su actuación, no porque amplíe una descripción
de la conducta como tal, sino porque indica una variable independiente de la
cual puede haber estado en función. No podemos conocer su <<objetivo>
antes de verle echar la carta, a no ser que antes hayamos observado una

95
conducta similar y unas consecuencias parecidas. Si hemos hecho esto,
simplemente utilizamos el término para predecir que echará la carta en esta
ocasión.

Nuestro sujeto tampoco puede indicar su propio propósito sin referirse a


acontecimientos similares. Si le preguntamos por qué anda por la calle o cuál
es su propósito y dice <<voy a echar una carta>>, no hemos averiguado nada
nuevo acerca de su conducta, sino solamente acerca de algunos de sus
posibles causas. Desde luego, el sujeto puede estar en una posición
privilegiada para describir estas variables, puesto que ha estado en estrecho
contacto con su propia conducta durante muchos años. Pero su afirmación no
es por eso distinta afirmaciones similares hechas por otras personas que han
observado su conducta en algunas ocasiones. Como veremos en el capítulo
XVIII, está haciendo simplemente una predicción verosímil en término de sus
experiencias consigo mismo. Además puede estar equivocado. Es posible que
diga que <<va a echar una carta>> y que realmente lleve en la mano una carta
franqueada y que la eche al buzón, pero puede que todavía podamos
demostrar que su conducta está primariamente determinada por el hecho de
que en ocasiones pasadas se ha encontrado con alguien importante para él en
un paseo similar. Puede que no <<sea consciente de su propósito>> en el
sentido de ser capaz de decir que su conducta es intensa por esta razón. El
hecho de que la conducta parezca <<estar dirigida hacia el futuro>> es
engañoso. Consideramos, por ejemplo, el caso de <<estar buscando algo>>.
¿En qué sentido este <<algo>> que no se ha encontrado todavía es importante
para la conducta? Supongamos que condicionamos una paloma a picotear un
punto en la pared de la caja y luego, cuando la operante esté bien establecida,
quitamos este punto. El pájaro va al sitio acostumbrado, levanta la cabeza, mira
hacia aquella dirección y puede incluso picotee levemente el sitio
acostumbrado. Antes de que la extinción esté ya muy avanzada vuelve una y
otra vez y se comporta de manera similar. ¿Debemos decir que la paloma
<<está buscando el punto? ¿Hemos de tener en cuenta el punto <<buscado>>
al explicar la conducta?

No es difícil interpretar este ejemplo en términos de refuerzo operante.


Puesto que la estimulación visual del punto ha precedido generalmente a la
obtención de comida, aquél que se ha convertido en un refuerzo condicionado.
Fortalece la conducta de mirar hacia direcciones concretas desde distintas
posiciones. Aunque nos hemos propuesto condicionar solamente la respuesta
de picotear, de hecho hemos fortalecido muchos tipos diferentes de conducta
precurrente que llegan al ave a posiciones desde la cuales ve el punto y lo
picotea. Aunque hayamos quitado el punto, estas respuestas siguen
apareciendo hasta que se produce la extinción. El punto <<que está
buscando>> es el que en el pasado ha aparecido como refuerzo inmediato de

96
la conducta de mirar. En general buscar algo que consiste en emitir respuestas
que en el pasado han producido <<algo>> como consecuencia.

La misma interpretación puede aplicarse a la conducta humana. Cuando


vemos a alguien andando por una habitación abriendo cajones, buscando bajo
las revistas, etc., podemos describir su conducta en términos completamente
objetivos: <<se encuentra ahora en una parte determinada de la habitación; ha
cogido un libro entre el pulgar y el índice de la mano derecha; levanta el libro e
inclina la cabeza de manera que pueda verse cualquier objeto que se halle
situado debajo>>. Podemos también <<interpretar<< su conducta o <<ver un
significado en ella>>, diciendo que <<está buscando las gafas>>. Lo que
hemos añadido no es una descripción más amplia de su conducta, sino una
inferencia sobre alguna de las variables responsables de aquélla. No hay
ninguna meta, incentivo, propósito o significado comunes que hayan de tenerse
en cuenta. Esto es así incluso si le preguntamos qué está haciendo y dice
<<estoy buscando las gafas>>. Esto no es una descripción más amplia de su
conducta, sino de las variables de las cuales su conducta es función; es
equivalente a <<he perdido las gafas>>, <<voy a dejar de hacer lo que estoy
haciendo cuando encuentre las gafas>> o <<cuando hice esto en el pasado,
encontré las gafas>>. Estas traducciones pueden parecer rodeos innecesarios,
pero solamente porque las expresiones que implican metas y propósitos son
abreviaciones.

Con mucha frecuencia atribuimos un objetivo a la conducta como otra


forma de describir su adaptabilidad biológica. Ya se ha discutido este hecho,
pero debemos todavía añadir algo. Tanto en el condicionamiento operante
como en la selección evolutiva de las características de la conducta, las
consecuencias alteran la probabilidad futura. Los reflejos y otros modelos
innatos de conducta evolucionan porque aumentan las probabilidades de
supervivencia de la especie. Las operantes se adquieren porque van seguidas
de consecuencias importantes para el individuo. Ambos procesos suscitan la
cuestión del objetivo por la misma razón, y en ambos el recurrir a una causa
final puede rechazarse de la misma forma. Una araña no posee el repertorio
elaborado de conducta para construir la tela porque está la capacitará para
capturar la comida que necesita para sobrevivir. Posee esta conducta porque
una conducta similar por parte de otras arañas en el pasado las ha capacitado
para capturar la comida que ellas necesitan para sobrevivir. Ha tenido lugar
una serie de acontecimientos importantes para la conducta de elaborar la tela
en su primitiva historia evolutiva. Nos equivocamos al decir que observamos el
<<propósito>> de la tela cuando observamos hechos similares en la vida del
individuo.

97

También podría gustarte