0% encontró este documento útil (0 votos)
60 vistas28 páginas

TEMA4

El documento trata sobre el aprendizaje. Explica que el aprendizaje implica un cambio en los mecanismos de la conducta, no solo en la conducta misma, y que este cambio es relativamente permanente. También describe varios tipos de disposiciones innatas como los reflejos, los instintos, la habituación y la sensibilización, que son mecanismos importantes para la adaptación del organismo al ambiente.

Cargado por

Maria Coello
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
60 vistas28 páginas

TEMA4

El documento trata sobre el aprendizaje. Explica que el aprendizaje implica un cambio en los mecanismos de la conducta, no solo en la conducta misma, y que este cambio es relativamente permanente. También describe varios tipos de disposiciones innatas como los reflejos, los instintos, la habituación y la sensibilización, que son mecanismos importantes para la adaptación del organismo al ambiente.

Cargado por

Maria Coello
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 28

TEMA 4:

EL APRENDIZAJE

1. APRENDIZAJE Y DISPOSICIONES INNATAS DE CONDUCTA


Es la más importante de todas las disposiciones innatas y filogenéticas que nos
permiten adaptarnos y sobrevivir en un mundo cambiante y complejo.

1.1. DEFINICIÓN DE APRENDIZAJE

No es posible definir de forma precisa el aprendizaje, pero hay cierto acuerdo entre
varios autores: ” El aprendizaje es un cambio relativamente permanente de los
mecanismos de la conducta, debido a la experiencia con los acontecimientos del
medio”.

El aprendizaje supone un cambio en los mecanismos de la conducta, no un cambio


en la conducta misma. Los cambios en la conducta pueden deberse a otros procesos
distintos del aprendizaje. La conducta está determinada por muchos otros factores,
además del aprendizaje, como:

 la motivación
 la oportunidad
 las capacidades motoras y sensoriales del organismo.

Lo que se observa es la ejecución de la conducta, no el aprendizaje de la conducta.


No se puede considerar automáticamente que un cambio en la ejecución de una
conducta refleje aprendizaje. A partir de los cambios en la conducta (ejecución) se
infieren los cambios en los mecanismos de la conducta (aprendizaje).

Los cambios en la conducta producidos por el aprendizaje no siempre son


permanentes, y por eso se indica en la definición que es un cambio relativamente
permanente. Como consecuencia de una nueva experiencia, puede que una conducta
previamente aprendida no vuelva a darse. Puedes aprender un camino nuevo más
rápido para ir al trabajo y dejar de utilizar el antiguo.

Existen otros mecanismos que producen cambios permanentes en la conducta pero


que no se consideran aprendizaje:

1
 Desarrollo madurativo; muchos cambios en la conducta son una consecuencia
del desarrollo madurativo. Aunque el aprendizaje se distinga de la maduración
y la evolución, no es independiente de estas fuentes de cambio conductual. La
aparición de un proceso concreto de aprendizaje, o como éste opere, depende
del nivel de maduración del sujeto y de su historia evolutiva (DOMJAN y
BURKHARD). Un niño de 1 año no consigue abrir una puerta, pero si lo consigue
a los 2 (ha crecido y ahora llega)
 Otro rasgo importante es que el aprendizaje procede de la experiencia. Así,
podemos distinguirlo del instinto: en las conductas instintivas no se requiere
adiestramiento alguno para realizarlas; en cambio, las conductas que no se
pueden efectuar sin adiestramiento reflejan aprendizaje.

Existen también otros mecanismos que producen cambios en la conducta que son
muy poco duraderos para ser considerados casos de aprendizaje. Entre estos procesos
están
 la fatiga
 los cambios temporales en la conducta como consecuencia de los
cambios en las condiciones estimulares y de las alteraciones en el estado
motivacional o fisiológico del organismo.

Otra definición de aprendizaje que añade algún elemento nuevo a la anterior es


la que ofrecen TARPY y MAYER (1978): “El aprendizaje es un cambio inferido en el
estado mental de un organismo, el cual es una consecuencia de la experiencia e influye
de forma relativamente permanente en el potencial del organismo para la conducta
adaptativa posterior”.

Esta definición añade elementos nuevos comparados con la anterior:

 El aprendizaje implica un cambio inferido en el estado mental de un


organismo, el conocimiento ha de codificarse o representarse de algún
modo en la estructura neurológica del organismo
 El aprendizaje supone un cambio en el potencial de la conducta, se
distingue entre el estado de conocimiento y la conducta manifiesta.

Un sujeto puede adquirir unos conocimientos y, sin embargo, no comportarse de


forma tal que demuestre la adquisición de esos conocimientos, no obstante, ese sujeto
posee potencial de comportamiento aun cuando realmente ni esté ejecutando esa
conducta.

 PATRONES INNATOS DE CONDUCTA

El hombre y los animales reciben constitutivamente un equipamiento básico en

2
forma de disposiciones innatas que son consecuencia de adaptaciones filogenéticas. Las
disposiciones innatas tienen un sustrato orgánico-fisiológico.

Determinar si una conducta es innata o aprendida puede ser difícil. Para


identificarlas TARPY (1997) señala algunas pautas recogidas de la obra de MAYR (1994):

 Las conductas son innatas cuando los individuos que las realizan han sido
aislados desde su nacimiento y no han tenido ocasión de aprenderlas.
 Las conductas innatas son muy estereotipadas, se realizan de modo
ritual e invariable.
 Las conductas innatas están sujetas a modificación a lo largo de
generaciones sucesivas por medio de la selección, y estas conductas las
realizan los individuos aun cuando se les coloca en un contexto diferente.

No hay una unidad de criterio en cuanto a la identificación, clasificación,


descripción y explicación de las conductas innatas. Dentro de los comportamientos
innatos se incluyen:

 Los reflejos: son las formas más elementales de la coordinación motora. Son
respuestas innatas, involuntarias, automáticas y universales que existen en todos
los organismos que tienen sistema nervioso. Los reflejos se han desarrollado para
proporcionar un ajuste comportamental rápido. Los reflejos innatos tienen
diferentes grados de complejidad:

o los más simples se sitúan al nivel de la médula espinal


o otros implican otras estructuras como el tronco cerebral

Los reflejos innatos son una parte importante del repertorio conductual de
un recién nacido, mientras otros reflejos requieren cierto grado de desarrollo o
maduración por parte del organismo. Ejemplos de reflejos: el reflejo de extensión, de
flexión, salivar, plantar, rotuliano....

 Los instintos: son los patrones innatos más complejos; una conducta instintiva suele
estar provocada por una concatenación de acontecimientos o estímulos que
provocan comportamientos complejos, propios de una especie particular. La
conducta instintiva está programada filogenéticamente a nivel neuronal. Los
programas neuronales se denominan mecanismos de desencadenamiento innato y
los estímulos que los ponen en marcha son los estímulos índices. Al parecer estos
estímulos índices activan los programas neuronales y se desencadena una secuencia
de conductas relativamente fijas que son instintivas. Estas conductas suponen unas
pautas fijas de acción. Hay dos fases en la conducta instintiva:

3
 La fase apetitiva: es considerada como el componente motivacional del
instinto, es una fase inicial de búsqueda de un medio o situación apropiado
para iniciar la siguiente fase.
 La fase terminal de consumación o descarga: En un sentido restringido el
instinto sería la parte final de este ciclo. Ejemplos de conducta instintivas son
las de cortejo en muchas especies animales. La conducta instintiva está en
muchos casos mediada por el aprendizaje, sobre todo, en la fase apetitiva.

 HABITUACIÓN Y SENSIBILIZACIÓN
Los procesos de habituación y sensibilización son fundamentales para el ajuste del
organismo al ambiente, y se dan en todas las especies y en todos los sistemas de
respuesta.

Los mecanismos de habituación y sensibilización ayudan a reducir la reactividad a


los estímulos irrelevantes y a canalizar la conducta a través de acciones organizadas y
dirigidas en respuesta a sólo algunos de los estímulos que se presentan.

2.3.1. HABITUACIÓN

Con la habituación disminuye la disposición para responder ante un estímulo


específico como consecuencia de la experiencia repetida con dicho estímulo. El sujeto
deja de responder a un estímulo, aunque sigue siendo capaz de percibir el estímulo y de
realizar los movimientos musculares que requiere la respuesta, por lo que la
habituación es diferente de la adaptación sensorial y es diferente de la fatiga.

Cuando se presenta por primera vez un estímulo, o si existe un cambio en los


parámetros de un estímulo presente, se produce una respuesta (reflejo) de orientación.
Esta reacción de gran valor biológico se reduce y elimina cuando se aplica de manera
repetida ese mismo estímulo, y se sustituye esa respuesta de orientación por la
habituación.

Los procesos de habituación son específicos para un estímulo repetitivo. La


especificidad se ha considerado una de las características definitorias de la habituación.
La habituación se puede considerar como una forma de adaptación; desde el punto de
vista de la supervivencia es más importante responder a estímulos novedosos que a
estímulos constantes.

Algunos autores sostienen que se trata de una forma elemental de aprendizaje,


mientras que otros lo diferencian del aprendizaje sobre la base del tipo de modificación
de la respuesta.

4
Predomina la habituación cuando el estímulo que se repite es relativamente
débil, los estímulos débiles producen mayor habituación que los fuertes.

2.3.2. SENSIBILIZACIÓN

La sensibilización se refiere a un incremento en la reacción ante los


acontecimientos ambientales (KLEIN, 1987), es un fenómeno de modificación de
respuesta sin que ocurra condicionamiento.

Los procesos de sensibilización tienen efectos temporales. Aunque en algunos


casos la sensibilización persiste durante varias semanas, en la mayoría de las
situaciones el aumento de la disposición a responder es de corta duración.

En todos los sistemas de respuesta la duración de los efectos de la sensibilización


está determinada por la intensidad del estímulo que la produjo. Cuanto más intenso es
el estímulo más aumenta la disponibilidad de responder y es mayor la duración de los
efectos de la sensibilización.

En contraste con la habituación, la sensibilización es menos específica para un


estímulo.

2. CONDICIONAMIENTO CLÁSICO

El mecanismo más simple por el que los organismos aprenden a dar respuestas
nuevas a los estímulos y aprenden las relaciones entre los estímulos es el
condicionamiento clásico. Es un proceso de aprendizaje mediante el cual un estímulo
que previamente no suscitaba una respuesta acaba provocándola a consecuencia de su
asociación temporal con otro estímulo que sí provocaba la respuesta. Mediante este
aprendizaje aprenden a dar respuestas nuevas a los estímulos y aprenden las relaciones
entre los estímulos.

3.1. EL TRABAJO INICIAL DE PAVLOV SOBRE CONDICIONAMIENTO CLÁSICO

Pavlov (1849-1936) era un fisiólogo ruso que comenzó sus investigaciones a finales
del s.XIX. El condicionamiento clásico se asocia con su nombre y su trabajo.

Pavlov descubrió este tipo de aprendizaje de forma casual y en relación con el


reflejo salivar. Observó durante la realización de su investigación que los perros
empezaban a salivar antes de tener la carne en la boca, cuando veían la comida y cuando
ésta se ponía en el plato, ante la simple presencia del experimentador e incluso al oír
sus pasos. Concluyó que los perros habían aprendido una nueva conducta ya que él no
había observado esas respuestas durante las primeras exposiciones de la comida.

5
Comenzó una extensa investigación acerca de los mecanismos que controlan la
salivación anticipatoria. Para explicar esta observación consideró la salivación
anticipatoria como una manifestación de una nueva respuesta refleja provocada por el
estímulo de la comida. Esta respuesta era resultado del aprendizaje asociativo: el
alimento, que ya provocaba salivación, se asoció, por ejemplo, con el experimentador,
y éste entonces provocaba salivación.

Pavlov sugirió que tanto los animales como el hombre poseen reflejos
incondicionados o innatos. Un reflejo incondicionado consta de dos elementos:

 un Estímulo Incondicionado (EI, por ej. comida)


 que provoca involuntariamente el segundo componente o Respuesta
Incondicionada (RI, por ej, salivación)

Cuando un estímulo ambiental neutro aparece junto con el estímulo


incondicionado se forma un nuevo reflejo, o reflejo condicionado. Conforme progresa
el condicionamiento, emparejamiento del estímulo neutro con el estímulo
incondicionado, el estímulo neutro se convierte en el Estímulo Condicionado (EC, por ej.
un sonido o luz) y es capaz de provocar la respuesta aprendida o Respuesta
Condicionada (RC, por ej. salivar ante el sonido o la luz).

S egún Pavlov, cualquier estímulo neutro emparejado con un estímulo


incondicionado puede, mediante el condicionamiento, adquirir la capacidad de
provocar una respuesta.

3.2. EL PARADIGMA DEL CONDICIONAMIENTO CLÁSICO

El paradigma del condicionamiento clásico es el que Pavlov utilizó para estudiar la


salivación anticipatoria. Es un conjunto de operaciones experimentales que
comprenden un Estímulo Incondicionado (EI) que produce de forma automática una
Respuesta Incondicionada (RI) mensurable, que es una respuesta refleja innata al

6
estímulo incondicionado; y un Estímulo Condicionado (EC), con respecto al cual se ha
comprobado experimentalmente que al principio no produce una respuesta que se
asemeje a la RI. Se presentan el EC y el EI repetidamente en este orden y se desarrolla
una respuesta al EC semejante a la RI; esta respuesta se llama Respuesta Condicionada
(RC) y supone ya una respuesta aprendida. Mediante el condicionamiento clásico se
obtienen funciones EC-RC.

 Antes del conocimiento:


 EN (tono)ninguna respuesta
 EI (comida) RI (salivación)
 Durante el condicionamiento:
 EC (tono) seguido por EI (comida)  RI (salivación)
 Después del condicionamiento:
 EC (tono)  RC (salivación)

3.3. FASES ESENCIALES DEL CONDICIONAMIENTO CLÁSICO

3.3.1. ADQUISICIÓN

La primera fase es la adquisición. En la mayoría de los casos el condicionamiento


clásico es un proceso gradual en el que un estímulo adquiere la capacidad de provocar
una respuesta condicionada, pasando a ser un estímulo condicionado; esta capacidad
se adquiere a través de la asociación o emparejamiento repetido con un estímulo
incondicionado a este proceso se le denomina adquisición.

La asociación está ausente al comienzo de la adquisición porque el sujeto no ha


recibido ningún entrenamiento. La fuerza de la asociación que se desarrolla durante el
período de adquisición depende de las condiciones particulares utilizadas en el
entrenamiento.

7
3.3.2. EXTINCIÓN

Pavlov se planteó el problema de la extinción y demostró que si después del


condicionamiento se presenta el estímulo condicionado sin ir seguido del estímulo
incondicionado, la intensidad de la respuesta condicionada disminuye. A este
procedimiento lo denominó extinción, que es el proceso de eliminación de una
respuesta previamente condicionada. La fuerza de la RC disminuye al incrementar el nº
de presentaciones del EC solo, sin ir seguido del EI, hasta que finalmente el EC no
provoca la RC. En su experimento se presenta repetidas veces el tono (EC) sin ir seguido
del alimento en polvo en la boca del perro (EI). Así se logra que disminuya la salivación
provocada por el tono (RC) hasta alcanzar un bajo nivel semejante al existente antes de
comenzar el procedimiento de condicionamiento clásico.

El procedimiento para la extinción de los estímulos condicionados es muy similar


a los procedimientos para producir habituación, comentados anteriormente. Ambos
procedimientos implican la presentación repetida de un estímulo. No obstantes,
presentan una diferencia esencial: en la extinción el estímulo que interviene ha sido
condicionado de antemano; en cambio, en la habituación no se requiere una fase
previa de condicionamiento al estímulo.

En la extinción de una respuesta condicionada influyen tres factores:

 La fuerza de la respuesta condicionada: cuanto más fuerte es la RC al


final de la adquisición, más tiempo tardará en extinguirse
 el porcentaje de ensayos en los que el EI sigue al EC: además de
presentar de forma emparejada el EC con el EI durante la adquisición, si
se presenta en algunos ensayos de adquisición el EC sin el EI, se produce
generalmente una extinción más lenta de la RC, que emparejando
siempre el EC con el EI
 la duración de la exposición al EC durante la extinción: cuanto más
prolongada es la exposición al EC durante la extinción, mayor es la
reducción en la fuerza de la RC.

Tras la fase de extinción, y a pesar de que la RC ha disminuido, la asociación del


EC-EI permanece relativamente intacta, no se elimina a consecuencia del procedimiento
de extinción, sino que únicamente resulta suprimida e inhibida. Existen varios hallazgos
que demuestran este hecho:

 La recuperación espontánea: la fuerza de la RC se recobra espontáneamente, sin


un entrenamiento adicional, si el período de extinción va seguido de un intervalo de
descanso, aunque esta respuesta no alcance el alto nivel mostrado tras la fase de
adquisición. Según Pavlov, los animales descubren durante la adquisición que el EC

8
significa algo importante (comida), por lo que la atención es intensa; en la fase de
extinción perciben que el EC no predice ya algo importante por lo que se atenúa el
nexo EC-EI, y eventualmente dejan de prestar atención al inicio del EC; sin embargo,
después de un intervalo de descanso, su atención se renueva, probablemente
porque están intentando determinar si en esa nueva sesión el EC posee las
propiedades de predicción que tuvo anteriormente.

 La desinhibición: se produce cuando después de una serie de ensayos de extinción


se presenta un estímulo novedoso y se produce una recuperación espontánea de la
respuesta al EC extinguido. A esta recuperación de la respuesta condicionada
producida por la novedad de un estímulo se denomina desinhibición.

Aunque estos dos procesos anteriores son formas de recuperación de la respuesta


condicionada, la recuperación espontánea ocurre simplemente por el paso del tiempo,
y la desinhibición, por la presentación de un estímulo novedoso.

 Renovación de la respuesta condicionada: alude a una recuperación de la RC. Si se


produce la extinción del EC en un entorno distinto al utilizado en la fase de
adquisición, aunque la extinción hace que disminuya la fuerza de la RC, esta fuerza
se renueva si el animal es puesto nuevamente a prueba en el contexto inicial.

 Generalización: después de que un estímulo concreto fuera condicionado, los


animales daban la respuesta condicionada a otros estímulos similares. La
generalización de estímulos es el proceso por el cual los organismos emiten la RC
ante un estímulo nuevo, distinto del EC original, pero que es similar a éste.

3.4. CONDICIONAMIENTO CLÁSICO EXCITATORIO

La modalidad de condicionamiento clásico más conocida es el condicionamiento


clásico excitatorio. Durante este condicionamiento se aprende una respuesta al
estímulo condicionado que es congruente con el estímulo incondicionado. Al estímulo
condicionado en este condicionamiento excitatorio se le designa EC+. La excitación
condicionada ocurre cuando la presentación del EC va seguida de la presentación del EI.

Dentro del condicionamiento excitatorio se distinguen dos modalidades:

 El condicionamiento excitatorio apetitivo: se da cuando un EC va seguido de un EI


apetitivo como comida o agua; es el ejemplo clásico del procedimiento utilizado por
Pavlov descrito anteriormente.
 El condicionamiento excitatorio aversivo: se produce cuando un EC va seguido de
un EI aversivo. Uno de los primeros experimentos llevados a cabo para demostrar
este tipo de condicionamiento fue realizado por BECHTEREV (1913): hacía sonar un
tono neutro (EC) y segundos después aplicaba una leve descarga eléctrica a la pata

9
delantera del perro. La RI a la descarga eléctrica era forcejear y retirar la pata: tras
presentaciones reiteradas de estos dos estímulos el tono provocaba la reacción de
retirar la pata.

3.5. PROCEDIMIENTOS DEL CONDICIONAMIENTO CLÁSICO EXCITATORIO.


RELACIONES TEMPORALES

En los procedimientos de condicionamiento excitatorio se han empleado


paradigmas diferentes que pueden explicarse en función del nexo asociativo EC-EI y
suponen variaciones temporales entre ambos estímulos. Se reconoce que la
contigüidad temporal, la relación temporal entre el estímulo condicionado y el
incondicionado, es uno de los factores más importantes que determinan el desarrollo
del condicionamiento clásico.

Estos procedimientos no poseen la misma efectividad. Para poder compararlos y


ver la forma en que se produce el aprendizaje con los diferentes procedimientos hay
unas medidas aplicables a todos ellos:

 Una técnica es medir la rapidez con que se produce la RC después de la


presentación del EC: Esta medida se llama latencia de la respuesta
condicionada: es el tiempo transcurrido entre el inicio del EC y el inicio de la RC.
Pero esta medida sólo nos puede informar del desarrollo del condicionamiento
si la respuesta condicionada tiene lugar antes de la presentación del EI.

 Ensayos de prueba: consisten en presentar periódicamente el EC solo, sin el EI,


y así se puede medir el alcance del aprendizaje.

 En los ensayos de prueba también se mide la intensidad de la respuesta


condicionada (por ej. la cantidad de gotas de saliva).

 Por último, también se puede calcular el porcentaje de ensayos de prueba


(presentando el EC solo) en los que se observa una respuesta condicionada, con
lo que se obtiene un índice de la probabilidad de la respuesta condicionada.

De todos los procedimientos o paradigmas de condicionamiento clásico excitatorio,


el paradigma de condicionamiento de demora es normalmente el más eficaz, y el
condicionamiento hacia atrás el de menor efectividad; los otros procedimientos tienen
un nivel intermedio de eficacia.

10
Procedimientos del condicionamiento clásico excitatorio.

En función de la relación temporal entre el EC y el EI las disposiciones más comunes


en la investigación del condicionamiento clásico son las siguientes:

 Condicionamiento de demora o condicionamiento demorado. El EC se presenta


antes que el EI, y la terminación del EC coincide con la aparición del EI o durante
la presentación del mismo. Podemos establecer dos tipos de condicionamiento
de demora:
 El condicionamiento de demora corta: el EI puede presentarse poco
después del EC; es la técnica que se usa más frecuentemente. La
presentación del EC precede a la aparición del EI por un período de
tiempo corto, menos de un minuto, y el EI se presenta durante el EC o
inmediatamente después. En muchas ocasiones el condicionamiento de
demora corta es el más eficaz para producir condicionamiento
excitatorio.

11
 El condicionamiento de demora larga: en él puede ocurrir que el animal,
tras una extensa experiencia con ese procedimiento, dé muestras de
aprender que el EI no se presenta hasta un tiempo después del comienzo
del EC, y entonces comience a retrasar su respuesta condicionada hasta
la presentación del EI. La RC va ocurriendo cada vez más cerca del
momento en que está programado el EI. Pavlov denominó a esta
retención de la respuesta condicionada al comienzo del EC, en el
condicionamiento de demora larga, como inhibición de la demora.

 Condicionamiento de huella. En este paradigma el EC comienza y


termina antes de la aparición del EI. Es similar al condicionamiento de
demora, pero se diferencia en que el EC acaba antes de producirse el
inicio del EI. Existe un intervalo temporal antes de la presentación del EI
durante el cual no se administra el EC. El intervalo entre el final del EC y
el principio del EI se llama intervalo de huella. El que exista un intervalo
de huella entre el EC y el EI tiene un efecto significativo sobre el
aprendizaje. Con frecuencia el procedimiento de huella es menos eficaz
que el de demora para que se produzca un condicionamiento
excitatorio. Algunos investigadores han encontrado que los dos
procedimientos, demora y huella, producen niveles idénticos de
condicionamiento.

 Condicionamiento simultáneo. En este procedimiento de


condicionamiento el EC y el EI se presentan a la vez. Con este tipo de
condicionamiento existen opiniones contradictorias: algunos opinan que
rara vez es eficaz para establecer la respuesta condicionada. Otros
investigadores informan del éxito obtenido en el condicionamiento del
miedo, realizado a través de este tipo de condicionamiento. TARPY
(1997) considera que este procedimiento produce fuerza excitatoria,
pero que los niveles no llegan a competir con los producidos por el
condicionamiento de demora y de huella. El hecho de que se obtenga un
condicionamiento con este procedimiento plantea problemas en la
interpretación del EC como estímulo informativo, ya que por ser
simultáneo excluye la posibilidad de que el EC sea informativo de un
evento futuro.

 Condicionamiento hacia atrás (retroactivo o retrógrado). El EI comienza


y termina antes de que se presente el EC. El EI precede al EC. Los
resultados de los estudios sobre este procedimiento son confusos.

Los experimentos actuales de condicionamiento clásico rara vez incluyen todos


los procedimientos expuestos anteriormente. La práctica común es elegir sólo un
procedimiento que funcione con toda seguridad.

12
En las ocasiones en que la exposición únicamente al EI solo, sin emparejamiento
del EC-EI, produce por sí misma respuestas al EC (que aún es un estímulo neutro) que se
asemejan a la RC, estamos ante un caso de pseudocondicionamiento.

Además de este factor temporal entre el EC y el EI, existen otros factores que
determinan si se adquiere o no la RC, tras los emparejamientos EC-EI.

 Entre estos factores está la intensidad del EC, del EI o de ambos, que determinan
la magnitud de la respuesta condicionada; cuanto más intenso sea el estímulo
que se utilice más rápidamente se producirá la asociación entre el EC y el EI y el
grado de condicionamiento será mayor.
 Otro factor que influye es la naturaleza del EC. La investigación actual indica que
algunos EC se asocian más fácilmente con unos EI que otros; aparentemente
unos EC son más relevantes o pertinentes para ciertos EI.
 También el EC debe proporcionar una información más fiable sobre la aparición
del EI que otros estímulos que estén presentes en el ambiente; además, si se
presentan dos o más estímulos con el EI, únicamente se asociará con el EI aquel
que prediga más fiablemennte su aparición.

3.6. CONDICIONAMIENTO CLÁSICO INHIBITORIO

La otra modalidad de condicionamiento clásico es el condicionamiento clásico


inhibitorio. Mediante este condicionamiento se aprende a inhibir o retener una
respuesta condicionada, se aprende que un estímulo señala la ausencia de un EI. Los
estímulos se pueden condicionar para señalar la ausencia de un estímulo incondicionado
venidero, del mismo modo que se condicionan para señalar la aparición de un estímulo
incondicionado. Aprender que un estímulo señala la ausencia de un EI es un
condicionamiento clásico inhibitorio. El estímulo condicionado inhibitorio, mediante el
condicionamiento, adquiere propiedades antagónicas respecto a un estímulo
condicionado excitatorio.

Anteriormente ya se han visto otros procesos inhibitorios, como el que se produce


en la extinción y en la inhibición de la demora. Añadidos a éstos hay otros dos
fenómenos:

 La inhibición externa: se produce cuando en el curso del condicionamiento se


presenta un nuevo estímulo y hace que se reduzca la fuerza de la respuesta
condicionada, supone una activación temporal del estado inhibitorio.
 La inhibición latente: ocurre cuando la exposición al EC antes del
condicionamiento hace que dicho estímulo adquiera propiedades inhibitorias
que interfieren con el condicionamiento excitatorio al emparejar
posteriormente el EC con el EI.

13
La nota común de estos procesos es que no son permanentes, son transitorios
temporalmente. En cambio, la inhibición de la respuesta condicionada puede llegar a
ser un proceso permanente, al que Pavlov denominó inhibición condicionada y es el que
se recoge en este apartado. Se supone que la inhibición condicionada refleja la
capacidad del EC- para activar el estado inhibitorio, el cual puede suprimir la RC.

Desde el punto de vista del procedimiento un EC se convierte en inhibitorio cuando


en el curso de un condicionamiento excitatorio normal se empareja con la ausencia de
un EI; como consecuencia, el estímulo provoca una reacción contraria a la de un EC
excitatorio.

3.7. PROCEDIMIENTOS DEL CONDICIONAMIENTO CLÁSICO INHIBITORIO.


RELACIONES TEMPORALES

Existen varios procedimientos para crear una inhibición condicionada. Dentro de


estos procedimientos hay un prerrequisito importante al condicionar un estímulo para
que señale la ausencia de algún EI, y es que este EI se presente periódicamente en la
situación experimental.

14
 Procedimiento estándar para la inhibición condicionada. La técnica elaborada
por Pavlov incluye dos estímulos condicionados y dos modalidades de ensayo
de condicionamiento, repetidas en un orden aleatorio. En algunos ensayos se
presenta el EC+ (por ej. un tono) seguido de EI, y en otros ensayos se presenta el
EC+ junto con el EC- (por ej. una luz), de forma simultánea, sin ir seguidos del EI.
Los ensayos en los que se presentan simultáneamente el EC+/EC- sin ir seguidos
del EI se denominan ensayos de condicionamiento inhibitorio. El EC- adquiere
propiedades inhibitorias porque es el único acontecimiento que en el contexto
de un ensayo excitatorio indica la ausencia del EI.

 Procedimiento de inhibición diferencial. Incluye dos clases de ensayos. En unos


ensayos se presenta el EC+ seguido del EI, y en otros ensayos se presenta el EC-
seguido de la ausencia del EI. Es parecido al procedimiento estándar pero aquí
no se presentan simultáneamente el EC+ y el EC-. El EC+ no está presente en los
ensayos de condicionamiento inhibitorio en este procedimiento. Como en el
procedimiento anterior, el EC- se convierte es estímulo inhibitorio condicionado.

 Procedimiento de contingencia negativa del EC-EI o del desemparejamiento


explícito. Se diferencia de los métodos anteriores en que los sujetos no están
expuestos a un EC+ emparejado con un EI. Como en este procedimiento no hay
un EC+ explícito que prediga las apariciones del EI, el estímulo condicionado
inhibitorio se le puede denominar EC porque es el único estímulo condicionado
que va a presentarse. El procedimiento consiste en presentar los EC y los EI de
modo que no aparezcan simultáneamente; el EC no se presenta ni justo antes ni
después del EI sino que explícitamente aparece en el intervalo entre las
presentaciones del EI.

En lo que respecta a la medida de la inhibición condicionada, ya se ha visto como los


estímulos condicionados excitatorios provocan respuestas nuevas tales como
salivación, parpadeo..., dependiendo del estímulo incondicionado; por tanto, cabe
esperar las reacciones opuestas (supresión de salivación, de parpadeo...) provocadas
por los estímulos inhibitorios. Para medir estas reacciones existen unas pruebas
específicas:

 La prueba de la conducta dirigida: es una medida directa y se aplica en los


sistemas de respuestas bidireccionales, es decir, sistemas que pueden cambiar
en direcciones opuestas a partir de una medida de línea base. En estos casos la
excitación condicionada produce un cambio en una dirección y la inhibición
condicionada en la dirección opuesta.
 La prueba de sumación o del estímulo compuesto: consiste en observar los
efectos de un EC- inhibitorio en combinación con un EC+ excitatorio. Este efecto
se cuantifica midiendo la fuerza del estímulo condicionado excitatorio (EC+) sin
emparejar, evaluándolo de nuevo en combinación con el estímulo condicionado

15
inhibitorio (EC-), y calculando después la diferencia. Si el EC- carece de fuerza
inhibitoria se observa toda la fuerza de la reacción excitatoria en ambos casos.
 La prueba del retraso en la adquisición: si un estímulo inhibe activamente una
respuesta concreta, será muy difícil condicionar ese estímulo para que
provoque esa misma respuesta, es decir, el ritmo de adquisición de esa respuesta
condicionada se retrasará mucho si el estímulo inicialmente provoca una
inhibición de la respuesta. En esta prueba hay dos fases:
 Se utiliza un EC como estímulo condicionado inhibitorio (EC-) en un
experimento de condicionamiento inhibitorio
 Ese mismo EC se utiliza en un experimento de condicionamiento
excitatorio (EC+). Si en la primera fase ese EC se había convertido de
hecho en inhibitorio, en la segunda fase será mucho más difícil
convertirlo en excitador.

4. CONDICIONAMIENTO INSTRUMENTAL (OPERANTE)

El condicionamiento instrumental concierne al aprendizaje de la respuesta


(TARPYY, 1997). Hay multitud de ocasiones en las que un organismo no posee ningún
control sobre los acontecimientos o estímulos con los que se enfrenta; en cambio,
también hay muchas circunstancias en las que los hechos son resultados directos de la
conducta, como por ej: Marcar un nº de teléfono para hablar con una persona. El
condicionamiento instrumental es un tipo de aprendizaje que se refiere a la conducta
voluntaria. Una conducta se desarrolla por las consecuencias que produce. La respuesta
que tiene lugar principalmente porque sirve de instrumento para producir ciertas
consecuencias se llama conducta instrumental.

Debido a que la conducta instrumental está gobernada principalmente por los


hechos que produce, se la pueda considerar como conducta dirigida a una meta. Las
respuestas instrumentales se realizan porque la meta no se alcanzaría sin ella. La
conducta instrumental es voluntaria o es emitida más que elicitada. La iniciativa la tiene
el organismo.

El condicionamiento clásico y el instrumental se pueden distinguir desde un


punto de vista conceptual.

 El condicionamiento clásico implica el aprendizaje de relaciones o asociaciones


entre estímulos (el EC y el EI). Los procedimientos se centran en la relación temporal
entre los distintos estímulos, independientemente de lo que haga el animal.
 El condicionamiento instrumental implica el aprendizaje o redistribución de las
respuestas del animal, y los procedimientos se centran en la relación entre las
apariciones o ejecuciones de una respuesta específica (instrumental) y la
administración del reforzador o refuerzo.

16
4.1. LAS PRIMERAS INVESTIGACIONES SOBRE CONDICIONAMIENTO
INSTRUMENTAL

El inicio de la investigación sobre condicionamiento instrumental tuvo su comienzo


con el trabajo de THORNDIKE. Su intento original fue estudiar la inteligencia animal y
para ello ideó una serie de caja-problema. Sus estudios (1898) establecían que la
conducta animal podía cambiar como consecuencia de la experiencia. En su primer
trabajo colocaba a un gato hambriento en una caja-problema y le ponía comida fuera
de la caja. La tarea del animal era aprender a escapar de la caja para obtener la comida.
Las diferentes cajas-problema requerían del gato diferentes respuestas para poder
escapar y acceder a la comida.

Thorndike interpretó que los resultados reflejaban en aprendizaje de una


asociación, y propuso que el gato formaba una asociación entre los estímulos del
interior de la caja-problema y la respuesta correcta de escape. El aprendizaje refleja el
establecimiento de una asociación E-R (estímulo-repuesta). La asociación E-R se
establecía debido a que el gato era recompensado, debido a las consecuencias de las
respuestas con éxito, es decir, de escapar de la caja. A este fortalecimiento de la
asociación E-R debido a un acontecimiento satisfactorio o recompensa lo denominó
ley del efecto. Esta ley establece que, si una respuesta que se ejecuta en presencia de
un estímulo va seguida de un hecho satisfactorio, la asociación entre el estímulo y la
respuesta se fortalece; si la respuesta va seguida de un hecho molesto, la asociación se
debilita. Esta ley se considera como precursora del principio del reforzamiento.

4.2. ENFOQUES DE ESTUDIO DEL CONDICIONAMIENTO INSTRUMENTAL

La mayor parte de los estudios sobre aprendizaje instrumental se centran en las


reacciones motoras voluntarias, aunque se emplean también otra clase de respuestas,
como la actividad fisiológica. No todas las técnicas de estudio son iguales; algunos
estudios emplean procedimientos similares a los de Thorndike y otros emplean el
método experimental de operante libre o conducta operante. Estos tipos de
experimentos llevan a algunos autores a la distinción entre dos tipos de
condicionamiento surgidos de esta forma de aprendizaje:

17
 Condicionamiento instrumental: el ambiente limita las posibilidades de
recompensa, la persona o animal estudiados tienen una oportunidad limitada
de comportarse
 Condicionamiento operante: implica situaciones en las que no hay ninguna
limitación en la cantidad de reforzamiento que puede obtenerse. En una
situación de condicionamiento operante, un animal o una persona controla la
frecuencia de la respuesta y, por tanto, puede determinar la cantidad de
reforzamiento obtenido.

Según KLEIN (1987) el concepto de recompensa se utiliza generalmente en


situaciones de condicionamiento instrumental, mientras que el término reforzador se
emplea en el condicionamiento operante. La mayoría de los autores consideran
únicamente como término general el de condicionamiento instrumental, que englobaría
dos tipos de métodos de estudio:

 Los métodos de ensayos discretos, donde se produce una respuesta


discreta
 los métodos de operante libre.

4.2.1. MÉTODOS DE ENSAYOS DISCRETOS

La investigación de este tipo se lleva a cabo generalmente con algún tipo de


laberinto:

 el primero es un corredor o callejón recto con una caja de salida en un extremo


y una caja de meta en el otro extremo. Al principio de cada ensayo se coloca al
animal en la caja de salida; posteriormente se levanta la barrera movible que da
paso a la sección principal del corredor, y el animal puede correr por el corredor
hasta que alcanza la caja meta, que contiene una recompensa, agua o comida. El
tiempo que tarda en realizar el recorrido se va reduciendo progresivamente
siguiendo una función típica de aprendizaje; cada vez tarda menos en salir y
realizar el recorrido rápidamente y sin titubeos.
 el segundo es un laberinto en T sencillo que consta de una caja de salida y
callejones que forma una T. El animal tiene que aprender a girar a la derecha o
a la izquierda para conseguir la recompensa.

18
Figura 4.6 corredor y laberinto en T

En ambos casos el progreso de la conducta se valora midiendo;

 La velocidad con la que el animal recorre el corredor


 El tiempo que tarda en recorrerlo
 La latencia de la respuesta de carrera, que es el tiempo que tarda el
animal en abandonar la caja de salida y comenzar a moverse por el
callejón o corredor.

Esta técnica de respuesta discreta o aprendizaje ensayo a ensayo implica una


respuesta única, o una secuencia de respuestas ejecutada sólo en cierto momento. Las
posibilidades de respuesta en estas situaciones están restringidas.

4.2.2. MÉTODOS DE OPERANTE LIBRE

Estos métodos fueron ideados por SKINNER (1938) para estudiar la conducta de
una forma más continua que lo que permiten los laberintos: la rata es situada en la caja
de partida, se desplaza por el laberinto, es recogida y vuelta a colocar en la caja de
partida. Para poder estudiar el comportamiento, ideó “la caja de Skinner”, donde no se
manipula al animal a lo largo de una sesión de aprendizaje. Esta sesión se desarrolla de
forma ininterrumpida a lo largo del tiempo y además puede ser registrada de forma
automática. Hay dos clases de cajas de Skinner:

 una para ratas


 otra para palomas

Ambas cajas suelen ser lo bastante grandes para que el animal pueda moverse
cómodamente, tienen tres paredes de plástico transparente y en la cuarta pared hay
un dispensador para presentar alimento o agua en un comedero, un altavoz, una luz o
luces para estímulos discriminativos (un estímulo discriminativo es aquel estímulo o
situación estimular que señala que si se emite una conducta es probable que se obtenga
refuerzo) y una palanca que el sujeto debe presionar para conseguir alimento o agua.

19
En los métodos de ensayos discretos un animal tiene limitadas sus oportunidades de
responder: la rata no tiene control alguno sobre la frecuencia de la recompensa. En
cambio, en los métodos de operante libre el sujeto repite libremente la respuesta una
y otra vez, el experimentador determina qué comportamiento es correcto, pero el sujeto
determina cuándo se realiza la conducta. Skinner propuso el término de operante como
forma de dividir la conducta en unidades significativas y medibles. La palabra operante
se refiere a una conducta que opera sobre el medio, es una conducta que produce
cambios en el medio o en el ambiente. Las respuestas operantes, como presionar una
palanca, se definen en términos del efecto que tienen sobre el ambiente, y las conductas
que ejercen el mismo efecto sobre el medio son ejemplos del mismo operante (Leer ej.
pag 132).

Skinner pensaba que la conducta operante no está producida por ningún estímulo
concreto; un animal o una persona emite voluntariamente una conducta específica para
recibir el reforzamiento. No obstante, según Skinner los estímulos ambientales señalan
la ocasión para la respuesta. Estos estímulos informan de cuándo está disponible el
reforzamiento y actúan motivando la conducta operante.

Los índices para valorar este aprendizaje son la frecuencia y la consistencia de la


respuesta. Skinner propuso que se utilizara como medida de probabilidad de la
respuesta la tasa de aparición de la conducta operante, es decir, la frecuencia de la
respuesta en un intervalo concreto.

4.3. PRINCIPALES ELEMENTOS DEL CONDICIONAMIENTO INSTRUMENTAL

El hecho fundamental de la conducta instrumental es que está controlada por


sus consecuencias. En este condicionamiento intervienen tres elementos:

 La respuesta: es voluntaria y motora.


 El resultado (refuerzo).
 La relación o contingencia entre la respuesta y el reforzador.

20
En los estudios de ensayos discretos, los sujetos no tienen que aprender la
respuesta requerida en la tarea, ya saben andar y correr, el sujeto aprende hacia dónde
correr y para qué hacerlo. En cambio, en los experimentos con la caja de Skinner, que
son del tipo de operante libre, la rata aprende a presionar una palanca para obtener
comida, es una conducta que no está habitualmente en su repertorio y tiene varios
componentes, tales como acercarse a la palanca, levantar las patas delanteras por
encima de ésta y presionarla. Estas conductas han de ocurrir en una secuencia correcta
y, por tanto, aprende a reorganizar los componentes de una conducta.

4.3.1. EL REFUERZO

Formalmente un refuerzo es cualquier estímulo que aumenta la probabilidad de


emisión de una conducta en el futuro. Skinner identificó varias categorías de
reforzadores:

- El reforzador primario es aquel estímulo que tiene un valor innato o incondicionado,


y su valor de refuerzo está establecido biológicamente. Por ej.: la comida y la bebida.
Pueden no reforzar permanentemente una conducta, sino que pueden depender de
condiciones de privación /saciación.
- El reforzador secundario es secundario cuando adquiere las propiedades reforzantes
a través de su asociación con los reforzadores primarios. Son aquellos estímulos que en
principio fueron neutros, pero que por su asociación mediante un proceso de
condicionamiento clásico con sucesos reforzantes han adquirido su valor de refuerzo.
ej.: para un niño el elogio verbal puede ser un suceso neutral sin ningún valor de
incentivo, por lo que, si se quiere que el elogio funciones como reforzador habrá de
asociarse, por ej.: a la entrega de alimentos.
-Los reforzadores generalizados son reforzadores secundarios pero que se han asociado
a una variada gama de reforzadores primarios y/o secundarios, recibiendo de éstos sus
cualidades reforzantes, poseen una gran potencia y rara vez producen saciación: el
dinero es un ejemplo de este tipo de reforzamiento. La mayor parte de las conductas
humanas están regidas por reforzadores generalizados.

PREMACK (1959,1965) sugiere que todos los reforzadores comparten un


atributo en común. Según él, un reforzador es cualquier actividad cuya probabilidad de
ocurrencia es mayor que la de la conducta reforzada; una conducta es reforzada por la
oportunidad de realizar otra conducta que es más deseada por el sujeto. Para él, un
reforzador puede considerarse como una actividad más que como una cosa o estímulo
que se obtiene; el reforzador no es el agua sino beber. En su principio de reforzamiento
la conducta más probable reforzará la conducta menos probable. De la aplicación de su
teoría se deriva el uso de reforzadores de actividad para instaurar conductas deseadas.

21
Hay varios aspectos de un reforzador que determinan sus efectos sobre el
aprendizaje y la ejecución de una conducta

 La cantidad y calidad del reforzador aumentan la tasa de conducta


 La experiencia pasada.

3.3.2 LA RELACIÓN RESPUESTA-REFORZADOR

La relación entre la conducta y sus consecuencias es uno de los factores más


importantes en el control de la conducta. En esas situaciones están implicadas dos
relaciones: la relación temporal entre la respuesta y el refuerzo es la relación de
contigüidad temporal, y la otra, la correlación entre la respuesta y el reforzador o
contingencia respuesta-reforzador.

 La contigüidad del reforzador, la inmediatez en la presentación del


refuerzo tras la respuesta es una variable muy importante del
condicionamiento instrumental. La contigüidad tiene un efecto
importante sobre la conducta instrumental ya que cuando más próximos
en el tiempo estén la respuesta y el refuerzo, mayor será el
condicionamiento de esa respuesta. Dentro de la contigüidad hay que
considerar el efecto de la demora. Los estímulos asociados con el
reforzador y que señalan la próxima aparición de éste se llaman
reforzadores secundarios o condicionados y existe toda una variedad de
claves que puede condicionarse como reforzadores. Los reforzadores
condicionados permiten al sujeto pasar por alto la demora entre la
repuesta y la entrega del refuerzo primario.
 La contingencia respuesta-reforzador. Es el factor más importante del
condicionamiento instrumental. El aprendizaje se produce si y sólo sí la
presentación del refuerzo depende de la ejecución previa de una
conducta.

 Existe una contingencia positiva perfecta si se entrega el refuerzo después de cada


aparición de la respuesta y nunca se entrega si no aparece la respuesta;
 La contingencia es negativa si el refuerzo tiene más probabilidad de entregarse
cuando no se ejecuta la respuesta que cuando se ejecuta;
 Y existe una contingencia cero si el refuerzo tiene la misma probabilidad de aparecer
con y sin respuesta instrumental.

4.4. PROCEDIMIENTOS DE CONDICIONAMIENTO INSTRUMENTAL

Existen cuatro procedimientos fundamentales de condicionamiento instrumental


que pueden clasificarse atendiendo a la naturaleza del acontecimiento ambiental
controlado por la conducta. Hay dos factores a considerar:

22
1. Es el tipo de acontecimiento, que puede ser agradable o desagradable;
 cuando es agradable se denomina estímulo apetitivo o positivo,
 cuando es desagradable se denomina estímulo aversivo o negativo.
2. Es la relación entre la respuesta y el acontecimiento ambiental que controla:
 la respuesta puede producir el acontecimiento y se dice que tiene lugar una
contingencia positiva,
 o puede eliminar el acontecimiento y tendría lugar una contingencia negativa.

Nombre del procedimiento Efecto o resultado de la respuesta


Reforzamiento positivo Produce un estímulo apetitivo
Reforzamiento negativo Evita o interrumpe la presentación de un estímulo aversivo
Castigo positivo Produce un estímulo aversivo
Castigo negativo Evita o interrumpe la presentación de un estímulo apetitivo

Por refuerzo se entiende cualquier acontecimiento cuya aparición intensifica la


conducta que lo produce. El castigo es cualquier acontecimiento consecutivo a una
respuesta que reduce la probabilidad de que la respuesta se repita.

 Reforzamiento positivo. Se produce en las situaciones en las que existe una


contingencia positiva entre la respuesta y un estímulo reforzador apetitivo. Si
aplicamos un refuerzo positivo contingentemente a la emisión de una determinada
conducta, decimos que tal conducta ha sido reforzada, que se ha producido un
reforzamiento positivo. Skinner indica que un estímulo reforzador positivo es un
evento, conducta u objeto que aumenta la frecuencia de cualquier conducta a la que
sigue. Ejemplos: entregar un cheque después de realizar un trabajo, aplaudir a una
persona que da una charla....
 Reforzamiento negativo. Se produce si tras la realización de una determinada
conducta, se produce la eliminación de un estímulo aversivo; entonces habremos
reforzado negativamente dicha conducta, es decir, tal conducta incrementará su
probabilidad de repetirse en un futuro. Al igual que en el reforzamiento positivo, la
consecuencia de esta relación también es el aumento de la probabilidad futura de
la respuesta; sin embargo, la relación es negativa puesto que la ejecución de la
respuesta produce la desaparición del reforzador. Ej: tomar una aspirina cuando nos
duele la cabeza; si desaparece el dolor, que es el estímulo aversivo, aumentamos la
probabilidad de emitir la conducta de tomar aspirina la próxima vez que nos duela la
cabeza. Hay dos tipos de procedimientos de reforzamiento negativo:
1. Uno de ellos es cuando el estímulo aversivo se presenta continuamente y la
emisión de la respuesta lo puede interrumpir, y que se denomina escape. Ej.:
marcharse del cine cuando a película no nos gusta.
2. En el otro tipo de procedimiento está implicado un estímulo aversivo que se
presenta de vez en cuando en el futuro, y la emisión de la respuesta lo puede
evitar; se llama evitación. Ej.: Llevar a revisión el coche para evitar una avería.

23
 Castigo positivo. Se produce en las situaciones en las que existe una contingencia
positiva entre la respuesta y un estímulo desagradable o aversivo. Se refiere a la
utilización de un evento físico o psicológicamente doloroso como castigo. Si no se
ejecuta la respuesta no se presenta el estímulo aversivo. Esta relación positiva, en
lugar de aumentar la probabilidad futura de la respuesta, la debilita, y es menos
probable que se produzca en el futuro. En este caso las consecuencias no se
denominan estímulos reforzadores sino punitivos. El castigo no es un reforzador. ej.
reñir a un niño por no hacer los deberes.
 Castigo negativo. El resultado final es la disminución de la probabilidad de la
respuesta. El castigo negativo se produce cuando se aprende a dejar de emitir una
respuesta porque tiene como consecuencia la retirada o el cese de algún evento
positivo o significativo para el sujeto. El reforzamiento se pierde o no está
disponible como consecuencia de la realización de una conducta inapropiada. Ej. las
sanciones mediante multas emplean este tipo de castigo negativo. Hay dos
categorías de castigo negativo:
1. El coste de respuesta, donde la respuesta no deseada hace que se retire o no
se pueda obtener el reforzamiento
2. Tiempo fuera o tiempo fuera de reforzamiento: aquí se utiliza un período de
tiempo durante el cual el reforzamiento no está disponible. Ej.: cuando a un
niño se le envía a su habitación por comportarse mal en la mesa.

4.5. PROGRAMAS DE REFORZAMIENTO

Un programa de reforzamiento es una pauta o regla que determina la forma y


el momento en los que la aparición de una respuesta va a ir seguida de un refuerzo. El
programa de reforzamiento continuo (RF-1) es el más clásico. Se da refuerzo cada vez
que se emite la conducta objetivo, y es el recomendado durante la fase de adquisición
de una conducta. Pero existe otro tipo de programas que son los intermitentes, en los
que no se refuerzan todas las emisiones de la conducta.

El nº de programas investigados por FERSTER y SKINNER (1957) es bastante


amplio y desde entonces también se han inventado programas nuevos.

Hay cuatro programas básicos de reforzamiento:

 Programas de razón

En estos programas la administración del refuerzo depende del nº de respuestas


dadas por el sujeto.

o Razón fija (RF). Es necesario emitir un nº de respuestas determinado para


obtener el refuerzo. Se refuerza la primera respuesta después de un cierto nº de
respuestas. En un programa RF-10 tienen que darse 10 respuestas para obtener

24
el refuerzo, y se refuerza cada décima respuesta. Con este programa los sujetos
responden con una tasa estable y moderada, y sólo se producen pausas breves
e impredecibles. La tasa de respuesta es constante durante todo el tiempo que
está disponible el refuerzo o hasta que se produce la saciación. La respuesta de
un programa de razón fija tiene otra característica distintiva y es que la
respuesta se interrumpe temporalmente después del reforzamiento. Esta pausa
se denomina pausa post-reforzamiento. Esta pausa no se observa en todos los
programas de razón fija. Ej.: reforzar a un niño cada vez que hace tres problemas
de matemáticas, dar una cantidad de dinero cada vez que se entregan 5 guías
telefónicas...

o Razón variable (RV). Igual que el anterior, pero aquí el requisito del nº de
conductas no se mantiene constante, sino que se obtiene el refuerzo tras
realizar un nº medio de respuestas, pero el nº de respuestas exigido varía a lo
largo del entrenamiento. Por ej.: si un animal fuese reforzado tras una media de
10 respuestas el programa es de RV-10; de hecho, el requisito para conseguir el
refuerzo puede ser de 8 respuestas en una ocasión, 11 en otra y así
sucesivamente. Debido a que con este tipo de programa el nº de respuestas
requeridas para obtener el refuerzo no es predecible, la tasa de respuestas no
presenta pausas predecibles, el sujeto responde con una tasa bastante estable
hasta que se sacia. Estos programas producen una tasa de respuesta constante,
y cuanto más elevado es el nº de respuestas exigido para obtener el refuerzo
mayor es la tasa de respuesta. Normalmente este programa da lugar a una tasa
media de respuestas más elevada que con cualquier otro tipo de programa. Ej.:
la conducta de juego. Una máquina tragaperras está programada para dar el
premio tras un nº medio de respuestas; sin embargo, el nº exacto de jugada que
se necesita para obtener el refuerzo es imprevisible ya que estas máquinas están
programadas según un programa de razón variable.

 Programas de intervalo

En estos programas la administración del refuerzo depende del paso del tiempo. En
un programa de intervalo una respuesta se refuerza sólo si se realiza transcurrida una
determinada cantidad de tiempo a partir de la última presentación del reforzador.

o Intervalo fijo (IF): Es necesario emitir la respuesta apropiada después de un


período de tiempo estipulado. La presentación del refuerzo depende del paso de
un tiempo concreto y de la ejecución de la respuesta adecuada. El refuerzo está
disponible después de un período de tiempo de manera que se refuerza la
primera respuesta que se emita después de que haya transcurrido ese intervalo.
La cantidad de tiempo es constante de una ocasión a la siguiente. La estrategia
más eficaz es esperar hasta que finalice el período de tiempo y emitir una única
respuesta para recibir el refuerzo. Ej.: en un programa de esfuerzo IF-1 minuto

25
el animal es reforzado por la primera conducta de presión de la palanca que
emita después de transcurrir el intervalo de tiempo de un minuto. Este programa
no asegura que el animal obtenga un refuerzo a intervalos de tiempo fijos, sino
que es necesario que se emita la respuesta para obtener el refuerzo.
Normalmente, con estos programas la respuesta deja de emitirse después de
obtener el refuerzo y luego aumenta lentamente a medida que se aproxima el
momento en el que está nuevamente disponible el refuerzo. A este patrón de
respuestas FERSTER y SKINNER (1957) lo denominaron festoneado. Influyen dos
variables en la pausa que se produce tras obtener el refuerzo:
 con la experiencia aumenta la capacidad para contener la respuesta
hasta el final del intervalo
 la pausa es más larga con programas de IF más amplios. Ej: la realización
de exámenes en fechas fijas de calendario; se estudia poco después de los
exámenes, pero aumenta esta conducta progresivamente cuando se
acerca la fecha.

o Intervalo variable (IV). Igual que el anterior, pero aquí el requisito del tiempo fijo
no se mantiene constante, sino que se obtiene el refuerzo tras un intervalo de
tiempo medio entre el refuerzo disponible, varía el intervalo de tiempo entre los
períodos en los que el refuerzo está disponible. Por ej.: en un programa de IV-2 el
intervalo medio es de 2 minutos, pero el animal espera la primera vez sólo 1 minuto
entre reforzadores y la siguiente 3 minutos y así sucesivamente. Estos programas se
caracterizan por una tasa de respuesta estable, que está determinada por la
duración del intervalo variable; la tasa es más baja cuanto más largo es el intervalo
entre los refuerzos. A pesar de que la tasa de respuesta es bastante estable entre un
refuerzo y otro, se ha observado que aumenta ligeramente justo antes del siguiente
refuerzo de forma parecida a los programas de intervalo fijo. No obstante, esta
aceleración es bastante escasa porque el intervalo temporal, al ser variable, no sirve
para predecir cuándo estará disponible el refuerzo. Ej.: esperar al autobús, que suele
llegar con un promedio de 5 minutos, pero que unas veces llega a los 4 minutos, otras
a los 3, a los 7...

4.6. EXTINCIÓN DE LA CONDUCTA INSTRUMENTAL

Una respuesta adquirida mediante condicionamiento instrumental puede


extinguirse si el refuerzo deja de presentarse tras la emisión de la respuesta. La primera
vez que se interrumpe el reforzamiento la tasa de respuesta es alta, pero va
disminuyendo hasta que se extingue.

La respuesta puede aparecer después de la extinción si al sujeto se le devuelve


a la situación experimental; es el fenómeno de la recuperación espontánea. Con
sucesivas sesiones de extinción este fenómeno es cada vez menor hasta que desaparece
del todo.

26
Otro fenómeno que aparece en la extinción es la aparición de respuestas
emocionales, AMSEL (1958) sugirió que la ausencia de refuerzo produce un estado
aversivo de frustración. Los estímulos asociados con la ausencia de refuerzo llegan a
producir una respuesta condicionada de frustración, por lo que el sujeto intenta
escapar de esa situación, ya que escapar es reforzante. BROOKS (1980) ha demostrado
que los estímulos asociados con el no reforzamiento adquieren propiedades aversivas.
En las condiciones de extinción una reacción frecuente es la agresión.

Hay tres factores que contribuyen a la resistencia a la extinción de una respuesta:

1. El efecto de la magnitud del refuerzo sobre la extinción depende del nivel de


entrenamiento durante la adquisición;

 si el nivel de entrenamiento en la fase de adquisición es mínimo, un refuerzo alto


produce mayor resistencia a la extinción
 con un entrenamiento prolongado de adquisición, cuanto mayor es la cantidad
de refuerzo menor es la resistencia a la extinción
 con un entrenamiento prolongado y un refuerzo pequeño durante la
adquisición se produce mayor resistencia a la extinción de la respuesta.

2. El efecto de la demora del refuerzo sobre la resistencia a la extinción depende de


su consistencia;

 si la demora del refuerzo durante la adquisición ha sido constante, no afecta a la


resistencia a la extinción
 una demora variable aumenta la resistencia a la extinción.

3. En cuanto a la consistencia del refuerzo se ha comprobado que una respuesta que


no ha sido reforzada cada vez que se ha producido ha estado sometida a
reforzamiento parcial, persiste más tiempo durante la extinción, es decir, es más
resistente a la extinción que una respuesta que siempre ha sido reforzada; este
efecto de denomina efecto de reforzamiento parcial o efecto de extinción del
reforzamiento parcial.

4.7. DISCRIMINACIÓN Y GENERALIZACIÓN DEL ESTÍMULO

Los organismos aprenden a responder de distinta manera ante estímulos diferentes,


y este proceso de responder ante unos estímulos, pero no ante otros de denomina
discriminación. También los organismos aprenden a responder de la misma manera
ante estímulos semejantes o parecidos, es el proceso de generalización. Estos dos
procesos suponen un aprendizaje adaptativo ante la complejidad del medio ambiente.

27
 DISCRIMINACIÓN

En muchas ocasiones el refuerzo está disponible y es contingente a la respuesta,


pero en otras no está disponible y no se obtendrá refuerzo a pesar de la emisión de la
conducta. Para aprender a discriminar cuándo está o no el refuerzo disponible hemos
de descubrir las condiciones que indican la disponibilidad de refuerzo y emitir la
respuesta cuando se den esas condiciones, y, por tanto, también hemos de aprender a
discriminar cuándo no se dan esas condiciones para así no emitir la respuesta. Sólo en
el caso de que la presencia de un estímulo altere la frecuencia de una conducta se puede
hablar de estímulo discriminativo. Existentes;

 Estímulos discriminativos positivos (ED), que indican que si la conducta se emite


en presencia de ellos se obtendrá refuerzo.
 Estímulos discriminativos negativos (E^), cuya presencia indica la no
disponibilidad de refuerzo.

 GENERALIZACIÓN

El proceso de generalización hace que se responda ante estímulos semejantes


presentados en el proceso de condicionamiento es el fenómeno opuesto a la
discriminación de estímulos. La medida del control por el estímulo se realiza a través de
los gradientes de generalización. Mediante este sistema se determina exactamente
cuánto tiene que modificarse el ambiente para producir un cambio en la conducta. El
gradiente de generalización se utiliza tanto para el condicionamiento clásico como para
el instrumental.

28

También podría gustarte