APRENDIZAJE1

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 50

TEMA 1: INTRODUCCIÓN A LA PSICOLOGÍA DEL APRENDIZAJE Y AL

MÉTODO CIENTÍFICO

1. ¿Qué es?

La psicología del aprendizaje estudia principalmente la conducta, incluyendo


los procesos mentales (que fueron ignorados durante mucho tiempo: ideas,
conciencias, metas…y que son conducta, aunque sea encubierta, son
modificables y pueden cambiar también otras conductas en función del
ambiente y de la experiencia.

Se enmarca en la psicología experimental, observa y experimenta de forma


controlando, viendo cómo se adquiere, mantiene o cambia la conducta en
función del ambiente, de los eventos…

Para definir aprendizaje, nos referimos a un cambio DURADERO, que se da en


la conducta modificándose en función a algo que haya ocurrido en el ambiente
y que hayas experimentado. La mayoría de las conductas son adquiridas en
función del ambiente del organismo, solamente unas pocas son innatas. Es
reducida, pero importante porque favorece la adaptación y la supervivencia del
organismo (están más relacionadas a las estructuras más primarias, a
diferencia de los adquiridos que están relacionados con la corteza cerebral)

2. ¿Qué estudia?

El aprendizaje tiene importantes funciones adaptativas, ya que posibilita la


modificación de la conducta en función de las demandas del entorno,
favoreciendo la supervivencia. Por ejemplo, el aprendizaje aversivo.

Conocer los efectos del entorno en la conducta es la base para entender el


comportamiento humano y su cambio. Nos permite entender como funciona el
comportamiento humano y cómo cambiarlo tanto en organismos individuales
como en la sociedad en general (sist. Educativos más eficaces, mejoras en
programas de intervención, control conductual, estilo de vida...)

3. Antecedentes de la psicología del aprendizaje


Actualmente, es desarrollada por científicos, pero antes era argumentado de
forma lógica por los filósofos. Hay varias corrientes psicológicas que han dado
paso a esta:

a) Asociacionismo: Aristóteles
Plantea que los fenómenos del pensamiento se asocian, de manera que, si se
recuerda o experimenta uno, el otro asociado se evocará.
Se conectan a través de tres principios de asociación: contigüidad, semejanza
y contraste.
b) Asociacionismo: William james
Aprendizaje como un proceso de formación de asociaciones entre los
elementos de una experiencia.
Existen unas redes de asociaciones en la que
los eventos aprendidos o recuerdos implican
múltiples componentes que se conectan y se
activan entre sí; los eventos se asocian a su vez
a otros mediante las conexiones múltiples de sus
componentes.
James fue el primero en postular que estas
asociaciones entre eventos tendrían su base en
conexiones físicas en el cerebro.
c) Dualismo: Descartes.
Distingue entre cuerpo (máquina autorregulada que funciona por un sistema de
habituación de fluidos) y mente (conocimiento verdadero o innato, que viene de
Dios)
Lanza también el concepto de arco reflejo: el movimiento reflejo se produce
cuando el estímulo sensorial entra en el sistema (por ejemplo, estímulo visual a
través del ojo) y acciona el sistema de fluidos, que producen la respuesta
motora
d) Empirismo (Locke, 1632-1704):
El conocimiento es el resultado de la experiencia y de la información recibida
por los sentidos.
Las ideas simples (obtenidas mediante los sentidos, por ejemplo: rojo o dulce)
se combinan para formar ideas complejas (por ejemplo: cereza).
Todo lo que sabemos, los sabemos por el exterior, lo recogemos todo del
ambiente a través de la experiencia, dándonos de alguna manera el potencial
de llegar y saber todo lo que queramos. Es lo contrario del determinismo
(innatismo).
La educación y la experiencia (el aprendizaje) permiten desarrollar el potencial
para el éxito y el liderazgo (vs determinismo de clase por nacimiento).
e) Evolucionismo (Darwin, 1809-1882):
Es el origen único de todos los seres vivo y su evolución se da a partir de la
selección natural, estableciendo la continuidad de los principios de la conducta
entre humanos y el resto de los animales. Por tanto, defiende una evolución a
través del mecanismo de la selección natural, y establece una continuidad
entre la conducta de cualquier ser vivo.
 Continuo conductual-> la conducta animal y su estudio es crucial para el
entendimiento de la conducta humana y de sus precursores biológicos
(justificación de la experimentación animal, desarrollo psicología
comparada).
 Control externo-> Defiende que es el ambiente, mediante la selección
natural, el primer mecanismo evolutivo (Evolución biológica). Evolución
conductual: mediante consecuencias cambiamos y modificamos la
conducta, en lo que se basa el condicionamiento operante de Skinner.

f) Reflexología rusa: Pavlov *


Desarrolla el condicionamiento clásico experimentando con perros.
Incorporación del concepto cartesiano de arco reflejo a la psicología
experimental: la estimulación sensorial externa, produce una conducta.

1. Campana [estímulo neutro]


+ comida [estímulo
incondicional]= respuesta
incondicional [salivación]
2. Campana [estímulo
condicional] = respuesta
condicional [salivación]
Recuperación del principio de asociación por contigüidad.

El descubrimiento (por casualidad) de Pavlov sobre la formación de


asociaciones en el cerebro del perro (dos eventos que suceden en contigüidad
se asocian), inició el estudio sistemático del aprendizaje y de los factores
implicados en el mismo.

4. El nacimiento de la psicología del aprendizaje


- Conexionismo: Thorndike. *
Se centró en el estudio de las relaciones E-R mediante cajas problema, en las
que el gato aprendía a escapar accionando complejos sistemas de apertura.
LEY DEL EFECTO: la asociación E-R depende de la consecuencia de la
acción (placentera-displacentera) más que de mecanismos asociativos o de
contigüidad. LA CONSECUENCIA FORTALECE LA ASOCIACIÓN DE FORMA
RETROSPECTIVA. (Podemos relacionarlo entonces con la supervivencia de
Darwin)
Se diferencia del condicionamiento operante, en que el gato tiene que hacer
una respuesta para obtener algo.

 Conductismo: Watson
Desplazó al psicoanálisis proponiendo un cambio en el objeto de estudio de la
psicología, que estaba centrada en la predicción y control de la conducta
observable, mediante metodología experimental rigurosa.
Rechazó a los términos mentalistas, a los estados mentales como objeto de
estudio y a la introspección y a la observación anecdótica como metodología,
exigiendo el uso de la investigación objetiva y experimental ya que la
psicología forma parte de la rama de las ciencias naturales y se basa en
hechos observables.
Se sitúa en una posición ambientalista extrema, afirmaba que podía formar a
un niño cualquiera, sin tener en cuenta sus talentos, aficiones, capacidades…,
para que fuera médico, abogado, artista o incluso mendigo o ladrón.
Sus estudios:
 Estudio de aprendizaje con ratas mediante uso de laberintos : Exhaustivo
control experimental para determinar cómo la rata aprende a orientarse
(privación sensorial), lo que supuso una gran controversia mediática.
Ensayo 1: 30 min hasta la meta… Ensayo 30: 10 seg hasta la meta.
 Caso del pequeño Albert: Condicionamiento del miedo.
Rata (EN) -> No hay temor

- Conductismo: Hull: desarrolló ecuaciones matemáticas para explicar la relación


E-R; con el objetivo de predecir de forma exacta la conducta animal en
cualquier situación. Introdujo el concepto de motivación, además de otros
factores como:
-Número de ensayos de aprendizaje
-Frecuencia de la recompensa
-Espaciamiento entre los ensayos
-Intensidad de las señales del estímulo
-Valor del incentivo de la recompensa
Según Hull, la ejecución conductual dependería de la fuerza del hábito como del
nivel del impulso y del valor del incentivo
 Neoconductismo: Tolman
Control experimental y rigor metodológico, pero haciendo hincapié en
representaciones internas del ambiente e introduciendo conceptos no
observables como propósito e intención.
Se aleja de la posición más extrema del conductismo, al considerar que la
conducta está determinada por eventos internos al organismo, como
expectativas y demandes (E-O-R)
Variables intervinientes; Aparecen los conceptos de propósito (persistencia que
se observa en las conductas hasta que éstas alcanzan una determinada
condición u objeto:objeto-meta), y cognición(suposición que hace el organismo
respecto del medio para poder cumplir sus propósitos)

Fue pionero de la psicología cognitiva: plantea el concepto de mapas cognitivos


(representación psicológica interna de la distribución espacial del mundo
exterior)
Tolman demostró en sus estudios que los mapas cognitivos son fundamentales
para entender el comportamiento y sus variaciones ante situaciones
novedosas. Estas conductas son imposibles de explicar mediante conexiones
simples: E-R
La conducta final depende de cambios internos según los cuales el organismo
recibe, elabora y transforma la información recibida (organismo propositivo vs
pasivo).
Aprendizaje vs ejecución: se puede aprender una conducta sin necesidad de
ejecutarla en ese momento para conseguir la consecuencia.
Aprendizaje latente: el aprendizaje puede darse sin necesidad de
entrenamiento o recompensa (lo que implica el aprendizaje de un mapa
cognitivo).
Fueron una nueva ola de psicólogos cognitivos que iniciaron el estudio de los
procesos mentales superiores (por ejemplo: conciencia, lenguaje…), para los
cuales no hay fácil explicación desde el enfoque conductista estricto.

-Conductismo radical: Skinner


Continúa con los estudios de Throndike(caja problema) un aparato de
aprendizaje automatizado (caja de Skinner); con la que mide no solo
respuestas directas, sino su desarrollo en el tiempo.
Paradigma de condicionamiento operante libre (condicionamiento instrumental)
y distanciamiento de conducta refleja E-R(cómo); énfasis en el contexto (por
qué)
Define varios conceptos:
 Conducta voluntaria u operante libre: aquella que se presenta sin
intervención de un estímulo antecedente observable, los estímulos
antecedentes o discriminativos modulan el momento de emitir la R, pero
su emisión no depende del estímulo discriminativo sino del organismo.
 Conducta organizada en periodos temporales: no hay continuidad
momentánea entre respuesta y consecuencia.
 Análisis funcional de la conducta A-R-C: definir la conducta en términos
funcionales (por qué), lo cual permite su predicción y control.

Obras:

 Beyond Freedom and Dignity (1971):


El ambiente mantiene y controla la conducta: los seres humanos, como todos
los animales, funcionan produciendo respuestas preprogramadas
(aprendidas) ante estímulos ambientales (determinismo ambientalista).
Conciencia o libre albedrío-> ilusiones arraigadas que impiden el uso de
métodos científicos (por ejemplo: análisis funcional de la conducta) para el
desarrollo de una mejor sociedad.

 Walden-two (1948):
Novela de ciencia ficción acerca de la ingeniería de la conducta. Es una
sociedad utópica altamente regulada, en donde las conductas socialmente
deseables se mantienen por medio de programas de entrenamiento.

CONSIDERACIONES FINALES

 Los eventos privados (conducta) causan gran controversia en esta ciencia


Algunas corrientes como el conductismo radical de Skinner plantean que solo
los hechos observables deben considerarse conductas, ignorando los aspectos
mentales.

La psicología de aprendizaje sí que considera los eventos privados como


conducta y los aborda de manera científica.
Se consideran una parte más del comportamiento de los sujetos, sobre los que
aplican las mismas leyes y metodología conductual que sobre los eventos
observables.

 Uso de animales no humanos en investigación sobre aprendizaje


Entre las razones de este uso están: la justificación teórica, la utilidad de los
hallazgos tanto a nivel básico como aplicado (por ejemplo, el modelo animal en
adicciones) y los criterios éticos aplicados.
Cuentan con una parte de protección y control: veterinarios, personal técnico,
rigurosos comités de bioética que velan por la seguridad y el bienestar animal,
y que analizan y aprueban la viabilidad de una investigación con animales
Se trata de una cuestión controvertida y polémica para la que, hoy en día, no
existen alternativas que permita el abordaje del aprendizaje y la conducta de
forma exclusiva.

 Contribuciones a nivel profesional terapia o modificación de conducta.


Se engloba dentro de la psicología general o experimenta cuyos contenidos
son básicos (principios generales o fundamentales)

La investigación en psicología del aprendizaje ha contribuido de forma muy


importante al ámbito clínico y educativo a nivel profesional, especialmente en
terapia de conducta:

 1º ola (60´): inicio de las técnicas de modificación de conducta a partir de


teorías de psicología del aprendizaje (condicionamiento clásico y
operante) como alternativa al psicoanálisis. Objetividad y rigor científicos
validadas de forma empírica.
Exposición o desensibilización sistemática (Wolpe,1958)
Economía de fichas (Azrin,1968)

 2º ola (70´): surgen las terapias cognitivo-conductuales, énfasis en


procesos mentales “cognitivos” para el adecuado abordaje de ciertos
problemas psicológicos (por ej, terapía cognitiva de Beck)

 3º ola (2000): aproximación más contextualizada, los eventos privados


(en particular la atención y el discurso del individuo) se reorientan en
lugar de eliminarse para conseguir cambios socioafectivos duraderos (p.
ej. Psicoterapía analítico-funcional, terapia de aceptación y compromiso)

 Contribuciones a nivel científico: neurociencias


Las técnicas y procedimientos desarrollados en psicología experimental y del
aprendizaje, han contribuido enormemente al estudio del cerebro humano.
El estudio del aprendizaje, sobre todo desde la psicología fisiológica, ha
permitido el avance en el conocimiento de las bases neurobiológicas de la
conducta, especialmente con el uso de modelos animales basados en
condicionamiento operante.
A su vez, las técnicas de neuroimagen funcional, de estimulación cerebral y los
modelos animales, han contribuido al entendimiento del sustrato neural de la
conducta y de los distintos fenómenos del aprendizaje.
TEMA 2: APRENDIZAJE PROCEDIMENTAL
1- ¿QUÉ ES?

Habilidad motora o perceptiva que hemos desarrollado y que tiene una serie de
características:

- Se lleva a cabo de forma inconsciente o no intencionada mediante


práctica repetida

- Se trata de un aprendizaje implícito y no declarativo (no está


representado como información explícita sobre el mundo ni se reporta de
forma verbal, aunque al principio puede serlo: instrucciones, reglas
verbales, etc.)

- Implica la realización automática de una secuencia de movimiento u


operaciones mentales que ganan en rapidez y fluidez a lo largo de la
práctica repetida.

- Adquisición gradual: proceso serial y controlado🡪 en paralelo (se puede


hacer más de un proceso a la vez) y automático.

Contribuye a la adquisición de conductas automáticas como hábitos y


destrezas.

Este aprendizaje depende de la práctica repetida.

Ejemplo de aprendizaje procedimental: jugar a la play, la primera vez os


explican la función de los botones, esto al principio va a depender de reglas
verbales, cuando lo aprendes ya no lo haces de forma específica, cuando
automatizas ya no depende de reglas mentales. Otros: tocar un instrumento,
leer, bailar, montar en bici, escribir, conducir, teclear…

 El test de Stroop (evaluación de la inhibición) pone de manifiesto de la


automaticidad de la lectura, un aprendizaje procedimental que en sus inicios es
controlado, lento y costoso pero que con la práctica se automatiza.

El aprendizaje procedimental depende del cerebelo, corteza motora y


estructuras subcorticales como el estriado (en ganglios basales)
Se pueden clasificar en dos tipos
PERCEPTIVO MOTOR: patrones motores basados en entradas sensoriales
clasificadas a su vez en cerradas (movimientos predefinidos que no varían) y
abiertas (cuya ejecución varía en base a predicciones sobre las demandas del
ambiente, por ejemplo tocar jazz o bailar salsa)
COGNITIVO: implican el uso de estrategias para la resolución de un
problema.

Fases de la automatización
1. Cognitiva instrucción, observación, ensayo/error, implica información
declarativa. Ej. Usar instrucciones escritas para montar una tienda de campaña
2. Asociativa combinación de acciones que crean patrones estereotipados. Ej.
Instalar la tienda de campaña en una secuencia fija sin instrucciones
3. Autónoma rapidez y fluidez que dan lugar a patrones motores, menor
atención activa y menor dependencia verbal
Ej. Montar la tienda de campaña a la vez que mantenemos una conversación
paralela
Pasamos desde una ejecución consciente con mediación verbal, lenta y con
errores a una menos consciente, más automatizada y con menos errores.
El hecho de que el uso del lenguaje se de más al principio implica que a
medida que avanza la automatización se utilizan distintos tipos de información
o memorias (verbales, declarativas, procedimentales), lo que implica a su vez
la implicación de distintos sistemas cerebrales a lo largo del aprendizaje
procedimental.

2- LAS VARIABLES MÁS DETERMINANTES EN LA ADQUISICIÓN DE


ESTE APRENDIZAJE

a) Constante vs variable: se refiere a variar el contexto del entrenamiento (mejor


variable)
Las variables más determinantes en la adquisición de este aprendizaje son la
práctica (vs la genética) y la retroalimentación (conocimiento de los resultados,
saber cómo lo estamos haciendo para poder modificar ciertos aspectos de la
ejecución y mejorarla). Así, con la práctica, el tiempo requerido para el
desempeño de una tarea desciende a una tasa decreciente (cada vez se
mejora menos a lo largo de la práctica).

 LEY DE POTENCIA DE APRENDIZAJE: En ella, la ganancia en el


desempeño es mayor al inicio. El número de ensayos necesarios para
mejorar aumenta cuantos más ensayos de práctica realizamos. La tasa
con la que se pierde la capacidad de mejora es relativamente
predeterminada e independiente del tipo de habilidad o de la especie
(función de potencia).
 RETROALIMENTACIÓN: Consigue aumentar la ganancia aún después
de haber alcanzado la máxima ejecución.

La ejecución también depende del tipo de práctica: Baddeley y Longman (1978):


práctica masiva vs espaciada en la adquisición de habilidad perceptivo-
motora:
 Masiva (dos horas al día (2x1) o dos horas dos veces al día (2x2)) vs
espaciada (una hora al día (1x1) durante tres meses). Mejores
resultados en ejecución espaciada.
 Constante vs variable, variar el contexto de entrenamiento. Mejores
resultados en ejecución con contexto variable.

3- ¿EXISTE EL OLVIDO DE CONDUCTAS APRENDIDAS


PROCEDIMENTALMENTE?
Sí existe un olvido: el paso del tiempo y la imposibilidad de realizar dicha
conducta deteriora la memoria procedimental y la habilidad para llevarla a
cabo. Además, el aprendizaje de otras habilidades puede interferir en el
desempeño de la conducta.

No se debe confundir el olvido (unido al paso del tiempo) con la extinción de


una conducta (tenemos una respuesta condicionada a un estímulo concreto,
que puede extinguirse si presentamos esta campana sin comida)

4- TRANSFERENCIA DEL APRENDIZAJE


Se generaliza la conducta a otra situación novedosa a partir de la experiencia
previa. Hay especificidad de transferencia: esta es más fácil cuanto más
parecida sea la situación.

 LEY DE LOS ELEMENTOS IDÉNTICOS (Thorndike y Wooddworth)


La transferencia depende del número de elementos en la situación nueva que
sean idénticos a los que estaban presentes en la situación en la que se
codificaron las habilidades)

5- SUSTRATO CEREBRAL, ¿DE QUÉ REGIONES DEPENDE EL


APRENDIZAJE PROCEDIMENTAL?
Estudios de neuroimagen (fRMi, MEG), estimulación (TMS,Tdcs), registro
neurofisiológico (EEG) con: sujetos sanos, expertos vs novatos, pre vs post-
aprendizaje, sujetos con lesión cerebral.

Estos estudios han permitido saber que las estructuras más determinantes en
el aprendizaje procedimental son los ganglios basales, el cerebelo y la corteza
sensorial y motora.

CAMBIOS EN LOS PATRONES DE DISPARO DE LOS GANGLIOS


BASALES DURANTE EL APRENDIZAJE PROCEDIMENTAL
- Aprendizaje perceptivo-motor (asociación E. Auditivo con respuesta
motora de giro) en laberinto en T.
 Registro neuronal mediante electrodo en los ganglios basales
 Al inicio, la mayoría de las neuronas solo disparaban en el momento
de realizar la respuesta de giro y otra solo lo hacían al azar.
 Con el entrenamiento, la actividad neuronal se vio modificada: el 90%
de las neuronas respondía al inicio de la tarea (desarrollo del plan
motor que se ejecuta hasta llegar a la meta)
 Mayor actividad en los ganglios a medida que se aprende el patrón.

CEREBELO, está implicado en la coordinación y sentido del equilibrio.


Durante el aprendizaje perceptivo motor:
 Hay un aumento de sinapsis en secuencias motoras
complejas(presionar una secuencia de botones en función de estímulos
visuales).
 El aumento de la activación se da al principio del aprendizaje+
 Después, las representaciones motoras ya bien aprendidas dependen
más de los GB y sus conexiones
 Aumento de la actividad cerebelar durante el aprendizaje de habilidades
cognitivas, que incrementa con la dificultad de la tarea
 Torre de Hanoi o Torre de Londres: mover elementos de una estaca a
otra, uno a la vez, en base a la regla (p.ej. sin colocar un disco sobre
otro de menor tamaño.

CORTEZA CEREBRAL corteza motora y somatosensorial, especializados


en el control y coordinación de movimientos. Es la más externa de estas
estructuras.
Los circuitos neuronales de la corteza cerebral activos durante la ejecución,
cambian y se fortalece durante el aprendizaje y práctica de habilidades motoras
y/o cognitivas (PLASTICIDAD SINÁPTICA) favoreciendo la mejora en estas
actividades a nivel conductual. Muy importante en las labores de rehabilitación
cognitiva.
 Adaptación de la estructura cerebral en respuesta al aprendizaje
perceptivo-motor y su práctica repetida
 Pianistas profesionales y no músicos difieren en regiones cerebrales
motoras, auditivas y visoespaciales (aumento de materia gris medido
por morfometría basada en voxel)
 Esta adaptación es específica de la actividad
 Cambios corticales durante el aprendizaje perceptivo motor indican que
estas estructuras están involucradas en el aprendizaje y que los
cambios en ellas mejoran la ejecución
 Esta adaptación estructural es específica de la actividad aprendida y
practicada.
 La mejora en la ejecución depende de los cambios corticales
observados.

TEMA 3: APRENDIZAJE NO ASOCIATIVO Y CONDUCTA PROVOCADA

1- CONDUCTA PROVOCADA:
Es la conducta que ocurre en respuesta a estímulos ambientales complejos
(desde reflejos simples a secuencias complejas de conducta: como la
reacción emocional, la conducta dirigida a metas, la orientación espacial…).
No es que haya dos estímulos que se asocian y a partir de esa asociación,
podamos aprender y predecir, no hay esa asociación. Lo que ocurre es que
un estímulo provoca una respuesta, una conducta, y esa respuesta o
conducta, con la práctica va cambiando y se adapta. La respuesta no
asociativa va cambiando, por eso lo llamamos aprendizaje.
El debate tradicional está entre si la conducta es reflexible (cambiante) vs.
determinada (innata), es decir, empirismo vs innatismo.
Muchas de nuestras conductas y de otros animales son innatas,
provocadas y no aprendidas mediante mecanismos de asociación
(contingencia) entre estímulos; son mediadas por mecanismos y
tendencias preexistentes que limitan cómo ocurre el aprendizaje. Por
ejemplo: ruido-> sobresalto / luz intensa-> contracción pupilar o parpadeo/
partícula en vías respiratorias-> tos/ tocar una superficie caliente-> retirada.

2- REFLEJO: es la forma más simple de respuesta provocada


Estímulo provocadorrespuesta correspondiente

Depende de la organización neural del sistema nervioso (arco reflejo, concepto


introducido por Descartes)

Garantizan el bienestar y la supervivencia del individuo.


Constituyen gran parte del repertorio conductual del recién nacido.
3- PATRONES DE ACCIÓN MODAL (BAERENDS,1988) son secuencias de
respuesta que son típicas de una especia y que están involucradas en una
conducta concreta. Por ejemplo, en la alimentación de las aves existe una
secuencia de respuestas: pica el pico, regurgita…) Son estereotipadas
Podemos diferenciar 2 tipos de acciones modales:
- Conductas apetitivas: ponen al organismo en contacto con el estímulo,
dependiendo de la situación, del tipo de estímulo… depende de las
especies la búsqueda de comida puede variar. Es una secuencia dada. Es
el inicio y la búsqueda.
-Conductas consumatorias: es la finalización de esta conducta. Por
ejemplo, en el caso de comer, tragar.

4- VARIABILIDAD DE LA CONDUCTA PROVOCADA


La respuesta no asociativa va cambiando con la experiencia y con la
exposición que tengamos ante este estímulo, es variable. Varía dependiendo
del ambiente, de la exposición al estímulo que provoca la respuesta…. En
general, de la experiencia del organismo con este estímulo.
Hay distintos fenómenos de aprendizaje que muestran la plasticidad de la
conducta
A) Fenómeno de habituación: disminución en la fuerza o frecuencia de la
respuesta que ocurre con la presentación repetida de un estímulo. Es
común en casi todas las especies y situaciones y depende de la atención Ej:
Se realizaron ensayos con jugo de limón que consistieron en presentar
dicho jugo a diferentes mujeres. El jugo de limón es un estímulo que
provoca salivación de forma automática. Tras diferentes ensayos en los que
había salivación, vemos que a medida que repetimos el darle a la persona
jugo de limón, cada vez saliva menos, se ha habituado por consecuencia de
la repetición.
Otra característica, es que presenta especificidad al estímulo: la
respuesta se renueva (deshabituación) con la aparición de otro estímulo
(en lugar de generalizarse).

En un lado del gráfico tenemos la


valoración hedónica, cuánto te
gusta. Vemos que a medida que
se va repitiendo, nos va gustando
menos.

Esto es útil por ejemplo con bebés, midiendo el tiempo que pasan
observando una nueva lámina cuando se les presenta, pero como cae la
atención ante la presencia continua del estímulo. También los llamamos
familiarización.
Paradigma de atención visual: Se realizó un estudio con bebés caucásicos
(raza aria) a los que se les presentaban rostros caucásicos, hasta que decaía
la atención, después se les dividieron en dos grupos, a uno les presentaron a
una cara diferente pero también caucásica, y se deshabituaron, hubo
discriminación entre ambos estímulos al cambiar de cara, se renovó la
atención. Al otro grupo se les presentaron rostros asiáticos diferentes, y no
hubo deshabituación. La discriminación visual es mejor con rostros de tu propia
raza, que entre rostros que no son de tu raza, el fenómeno de la raza.
B) Fenómenos de deshabituación:
Podemos definir el fenómeno de deshabituación como la reanudación de la
respuesta habituada cuando se presenta un nuevo estímulo inmediatamente
antes del estímulo habituado. Tenemos que estar seguros de que ha habido
habituación, que ha bajado suficiente la respuesta atencional.

C) Fenómeno de sensibilización: Aumento gradual de la respuesta elicitada


ante un estímulo.
Paradigma de atención visual: estímulo más sencillo, cuadrícula de 4x4,
provoca habituación, pero un estímulo con mayor complejidad visual e
intensidad, como una cuadrícula de 12x12, hay sensibilización, aumento de
actividad. Ocurre habitualmente con estímulos intensos, la mayor intensidad
del estímulo aumenta la activación, lo cual intensifica la experiencia.
Se produce la generalización-> estímulos que son gradualmente
diferentes al elicitador provocan la misma o similar respuesta (la
sensibilización se generaliza a otros estímulos).
Se realizó un experimento con una rata en una caja y una cámara con
estabilímetro, e iban sonando pitidos: se esperaba una respuesta de
sobresalto) Reacción defensiva de un organismo ante una amenaza real o
potencial, que implica salto súbito, tensión de músculos superiores del
cuerpo, levantamiento de hombros y parpadeo. Una mayor intensidad del
estímulo provoca una mayor respuesta. El ruido que sonaba de fondo era
leve y constante (60 db), se produjo habituación, cuando cambió a 80db,
se produjo sensibilización.

Efecto de sobresalto potenciado por temor.


Si se presentan fotografías agradables en contexto de amenaza (descarga
eléctrica)
provocan mayor respuesta de sobresalto (parpadeo) que en contexto seguro.
Las fotografías desagradables provocaban similar respuesta de sobresalto,
independientemente del contexto (suficientemente desagradables como para
sensibilizar la respuesta).
Estar bajo amenaza provocará que te sensibilices y muestres una respuesta
defensiva (parpadeo) con mayor probabilidad, ante un estímulo en principio
inocuo (foto agradable). Dependiendo del contexto (cuánto de amenazador
sea), hará que nuestra sensibilidad sea mayor, se magnifique, ante un contexto
de amenaza frente a uno seguro.

D) Fenómeno de habituación, sensibilización y recuperación espontánea


Se presentaban distintos tonos a ratas, y se medía su respuesta de sobresalto.
Si los tonos se presentan una vez al día, la primera vez se sobresalta mucho, la
segunda menos, la tercera menos… Luego vuelve a subir (la habituación no es
total), baja, sube… Si en vez de una vez al día, presentamos el tono cada 3
segundos, la habituación será mucho más marcada, la respuesta de sobresalto
baja claramente. La habituación será más rápida si la frecuencia es más rápida.
Si después de hacerlo tan seguido, pasamos otra vez a dar el tono una vez al
día, baja la frecuencia de presentación, se pierde la habituación y vuelve a
haber respuesta de sobresalto (recuperación espontánea). Se darán distintas
formas de habituación dependiendo de la tasa de presentación del estímulo.
E) Fenómeno de adaptación sensorial y fatiga

En estos también disminuye la respuesta, pero no porque se haya producido


una habituación. Hay algo que impide o bloquea que el animal u organismo de
esta respuesta. El origen está en la neurona sensorial cuando hablamos de
adaptación sensorial, el impulso neuronal se ve interrumpido. Pero es algo
periférico no fisiológico, por ejemplo, un luz en la cara que no me deja
responder porque estoy cegada.
En la fatiga, hablamos de un origen a nivel motor, el cansancio no me deja
responder.
En la habituación seguimos siendo capaces de percibir el estímulo, aunque
dejemos de emitir respuesta, ya que hay cambios neurofisiológicos que
dificultan el impulso nervioso de las neuronas sensoriales a las motoras.

La adaptación se distingue de la habituación en que la habituación es


específica a la respuesta (se puede responder al estímulo de otras formas,
pero no si hay adaptación). Por ejemplo, en un examen, si el profesor anuncia
algo, presto atención levantando la cabeza, que desaparece (pero se le sigue
escuchando, la respuesta de atención continúa de otra forma). Esto es
habituación porque sigue habiendo respuesta (atención) pero de otra manera.

La fatiga se distingue de la habituación en que la habituación es específica al


estímulo (otro estímulo diferente provocará la respuesta, pero no si hay fatiga).
Por ejemplo, en un examen, si el profesor dice tu nombre, presto atención
levantando la cabeza.

Tanto en la adaptación como en la fatiga hay dos cosas a tener en cuenta para
distinguir de la habituación: en la habituación hay especificidad a la respuesta
(se puede responder de otra manera) y al estímulo (se puede responder al
estímulo), demostramos que somos capaces de responder. En la adaptación y
la fatiga, eso no es posible ni a nivel sensorial ni motor, no se es capaz de
responder, ni poniendo otro estímulo.

5- MODELOS DE APRENDIZAJE NO ASOCIATIVO.

Teoría del proceso dual (Groves y Thompson,1970)


Existen diferentes tipos de procesos neurales subyacentes, procesos neurales
de sensibilización y de habituación que son responsables de los incrementos y
las disminuciones en la respuesta a la estabilización (efectos de sensibilización
y habituación)
Ambos procesos o mecanismos subyacentes son activados simultáneamente y
compiten por el control de la conducta, dando como resultado un efecto u otro
dependiendo de cual tenga más fuerza.

- PROCESO DE HABITUACIÓN:
 Entra en juego un proceso llamado E-R,(arco reflejo estímulo respuesta)
Hay una respuesta específica ante un estímulo.
 Lo percibimos por nuestros sentidos activando una respuesta motora.
 Se activa con la presentación, lo que produce la acumulación de la R,
que cada vez se de menos y se debilite.
 Las presentaciones repetidas del E pueden debilitar las conexiones entre
los nodos intermedios y de esta forma reducir la fuerza o probabilidad de
actividad.
- PROCESO DE SENSIBILIZACIÓN:
 Si el estímulo es lo suficientemente fuerte, se activará el SISTEMA DE
ESTADO, que determina el nivel general de propensión a la respuesta.
 Se activa solo una vez por un evento activador.
 La exposición a un estímulo activador produce un aumento temporal en
la fuerza o probabilidad de actividad

La respuesta depende de la frecuencia con que se ha repetido el estímulo y de


su intensidad y lo reciente que fue (por tanto, del nivel de activación que puede
alcanzar a provocar).
Ambos procesos decaen con el paso del tiempo: en el caso de la habituación,
el paso del tiempo puede provocar la recuperación espontánea de la respuesta,
y en la sensibilización el paso del tiempo causaría la reducción de la
respuesta.

6- SUSTRATO NEURONAL DEL APRENDIZAJE NO ASOCIATIVO

Los cambios neurofisiológicos subyacentes, que implican modificación de la


actividad neuronal como resultado de la experiencia, se han estudiado en
invertebrados. Estudios con aplysia de Eric Kandel. Demostración de
fenómenos de habituación y sensibilización y de sus mecanismos neurales
subyacentes.
Habituación y sensibilización del reflejo de retracción de la branquia: Una
aplicación repetida del estímulo táctil produce habituación de la respuesta de
retracción. Una descarga breve aplicada en el momento cero, sensibiliza la
respuesta de retracción de la branquia, provocada mediante la estimulación
táctil del manto o el sifón.
Circuito neural que media en la habituación y sensibilización:
Habituación: Contacto con piel manto / sifón-> receptores mecánicos-> impulso
en la neurona sensorial (presináptica)-> libera NT-> activa la neurona motora
(postsináptica)-> libera NT que activa fibras motoras-> retracción de la
branquia. Respuesta homosináptica (sistema E-R): único impulso que va de la
neurona sensorial (única implicada, que hace sinapsis con la motora) a la
motora. Con la repetición del estímulo, la neurona sensorial libera menos NT->
se debilita la conexión sináptica (depresión sináptica)-> se reduce la
habituación, (la respuesta va disminuyendo porque con las repeticiones se va
liberando menos neurotransmisor, y eso hace que se debilite la sinapsis y por
ello la respuesta).
Sensibilización: Descarga eléctrica en la cola-> se involucra una neurona
facilitadora-> influye en la neurona sensorial (presináptica)-> libera más NT->
mayor activación de la neurona motora (postsináptica)-> retracción de la
branquia más fuerte.
En la sensibilización (mayor descarga) está involucrada una nueva neurona: la
sensibilizadora o facilitadora (NF), se produce hetero sinapsis, dos neuronas.
La participación de la NF (heterosinapsis) con la descarga hace que el sistema
entre en alerta al provocar mayor activación, más fuerza en el impulso de la
neurona sensorial (NS) y una respuesta más fuerte, sensibilización. Se libera
más neurotransmisor y ocurre lo contrario, mayor fuerza del impulso, mayor
respuesta.

TEMA 4: CONDICIONAMIENTO CLÁSICO- FUNDAMENTOS Y


MECANISMOS:

1. CONDICIONAMIENTO CLÁSICO (CC):


 Habituación y sensibilización:
Implican la respuesta a un solo estímulo; permiten adaptar la respuesta al
ambiente, pero el repertorio conductual resultaría muy limitado.
 Condicionamiento clásico (CC):
Implica el aprendizaje de las relaciones entre dos eventos o secuencia de
estímulos; permite predecir qué ocurrirá y adaptar la conducta en
consecuencia. La conducta del sujeto es independiente de la aparición de los
estímulos, simplemente aprende a predecir un estímulo por la aparición de otro,
lo cual es adaptativo. Por ejemplo, es probable que llueva si hay muchas
nubes, las tiendas abren a una hora determinada, la llave de casa permite abrir
la puerta, encontrar un atasco en hora punta…
 Descubrimiento y estudio sistemático del CC:
Ivan Pavlov, fisiólogo estudió los procesos digestivos en perros. Secreciones
psíquicas-> sólo con ver comida o a la persona que les alimentaba provocaban
secreciones gástricas en el animal (fístula estomacal)
Vul’fson y Snarskii, uso de distintas sustancias naturales (comida, arena, agua
ácida) para observar la respuesta de salivación (fístula
salival).
Aprendizaje de objeto: asociación entre características
oro sensoriales (sensaciones distintivas de textura y
sabor en la boca) y visuales del objeto, por ejemplo,
salivar al ver la arena.
 Paradigma del CC:
1. Metrónomo [estímulo neutro, EN] -> no
salivación [sin respuesta]
2. Metrónomo [estímulo neutro, EN] + comida [estímulo incondicional, EI] =
salivación [respuesta incondicional RI]
3. Metrónomo [estímulo condicional, EC] = salivación [respuesta condicional,
RC]

2. CONDICIONAMIENTO CLÁSICO-MECANISMOS:
Características de los estímulos
 Intensidad y saliencia
 La saliencia se refiere a lo perceptible o significativo que es un estímulo E
 La respuesta condicionada RC será más fuerte cuando se presentan
estímulos incondicionados EI más intensos o salientes
 Los EI suelen tener alta intensidad y saliencia para el organismo, aunque
dependerá del estado de mismo (mayor saliencia de la comida si el
organismo está hambriento)
 Intensificar un E puede provocar una mayor saliencia y, por tanto, una RC
más fuerte
 Otros ejemplos de RC que cambian ante la intensidad del EI son las
conductas de miedo (parpadeo, flexión de la pata…) o las fisiológicas
(salivación, tasa cardiaca…)

Aprendizaje sobre la naturaleza predictiva del estímulo, qué señales predicen


eventos deseables o indeseables
 Los cambios en la intensidad del EI no solo influyen en la amplitud del RC,
sino en su forma (por ejemplo, más tiempo)
 No obstante, la RC puede llegar a un nivel máximo en el que ya no
aumenta ni varía en su forma, aunque el EI se intensifique o sea más
saliente.
 Novedad (preexposición al EC y al EI)
 Estímulos novedosos provocan respuestas más intensas. Las
variaciones en la intensidad o saliencia puedes resultar
novedosas, siendo la novedad la responsable, en parte, del
aumento de la R
 Efecto de preexposición: preexponer un E antes de la
asociación EC-EI disminuye la novedad, provocando menor R
 Preexposición al EC (inhibición latente): Si el EC se
presenta repetidamente sin ninguna consecuencia, esto
supone un retraso en el condicionamiento de la R ante
ese estímulo, pues se le ha dejado de prestar atención.
Se parece a la habituación (disminución de R de orientación),
pero en esta e reduce la R provocada, mientras que, en la
inhibición latente, hay un retraso en el aprendizaje.
El EC no es un inhibidor condicionado (provocaría RC
inhibitoria, prueba de sumación)
 Preexposición al EI: Si el EI se presenta repetidamente sin ser precedido
por un EC, deja de ser novedoso y pierde la capacidad de captar atención,
lo que dificultará su asociación al EC cuando se presenten emparejados
(no se apreciará la relación pues ya ha aparecido antes).
Inferencia asociativa: las señales contextuales dadas durante la preexposición
pueden condicionarse e interferir en el aprendizaje EC-EI si se presentan
durante su asociación.

 Naturaleza
 Tipo de estímulo: El tipo de E influye en la RC. Aunque podría ser
irrelevante (al ser neutro EN), el tipo de EC utilizado en la asociación
también influye en el aprendizaje:
EC en distintas modalidades sensoriales (tono o luz) provocan distintas RC
(movimiento de cabeza vs. ponerse de pie)
La capacidad sensorial del organismo ante ese EC debe ser considerada, por
ejemplo, las palomas parecen responder mejor ante el color del EC que ante su
localización.
 Relevancia del estímulo: Pertinencia con respecto al EI. El aprendizaje de
la asociación EC-EI se ve favorecido si el EC es pertinente con respecto al
EI, por ejemplo, sabor-malestar, estimulación audiovisual-dolor.
Se da mayor RC (supresión de la conducta de lameteo) cuando el EC (un
sabor) se asocia con un EI para el que es pertinente (malestar gástrico), que
cuando no lo es (un sabor-dolor por descarga), ya que estos aparecen
asociados más habitualmente en el ambiente natural.
 Fuerza biológica del estímulo:
1. Condicionamiento de segundo orden: Un EC inicialmente neutro puede
adquirir fuerza biológica a través de su asociación a un EI y provocar un
condicionamiento por su asociación a otro EC

2. Contracondicionamiento: Un EC asociado a un EI puede asociarse con


otro EI diferente o incluso opuesto y generar otro tipo de R, debido a la
fuerza biológica de los ECs.
Luz EC- descarga EI-> miedo, RC aversiva
Luz EC- comida EI-> salivación, RC apetitiva
3. Precondicionamiento sensorial: Aunque la fuerza biológica es
determinante para el condicionamiento, el aprendizaje puede darse por la
asociación de dos EC sin valor biológico (y sin presencia de ningún EI).
Para comprobarlo:
Luz EC 1- Tono EC 2-> ¿Asociación?
Luz EC 1- Comida EI -> RC salivación
Tono EC 2-> RC salivación si EC1-EC2
 Contigüidad
3. CONDICIONAMIENTO CLÁSCIO-SITUACIONES EXPERIMENTALES:
 Condicionamiento del miedo:
Watson fue quien realizó los primeros estudios con el condicionamiento del
miedo (pequeño Albert), asociaron un estímulo neutro/agradable con un
estímulo desagradable. Tras repetidas asociaciones el niño generó miedo al
primer estímulo.
Hoy en día se investiga con ratas mediante el uso de la caja de Skinner.
Paradigma de supresión condicionada o Técnica de respuesta emocional

condicionada:
El miedo produce paralización, sobresalto, subir los hombros.
Un organismo que está realizando una conducta, puede suprimir dicha
conducta porque se paraliza. Para conocer si hay condicionamiento del miedo,
observamos si se suprime o no la conducta, es decir, si hay o no paralización.
Se hizo un experimento con ratas que consistía en que si presionaban una
palanca conseguían comida. Después se presentaba una luz seguida de
descargas. Tras sucesivas presentaciones luz->descarga, (luz estímulo
aversivo) si hay un condicionamiento, la rata debería mostrar una conducta de
miedo (paralización) cuando se presente la luz solo. Para observarlo, se hace
un condicionamiento en el que la rata solo presiona la palanca, después
introducimos el condicionamiento de miedo, si se ha dado la asociación, la rata
presionará menos la palanca, ya que se paralizará por el miedo.
Medición indirecta de la respuesta de paralización:
1. Condicionamiento palanca-comida
2. Condicionamiento luz-descarga.
Primero hay un condicionamiento operante (se pretende que la rata esté dando
una respuesta, se asocia palanca-comida, incluso aprende qué tasa tiene que
dar para obtener la recompensa). Después, se introduce el condicionamiento
clásico del miedo, asociación estímulo neutro luz-descarga. Tras varias
asociaciones, se presenta la luz sola. Si ha generado miedo, la rata se
paralizará y dejará de hacer lo que estaba haciendo o hacerlo con menos
frecuencia, si antes a la palanca le daba con una frecuencia de 40, ahora 20 o
0.
Para saber si realmente hay condicionamiento del miedo, comparamos la
respuesta que daba antes, cuando no había condicionamiento, con la
respuesta que da ahora. Esto es la razón de supresión, cuánto suprime la rata
su conducta.
Razón de supresión= Respuestas durante el EC (luz) entre (/) Respuesta
durante el EC (luz) + Respuestas durante el pre-EC (antes de que empezase la

luz, palanca-comida).
La razón de supresión indica el nivel de condicionamiento en escala inversa
(0.5-0) donde el 0.5 es el valor más bajo de condicionamiento y 0 el más alto.
Si da 0, el condicionamiento es total.
Si después de la luz, le está dando igual y las respuestas siguen siendo 40, la
razón de supresión da 0.5, esto quiere decir que la rata no se ha condicionado
a la luz, no le provoca miedo.
 Condicionamiento del parpadeo (palpebral):
Reflejo palpebral-> parpadeo producido al soplar o acercar un objeto al ojo, es
un componente de la respuesta de sobresalto.
Preparación experimental desarrollada en conejos (son animales que no suelen
parpadear mucho) por Gormezano (1966):
Asociamos un estímulo neutro (EN) seguido de un soplo de aire, si tras
sucesivas asociaciones presentamos el EN en solitario y hay un parpadeo, nos
indica que ha habido un condicionamiento palpebral. EC (tono o luz 0.5 seg,
que antes era el EN) seguido de EI (soplo de aire o descarga 0.1 seg). La
observación de la respuesta condicionada (RC) de parpadeo en conejos
requiere varios cientos de ensayos.

 Seguimiento de señales o auto moldeamiento:


Paradigma desarrollado en palomas por Brown y Jenkins (1968).
Involucra una respuesta condicionada RC, por ejemplo, picoteo, hacia una
señal (luz) que marca la presencia del estímulo incondicionado (EI), comida.
Se cree que es debido a la fuerza que tienen las señales para indicar
estímulos, que son poderosos porque son adaptativos, tienen un valor evolutivo
importante para el individuo y tienen una valoración importante para el sujeto.
La paloma cada vez se acerca más y picotea más la luz, aumenta la tasa de
picoteo hacia la señal que marca la aparición del EC (luz).
El auto moldeamiento es un ejemplo de la fuerza que tienen los signos que nos
indican estímulos adaptativos.
La respuesta es voluntaria, no refleja. Es condicionamiento clásico (CC) y no
instrumental (CI) porque la aparición del estímulo incondicionado (EI) no
depende de la respuesta, la aparición de la comida no depende de la paloma.
La paloma no picotea la luz para obtener la comida, sino que asocia que va a
aparecer la comida cuando se presenta la luz.
La luz (EC) funciona como señal o signo de la aparición de la comida (EI),
desencadenando una respuesta condicionada (RC, en este caso, picotear la
luz).
La conducta aparece aun cuando el signo, la luz, EC,
aparece alejada del comedero, EI.
En cambio, la conducta no se da si la luz, EC, no está
visible/accesible y si no hay emparejamiento entre la
luz y la comida (EC-EI).

 Aprendizaje de aversión al sabor:


Nos permite saber qué sabores son beneficiosos y cuáles son perjudiciales.
Lo que asociamos es un estímulo condicionado EC sabor/alimento (no tiene
por qué novedoso), a un estímulo incondicionado EI-malestar (vómitos) -> se
genera una respuesta de aversión al sabor, supresión del consumo.
Tiene ciertas características especiales que lo hacen adaptativo: es muy rápido
(basta con un solo ensayo EN-EI/EC-EI) y efectivo (se da incluso tras horas
entre EN/EC y EI).
La respuesta condicionada RC de aversión al sabor (rechazo de consumo de
agua dulce), se da incluso habiendo pasado 6 horas entre la presentación de
EC y EI, lo que implica un aprendizaje de demora larga. Me ha producido
malestar, genero rechazo. Se presenta agua dulce porque es un estímulo
agradable, les gusta y muestran preferencia.
La aversión (o la preferencia) al sabor puede desencadenarse al asociar un
sabor neutro a otro ya desagradable (o agradable), lo que implica un
condicionamiento evaluativo.
4. CONDICIONAMIENTO CLÁSICO EXCITATORIO: Cond. Pavloviano
excitatorio
Todos los casos anteriores son ejemplos de condicionamiento clásico
excitatorio, en donde el animal aprende a asociar EC y EI, lo que provoca una
actividad conductual y neural relacionada con el EI aún en ausencia de este.
 ¿De qué depende es el condicionamiento?
De la relación temporal entre EC-EI, es decir, el intervalo entre estímulos o
intervalo EC-EI.
Hay varios procedimientos típicos del condicionamiento clásico CC, todos
pueden provocar la respuesta condicionada RC. Dependen de distintos
procesos y circuitos neurales:
 Condicionamiento de demora corta: hay menos de 1 minuto entre EC- EI, y el
primero puede extinguirse o seguir. Es el tipo de condicionamiento más
habitual y efectivo.
 Condicionamiento de huella: El periodo de tiempo que hay entre EC y EI lo
llamamos huella. Presentamos el EC, pasa un rato y aparece el EI. Hay un
espacio temporal en el que no hay nada, que haya condicionamiento depende
de que se cree esta “huella”, que implique una consolidación para poder
asociarlo con el EI. Este espacio temporal vacío, se llama intervalo de huella.
La eficacia del CC depende de que el EC sea buena señal de la aparición del
EI.
 Condicionamiento de demora larga (5-10 minutos), mucho más tiempo entre el
EC y el EI. En este caso, el EC continua.
 Condicionamiento simultáneo: los dos estímulos aparecen a la vez. Si
queremos asociar dos estímulos, esto es lo más efectivo.
 Condicionamiento retroactivo: inversión. EI-EC.

 ¿Cómo se mide el condicionamiento?


La eficacia del CC depende de que el EC sea buena señal de la aparición del
EI. Se realizan ensayos de prueba intercalados en los que se presenta el EC
en ausencia del EI y se mide la respuesta que provoca:
 Magnitud de la respuesta (cuánta respuesta R: gotas de saliva, reducción
de la preferencia del sabor…)
 Probabilidad de la respuesta (con qué frecuencia ocurre, con qué % de
ensayos el EC provoca la RC)
 Latencia de la respuesta (rapidez, cuánto tiempo pasa desde el EC hasta
la RC)
Estos ensayos son esenciales para estudiar el condicionamiento simultáneo y
retroactivo, porque no sabemos si la respuesta ha sido por asociación con el
EC o con el EI. Necesitamos poder aislarlo para ver si provoca la respuesta o
no.
 ¿Cómo asegurar que el condicionamiento funciona?
A través de los procedimientos de control. Distinguimos entre:
 Condicionamiento (cambio en la conducta por asociación de EC-EI
 Pseudocondicionamiento: cambio por mera presentación o contingencia
del EI
Lo ideal es utilizar situaciones de control. Debe tener condiciones muy
parecidas a las del procedimiento experimental. Si presentamos estímulos con
demora muy larga sin probabilidad de asociación y luego presentamos el EC
solo, no debería haber respuesta condicional.
Esta comparación es fundamental para ver
que nuestro procedimiento es efectivo.
Procedimientos de control:
 Control explícitamente no emparejado:
EC Y EI se presentan con una separación
suficiente para impedir su asociación, la
cual puede variar dependiendo de la
respuesta.
 EC y EI presentados en sesiones
diferentes
5. CONDICIONAMIENTO CLÁSICO
INHIBITORIO: Cond. Pavloviano inhibitorio
Aprendizaje de la ausencia de un evento o EI en función de otro evento o EC:
 Estímulo condicionado EC (luz)-Estímulo incondicionado EI (descarga)-> miedo
EC Excitatorio (EC+)
 EC (ruido)-EI (ausencia de descarga)-
>Inhibe miedo, causa alivio
EC Inhibitorio (EC-)
Para que haya esa inhibición, tiene
que haber una excitación
condicionada previa en la que el
estímulo neutro, asociado al estímulo
aversivo, me provoque miedo.
En una casa con peleas golpes…. cuando hay un portazo y se va el que causa
la pelea, el niño aprende que siempre que oye ese ruido del portazo, el
estímulo aversivo (persona que causa la pelea) desaparece, ese estímulo me
hace predecir que ya no pasa nada, se ha acabado la pelea. Para que esto se
dé, previamente tiene que haber una respuesta de miedo, excitatoria,
provocada por los gritos, los golpes…
 EC (luz)-EI (comida)->euforia EC+ (excitatorio)
 EC (tono)-EI (ausencia de
comida)->inhibe euforia,
causa frustración EC-
(inhibitorio)
Procedimientos típicos:
 Inhibición condicionada estándar: dos tipos de ensayos intercalados al azar,
A (condicionamiento excitatorio
EC+ y EI; Campana
EC+/Comida EI/Salivación RC) y
B (condicionamiento inhibitorio
EC+/EC- en ausencia de EI;
Campana EC+ y Luz EC-/No comida EI/Inhibición de salivación RC). Se
presentan los dos tipos de ensayos intercalada o aleatoriamente, durante el
entrenamiento. Tras varias repeticiones, el EC- adquiere propiedades
inhibitorias (su presencia hace que se inhiba la RC, si presentamos en
solitario EC- observamos la inhibición de la RC; la luz inhibe la respuesta de
salivación). Nos indica que es estándar el hecho de que se presentan el EC+
(campana) con el EC- (luz) a la vez, en el ensayo B.
 Inhibición diferencial: ensayos de EC+ (campana) seguidos de EI (comida)
entremezclados con ensayos de EC- (luz) no seguidos de EI (comida) (en
este caso no hay compuesto EC+/EC-). No se presentan juntos el excitatorio
con el inhibitorio. Ambos tipos de ensayos también se presentan
aleatoriamente. Tras varios ensayos se discriminaría entre uno y otro, donde
uno predice comida y el otro, ausencia de comida. La RC (salivación) solo
aparece en el EC+ (campana). A (campana EC+, comida EI, salivación RC) y
B (luz EC-, no comida EI, ausencia de salivación RC).
 Inhibición de demora y condicionamiento de huella: aunque se presente
EC seguido de EI, puede darse la inhibición condicionada si la demora es
muy larga, esto es, si el EC dura mucho y por tanto el intervalo entre
estímulos, o si el intervalo de huella es muy largo.
Si se presentasen más conjuntamente habría excitación, pero como se
presentan tan distanciados, produce inhibición. Si la demora del EC o la huella
entre el EC y el EI es muy prolongada (5-10mins), el animal se comporta como
si la parte inicial del EC señalase un periodo de ausencia del EI.
¿Cómo se mide el condicionamiento inhibitorio? La respuesta condicionada
RC ante el EC- debe ser opuesta a la RC ante el EC+
1. Sistema de respuestas bidireccionales, que suben y bajan en línea, por
ejemplo, la tasa cardíaca, la temperatura corporal, la respiración… Se
compara la respuesta ante el EC+ (alta) y ante el EC- (baja).
Ejemplo un tono condicionado a una descarga, y ahora el tono es excitatorio
porque produce respuesta de descarga. Por otro lado, una luz condicionada a
ausencia de descarga, inhibitorio. La respuesta de ambos estímulos debería
ser contraria, para ver si es verdad, nos fijamos en que con el tono la tasa
cardiaca o la sudoración, aumentarán, y con la luz disminuirán.
El problema está en que hay muchas respuestas que no son bidireccionales: si
un perro no saliva ante un EC, ¿se debe a que es un EC neutro que no se
condicionó? o ¿un EC inhibidor que marca ausencia de EI y por tanto se
reduce la respuesta? Es difícil saber cuál es la causa, hay que realizar pruebas
o diseños experimentales.
2. Prueba de sumación o del estímulo compuesto:
La presentación conjunta de EC+/EC- debería reducir la respuesta
condicionada RC (miedo) ante el EC+ (tono-descarga) debido a la inhibición del

EC- (luz-ausencia de descarga). Si un estímulo es incondicionado, y por tanto


reducirá la respuesta, en el caso de que se presente junto con un EC+
condicionado, esa sumación debería reducir la respuesta que se produce ante
el excitatorio. Probar esto requiere de un procedimiento de control con el que
poder comparar que efectivamente el EC- reduce la eficacia del EC+ y por
tanto es inhibidor.
Se realizó un estudio de la respuesta emocional
condicionada (Cole, Barnet y Miller, 1997):
Prueba de sumación: presentación conjunta EC+ y
EC- en ambos grupos. En el primer grupo, Grupo I
(inhibitorio) están unas ratas a las que se les
presenta un tono como EC+ para ver cómo
desciende la conducta, asociado a que va a haber
descarga, excitatorio. También hay una luz como EC-
que va en otro entrenamiento asociada a que no va a
haber descarga, se estima que funcione como
inhibitorio. Por otro lado, está el Grupo R (random), al que se le hace una
modificación, se presenta el tono como EC+ que predice descarga y la luz se
ha emparejado con la descarga de forma aleatoria (a veces se presenta con
descarga y a veces no (no hay contingencia), o que se varíe la demora…) para
que tengan las mismas condiciones en cuanto a que se han visto expuestos a
la luz y a la descarga.
Cuando en pruebas posteriores presentamos el tono EC+ con la luz, que al
grupo I se había condicionado como inhibitoria, se reduce la respuesta
condicionada de miedo (paralizarse, suprimir la presión de la palanca), en dicho
grupo I, en comparación con el grupo R, en el cual la luz no actúa como
inhibitorio. En el grupo I no presentan tanto miedo y tanta paralización como el
grupo R, al presentar EC+ y EC– juntos, la RC en el grupo en el que la luz se
presentó como EC- (grupo I), disminuirá, es decir, presentarán menor miedo
ante la combinación EC+-EC- (tono-luz), la razón de supresión es más alta por
lo que la paralización es menor, en comparación al grupo control. Esto quiere
decir que el EC- adquirió propiedades inhibitorias.
Eje horizontal de la gráfica: Adquisición. Eje vertical: tasa de supresión, el 0 o
cercano al 0 es condicionamiento total, ha dejado de hacer la respuesta
totalmente, se paraliza.
Para considerar un estímulo inhibitorio es necesario comprobar que en una
prueba de sumación inhiba a un estímulo excitatorio.

3. Prueba de retraso en la adquisición:


Si un estímulo es realmente inhibitorio, es más difícil que lo podamos asociar a
un estímulo incondicionado y que sea excitatorio, tardará más en provocar la
RC que si tenemos un estímulo neutro y tratamos de asociarlo con descarga y
que sea excitatorio.
El EC- (luz) tardará más ensayos en provocar la RC excitatoria (miedo y
supresión de la respuesta), que un EC neutro.
En el ejemplo anterior, el grupo I tardaría más ensayos en mostrar RC de
miedo y en suprimir su conducta, ante el EC- luz (al asociarse con descarga)
que el grupo R, donde la EC- luz era aleatoria y no inhibitoria.
Si vemos que hay un retraso en el condicionamiento excitatorio, es decir, la
curva de aprendizaje es más lenta, demuestra que el EC- tiene propiedades
inhibitorias.
6. EXTINCIÓN:
Procedimiento o resultado por el que el estímulo condicionado, EC se presenta
repetidas veces en ausencia del estímulo incondicionado, EI, que “se
esperaba”, causando así la reducción de la respuesta condicionada, RC, a
veces hasta su desaparición.
La ausencia de un EI esperado causará una reducción de la respuesta
condicionada de miedo, puede desaparecer. Se presenta tantas veces el EC en
ausencia de EI y se extingue la RC. No se debe al olvido, se debe a presentar
el EC sin nada
La extinción es diferente de la habituación, en ambas se reduce la respuesta
por la repetición del estímulo, pero en la extinción se reduce una respuesta
previamente aprendida, que no está presente en la habituación.
También es diferente del olvido, este se produce por el mero paso del tiempo
sin presencia del estímulo condicionado EC, mientras que la extinción implica
la presentación del EC, pero en ausencia del EI.
Pavlov consideraba que era un tipo de condicionamiento inhibitorio, sin
embargo, no lo es, pues no superaba la prueba de sumación ni la del retraso
en la adquisición.
La asociación EC-EI no se elimina, se establece una nueva: EC-ausencia de
EI.
Además, esa asociación EC-EI, no se pierde, se queda latente. Algunos
fenómenos que lo indican son:
 Desinhibición: la presentación de un nuevo estímulo junto con el EC
durante la fase de extinción provoca que el sujeto vuelva a ejecutar la
RC inmediatamente.
 Recuperación espontánea: si tras un tiempo volvemos a presentar el EC,
se puede observar la RC de nuevo.
 Renovación de la respuesta: el regreso al contexto de la adquisición
ocasiona una renovación de la RC.
 Restablecimiento: si el EI se presenta en solitario tras la extinción, se
vuelve a dar la RC ante el EC en una prueba posterior
7. MATERIAL COMPLEMENTARIO:
 Predominio del condicionamiento clásico:
La asociación entre estímulos (eventos que se suceden entre sí de manera
sistemática) es habitual en nuestro día a día. Aprendemos a predecir eventos
en presencia de otros, lo cual es adaptativo. Algunos ejemplos:
 Condicionamiento de preferencias o aversiones alimentarias
 Condicionamiento del miedo
 Lactancia
 Territorialidad y conducta reproductiva
 Tolerancia y dependencia a las drogas, las claves ambientales o contexto
en el que se consume la droga pueden condicionarse como ECs,
generando una respuesta condicionada compensatoria (se contrarresta su
efecto ayudando al individuo a recuperar su homeostasis); esto hace que el
efecto de la droga sea cada vez menor, algo adaptativo (lo que, a su vez,
genera tolerancia: el consumo repetido tiene cada vez menos efecto debido
a las respuestas compensatorias)
 Teorías del condicionamiento clásico: modelo de Rescorla-
Wagner (1972):
Se trata del modelo matemático formal más influyente en el aprendizaje
Postula que la cantidad de cambio que ocurre en la asociación entre un EC y
un EI depende de un error de predicción, o lo que es lo mismo, de cuánta sea
la sorpresa producida por la presentación del EI tras el EC: a mayor sorpresa, o
error de predicción, más aprendizaje.
El nivel de sorpresa y, por tanto, la eficacia del EI depende de qué tan diferente
sea el EI de lo que el individuo espera:
 EI inesperadamente grande-> condicionamiento excitatorio o incremento en
el valor asociativo
 EI inesperadamente pequeño o ausencia de EI -> condicionamiento
inhibitorio o disminución en el valor asociativo
Para que un EC potencial se asocia a un EI, el EC debe proporcionar
información nueva y valiosa que ayude al animal o a la persona a predecir
el futuro
Según el modelo, se puede determinar el nivel de aprendizaje en cada ensayo
calculando el error de predicción: Error de predicción= EI real – EI esperado.
El EI real es 100 si se presenta y 0 si no lo hace. El EI esperado es la suma de
los pesos de todas las señales que se presentan en ese ensayo.
Siguiendo esta ecuación y sus derivaciones, el modelo es capaz de explicar
muchos de los fenómenos de aprendizaje observados en el laboratorio, por
ejemplo, el fenómeno de bloqueo (Kamin, 1968):
 Fase 1: Luz-> EI
Al principio del entrenamiento:
EI esperado= V. Luz= 0 // Error de predicción= EI real-EI esperado= 100-0=
100
Tras el entrenamiento, el peso de esta señal V. luz es casi igual a 100 (cada
vez que se presenta la luz, el animal hace una
predicción 100% perfecta de que a continuación se
presentará el EI).
 Fase 2: Tono + luz -> EI, como el peso de la luz ya es
casi igual a 100, la predicción del EI es perfecta, así
que el error de predicción es 0. Por lo tanto, según la
ecuación, no hay más cambio en ninguno de los pesos.
Así, el peso del tono se quedará estancado en 0 y no
cambiará, no importa cuántas veces se empareje el
compuesto tono-luz con la descarga.
 Fase 3: Luz y tono presentados en solitario en ensayo
de prueba –> fuerte respuesta a la luz, pero poca o

ninguna
respuesta al
tono.
 Bases cerebrales:
 Cerebelo:
Papel relevante en
el aprendizaje
de respuestas
motoras por
condicionamiento clásico, por ejemplo, condicionamiento palpebral.
Se ha demostrado que la lesión en esta estructura, bien en el núcleo interpósito
o en la corteza cerebelosa, provoca la disminución/degradación o la total
eliminación de la RC de parpadeo, respectivamente:
 Núcleo interpósito: formación y desempeño de la respuesta
condicionada
 Corteza cerebelosa: sincronización de la respuesta condicionada
Sin embargo, la lesión en el cerebelo no afecta a otras formas de aprendizaje
asociativo más complejas que el condicionamiento motor, como el aprendizaje
de asociaciones verbales, las cuales dependen probablemente de otras
estructuras, como el hipocampo.
 Hipocampo (lóbulo temporal izquierdo y derecho):
Estructura fundamental para almacenar las memorias de nuevos hechos y
eventos autobiográficos.
Gran activación durante el condicionamiento, en especial al inicio del
entrenamiento.
No parece implicado en la adquisición de respuestas condicionadas básicas
como la RC de parpadeo (una lesión hipocampal no impide este aprendizaje).
Sin embargo, la lesión hipocampal impide la adquisición de respuestas
condicionadas complejas, como la que se da en la inhibición latente.
La preexposición al EC provoca un aprendizaje más lento de la asociación EC-
EI. Este fenómeno no ocurre en condiciones de lesión hipocampal
(específicamente en la corteza entorrinal)

TEMA 5: CONDICIONAMIENTO INSTRUMENTAL: FUNDAMENTOS Y


MECANISMOS

 Eficacia de los reforzadores


La eficacia de los reforzadores depende de varios factores:
1. Cantidad y calidad: cuanta mayor magnitud y calidad
del reforzador, mayor probabilidad hay de que la
frecuencia de la R aumente (aunque depende del tipo
de respuesta (p.ej., demasiada comida → poca
frecuencia apretar palanca).
2. Experiencia previa del sujeto: determina la expectativa
ante un reforzador (p.ej., recompensas grandes
funcionan mejor para aumentar la conducta si el sujeto
ha recibido recompensas pequeñas antes, lo que se conoce como
contraste positivo –vs. contraste negativo, donde la R disminuye por

haberse reforzado con un E de menor valor que con el que se había


reforzado anteriormente)
 Relación R-C
A veces existe una fuerte relación entre la respuesta y la consecuencia (meter
moneda en máquina de café – obtener café), pero otras veces no existe tal
relación a pesar de que se haya hecho una acción determinada (llevar un gorro
al examen – aprobar) A veces se da una conducta que no tiene ninguna
consecuencia o no tiene la consecuencia buscada, mientras que otras veces la
consecuencia no se da a no ser que se de una R.

→Una conducta (instrumental) eficiente requiere que se sea sensible a la


relación entre respuesta y reforzador.

Existen dos tipos de relaciones entre la R y sus C: relación temporal y relación


causal
 RELACIÓN TEMPORAL: contigüidad,
 Relación temporal entre una conducta y la consecuencia,
 Entrega del reforzador inmediatamente después de la R.

El aprendizaje es mejor si la C que sigue a la R es inmediata, y disminuye si
hay una demora significativa entre ambos, debido en parte a que con una
demora se hace difícil saber a qué respuesta se debe la aparición del
reforzador.

Ejemplo de estudio que ilustra el efecto de esa demora en el aprendizaje:


Ratas presionando palanca y obteniendo comida. Se ve que a mayor demora
(mayor tiempo entre R y reforzador) la respuesta tarda más en
adquirirse/consolidarse. Cuando la demora es de 0 (haces algo e
inmediatamente te dan el reforzador), aprendes que haces algo y te lo dan, se
consolida la R mucho más rápido. Si la demora es de 4 segundos, la
acumulación de respuestas es mucho más larga en el tiempo. Si la demora es
de 10 segundos, tardamos aún más. Dependiendo de la demora será más lento
o rápido el aprendizaje.
Hay veces que es inevitable la demora, por lo que existen algunos métodos
para asegurar el aprendizaje con demora de reforzador:
1 Uso de reforzadores secundarios o condicionados: aquellos reforzadores
asociados a un reforzador primario, y que por tanto han quedado como
si fuesen un reforzador primario, y vale por ello. Se asocia algo neutro
(un trozo de papel en blanco) con algo reforzante (un juguete). (vale por
un juguete, pero te lo doy al final del trimestre si me traes buenas notas,
eso hasta dentro de mucho no va a pasar, por lo que hace que sea más
difícil la asociación, así que lo rellenamos con el vale). Con animales, el
reforzador es comida, pero hasta el final de la tarea no se da, asique
mientras tanto puede haber reforzadores verbales, “venga si, sigue así”
con determinada entonación.
2 Procedimiento marcado: marcar la respuesta instrumental de alguna
manera con el objetivo de distinguirla de otras (con un tono durante o
justo después de la R) se intenta atraer la atención de que esa es la
conducta, y no otra de las muchas que realiza (cuando la rata presiona
la palanca, suena el tono, así, aunque la comida se dé más tarde, sabe
que ha sido por la palanca). Si el tono, la marca, se presenta en
cercanía temporal al reforzador, provocará condicionamiento clásico que
anulará el aprendizaje instrumental, ya que estaríamos obteniendo un
estímulo neutro condicionado (tono) asociado a un estímulo
incondicionado (comida).
Uno de los experimentos de Skinner puso de relieve la importancia de la
contigüidad en el aprendizaje instrumental. Colocó las palomas en la caja de
experimentación, a todas les dio un premio o reforzador cada 15 segundos,
independientemente de lo que hicieran.. 6/8 casos las respuestas eran muy
definidas, cada una hacia cosas super concretas (Una paloma se condiciono a
girar en sentido inverso a las manecillas del reloj, alrededor de la jaula,
haciendo dos o tres giros entre reforzamientos. Otra atacaba con la cabeza una
de las esquinas superiores de la caja. La tercera desarrollo una respuesta de
sacudida, como si colocara la cabeza debajo de una barrera invisible y la
levantara de manera repetida.), cada paloma estaba haciendo una especie de
conductas, que él llamó rituales, ya que eran muy complejas.
Concluyó que los animales se comportan como si su conducta controlase la
aparición del reforzador, por lo que llamó a esta conducta: conducta
supersticiosa, hay un reforzamiento accidental, fortuito entre una R con
entrega del reforzador en la que cualquier R dada antes del reforzador se
fortalecerá e incrementará por el reforzamiento accidental o adventicio. (Llevas
una camiseta concreta a un examen y apruebas y ya la llevas a todos los
exámenes pensando que por ello vas a aprobar).

Esta conclusión apoya la idea de que la contigüidad es la clave para el


aprendizaje (contigüidad accidental entre la respuesta y el reforzador). Sin
embargo, otros estudios que ampliaron este primer estudio, han puesto en
entredicho esta conclusión: Staddon y Simmelhag replicaron el experimento de
Skinner y midieron la frecuencia de muchas conductas (picoteo, acicalamiento,
girar…) y su aparición, vieron que había algunas conductas que aparecían más
en todas las palomas en un momento entre haber entregado un reforzador y el
siguiente, eran mucho más probables unas conductas y no otras en el medio
del intervalo (interinas, dar vueltas, picotear el suelo…), y otras distintas eran
más probables justo antes de que se fuera a entregar el reforzador (terminales,
acercarse al comedero, picotearlo…) Por esto, se concluyó que no era tan
aleatorio, sino que podía estar ya determinado.
Observaron:
- Respuestas interinas: en el medio del intervalo, cuando falta mucho
para el reforzador
- Respuestas terminales: al final del intervalo, cuando el reforzador está
próximo.

Las respuestas interinas y terminales son conductas que un sujeto emite de


forma innata cuando está “esperando” la aparición del reforzador (mientras que
las supersticiosas se mantienen por reforzamiento aleatorio entre R y C)

Por lo tanto, podemos definir esta relación temporal y de contigüidad como el


grado en que la entrega del reforzador depende de que antes haya ocurrido la
respuesta instrumental (la conducta controla la aparición del reforzador).
La dificultad en el aprendizaje cuando hay demora en el reforzamiento, incluso
cuando la relación causal es perfecta, indica la importancia de la contigüidad.

Sin embargo, la contingencia o relación causal también es determinante.

RELACIÓN CAUSAL: Contingencia: relación de causa, grado en el que la


conducta instrumental es necesaria para la presentación del reforzador.

Los estudios más determinantes sobre la sensibilidad de la conducta a la


contingencia entre respuesta y reforzador son los relativos al efecto de la
indefensión aprendida (Overmier y Seligman, 1967; Seligman y Maier, 1967).
El que es probablemente uno de los mejores modelos animales en depresión
(contribución acerca de los mecanismos de estrés y afrontamiento a nivel
conductual, hormonal y neurofisiológico) Podemos ver un claro ejemplo de esta
indefensión aprendida. Por ejemplo, un elefante bebé que por más que tira de
las cadenas que está atado no puede irse. Por eso, cuando es mayor aun
estando libre ni siquiera trata de escapar. Esta indefensión parece ser uno de
los componentes de la depresión humana. En laboratorio, se ha visto que las
ratas que muestran indefensión aprendida no hacen nada por evitar descargas,
pero al administrarlas un antidepresivo se activan algo más.

 ¿Cómo se empezó a estudiar el paradigma de la indefensión aprendida?


Unos investigadores expusieron un perro ante una descarga con un estímulo
previo (tono-descarga) y después, en fase posterior se realizó un
condicionamiento instrumental para ver si el perro con su conducta escapa de
la descarga de la que ha estado previamente expuesto, viendo si se ve
significativamente el efecto del condicionamiento instrumental, si el perro
hacía por evitarlo.

Se dividieron en 3 grupos
 En el Grupo E o escapable, podían evitar la descarga con su conducta.
 En el Grupo A o acoplado con su conducta no podían hacer nada, no
existía una contingencia entre la respuesta que ellos den y que eso deje
de pasar o no (como si yo salto para que deje de llover)
 En el grupo C o confinado, estaban en una sala con el resto, pero no
recibían ninguna descarga.

Es una fase de condicionamiento instrumental, para ver si hay una evitación o


un escape, se presenta una señal, un estímulo discriminativo y los perros del
grupo E aprenden rápido como evitarla o escapar de ella.
El grupo A, no son capaces de escapar a pesar de que su conducta ahora sí es
contingente.
El grupo C, tarda el doble ya que no tenía la experiencia interior de evitación de
la descarga, pero aún así buscan escapatoria.
Las descargas inescapables generaban en los animales del grupo A la
expectativa de que su conducta no tenía ningún efecto sobre las
consecuencias aversivas que experimentaba (aprendían que la aparición de las
descargas era incontrolable, no contingente, independiente de su conducta).
La diferencia entre los grupos E y A es que en el primero hay contingencia
entre respuesta y consecuencia mientras que en el segundo no. Que el
aprendizaje (de la evitación, en este caso) sea diferente entre ambos grupos
indica que los animales son sensibles a la contingencia respuesta –
consecuencia.

Hipótesis de la indefensión aprendida: la exposición a un E punitivo


incontrolable enseña la expectativa de que las R son inútiles, lo que a su vez
implica:
- la motivación para intentar respuestas de evitación nuevas disminuye
- aun en el caso de llevar a cabo conductas de evitación, les cuesta más
aprender la contingencia (que la conducta es eficaz para obtener el
reforzador).

Esta conducta tiene serias implicaciones para la conducta humana: trastorno


de estrés postraumático, depresión, abuso, envejecimiento, rendimiento
académico, etc.

 ¿Cómo podemos limitar el efecto de la indefensión aprendida?

Se intentaron muchas cosas para que los perros generaran una conducta,
como llamarle con comida… Si le obligaban a saltar y después de varias
repeticiones, el perro veía al final la existencia de esta contingencia
Seligman → la indefensión aprendida es un componente importante de la
depresión humana (tristeza acompañada de una pérdida general de iniciativa y
actividad).

Formas de limitar el efecto de la indefensión aprendida:

- El animal aprende a escapar si se le fuerza a hacerlo: si se enseña a los


pacientes deprimidos formas explícitas de escapar a sus circunstancias (o de
cambiarlas), puede que con el tiempo también aprendan a realizar los cambios
por sí mismos
- Generar inmunización o prevenir la indefensión, si el animal experimenta
descargas ante las que poder escapar, es posible que estas bloqueen el efecto
de la indefensión aprendida si en el futuro se le presentan otras no escapables:
si una persona ha superado adversidades es posible que esto la inmunice
contra el desamparo aprendido en futuros desafíos más difíciles. Es decir, si
consigue ver que existe una contingencia, será más probable que sea capaz de
escapar la próxima vez de esta situación

CONDUCTA DE ELECCIÓN:
En condicionamiento instrumental siempre hablamos de respuesta-
consecuencia, pero lo que realmente suele ocurrir es que nosotros podemos
elegir entre varias respuestas, decidimos entre varias opciones que están bajo
programas de reforzamiento diferentes, unas tienen una respuesta, otras otra a
largo o corto plazo… Es importante entender como se produce esta conducta
de elección, cómo actuamos cuando tenemos varias opciones. La forma más
sencilla, es hacerlo mediante un PROGRAMA CONCURRENTE en la que
tenemos dos alternativas, por ejemplo la paloma no solo tiene una tecla a la
que picotear, si no dos y puede elegir la que quiere. Cada opción tiene un
programa de reforzamiento diferente ¿Cómo distribuye sus picoteos? Lo que se
observa es que el organismo decide lo que es más ventajoso.

Para medir la CE en los programas concurrentes se calcula la tasa relativa de


respuestas para cada alternativa, por ejemplo, para la tecla izquierda (lo mismo
para la derecha):

- Si la frecuencia es igual en las dos teclas de R, la razón


será = 0.5. - Si la tasa de R en la tecla izquierda es mayor
que en la derecha, la razón será > 0.5. - Si la tasa de R en
la tecla izquierda es menor que en la derecha, la razón
será < 0.5.

De forma similar se puede calcular la tasa relativa de reforzamiento obtenida


para cada R, por ejemplo para la tecla izquierda (lo mismo para la derecha):

Por ejemplo, si el mismo programa de intervalo


variable está disponible para cada alternativa de R,
la paloma picoteará ambas teclas con la misma
frecuencia (misma tasa relativa de R, 0.5) y por tanto
la tasa de reforzamiento para cada alternativa será
también la misma (0.5)

LEY DE IGUALACIÓN: tenemos dos teclas con dos programas de


reforzamiento diferentes (intervalo variable 6 e intervalo variable 2) La tasa
relativa de respuestas para una se iguala o muestra una igual tasa de
reforzamiento para esa tecla. Si las palomas tienen más reforzadores en el A,
darán más respuestas. Lo que implica esto que si tienen una opción en la que
tienes más ventajas, darán más respuestas en relación a este y la tasa de
respuestas del otro lado se verá reducida, de lo que deducimos que la tasa de
respuestas depende de ambas teclas.
La opción más ventajosa será más dada, lo que obviamente no depende
únicamente de su reforzamiento también del de la otra.

PRINCIPIO DE PREMACK

La oportunidad de desempeñar una conducta muy frecuente o preferida puede


reforzar una conducta menos frecuente o preferida. Es decir, podemos utilizar
esta conducta preferida restringiéndola y condicionándola para que se realiza la
menos preferida. El poder hacer los deberes para acceder a ver la televisión,
aumenta la proporción d la conducta menos preferida. Restringimos ver la tele
como reforzador para poder aumentar la otra conducta.

Si tenemos conducta de elección, también podemos hablar de Autocontrol

Pusieron a prueba dos procedimientos:


1) Elección directa: ambas recompensas (la pequeña e inmediata y la
grande y demorada) estaban disponibles justo después de la R de
elección.
2) Encadenado-concurrente: los componentes terminales (en negro,
tiempo de espera hasta reforzador) introducían una demora después de
realizar la elección inicial. Solo en este caso las palomas mostraban
autocontrol. Es decir, la preferencia cambia a medida que se exige que
los participantes esperen más tiempo para recibir cualquiera de las
recompensas después de hacer su elección
Se da una función de descuento del valor. El valor de la recompensa pequeña
se percibe mejor que el valor de la recompensa grande. En el T1, la pequeña
vale más de lo que vale la grande. Si pasa más tiempo entre las dos. Las
funciones se invierten

Aumentar la demora de ambas recompensas (la pequeña y la grande) hace


más fácil mostrar autocontrol, pues las funciones de descuento del valor de las
dos recompensas se cruzan con las demoras más largas (T2), lo que hace más
atractiva a la recompensa mayor demorada.

CONTROL AVERSIVO DEL CONDICIONAMIENTO INSTRUMENTAL

LOS CASTIGOS

Inicialmente, tanto Thorndike como Skinner consideraban que el reforzamiento


era mucho más eficaz que el castigo para controlar la conducta.
Investigaciones más modernas consideran, sin embargo, que el castigo es muy
eficaz si se aplica de forma correcta.
Factores para considerar:
1) Los estímulos discriminativos del castigo pueden alentar las trampas: los
estímulos discriminativos también indican si una respuesta será castigada;
en este caso, el castigo no enseña al individuo a no hacer la conducta, sino
a no hacerla en presencia de ese estímulo.
2) El reforzamiento concurrente puede debilitar al castigo: si la conducta a
castigar también es reforzada, los efectos del castigo se ven
contrarrestados.
3) La intensidad inicial es importante: el castigo es más eficaz si desde el inicio
se usa un estímulo punitivo fuerte en lugar de ser de intensidad leve o
gradual (los castigos iniciales más leves reducen la eficacia de castigos
posteriores más severos).
4) Que sea consistente (que aparezca de forma contingente a la respuesta a
eliminar).
5) Que exista una conducta alternativa a reforzar (reforzamiento diferencial de
otras conductas alternativas, RDO)

En definitiva, el castigo es efectivo cuando se administra de inmediato, con


severidad y en forma consistente, y en la medida en que se ofrecen al
organismo comportamientos alternativos. Aunque sea eficaz para reducir la
frecuencia de una conducta indeseada, por sí mismo no conduce al sujeto al
desarrollo de una conducta alternativa deseable ni impide que en el futuro la R
indeseable se repita, una vez se disipe la carga emocional que implica. A
veces, paradójicamente, el castigo se convierte en un fin en sí mismo (supone
atención, un poderoso reforzador de la conducta, en este caso conducta
indeseable). Supone, además, distintos problemas: la estimulación aversiva
puede asociarse a otros estímulos presentes en la situación (los cuales pueden
a su vez inhibir otras conductas deseables) y a la propia persona que aplica el
castigo (en lugar de a la R a eliminar).

REFORZAMIENTO POR OMISIÓN


Alternativa al castigo positivo para controlar la conducta. Se establece una
contingencia negativa entre la R y el reforzador: el sujeto debe omitir la
respuesta para que aparezca el reforzador (castigo negativo).
 También se denomina reforzamiento diferencial de otra conducta (RDO),
donde el reforzador está disponible siempre y cuando se realice otra
conducta alternativa.
 La R instrumental impide la entrega de un E placentero o apetitivo (p.ej.,
portarse mal → quedarse sin chucherías); emitir la R objetivo tiene como
resultado la supresión de la recompensa que se habría entregado si el
individuo hubiese realizado otra R (se refuerza la alternativa).
 Es preferible al castigo positivo porque no implica la aplicación de un
estímulo aversivo; además, a largo plazo supone la eliminación de la
conducta objetivo y es muy resistente al reacondicionamiento.
EXTINCIÓN

Alternativa al castigo positivo para controlar la conducta. Si una conducta se


presenta sin reforzamiento o con un reforzador de menor magnitud (contraste
negativo), causará una disminución en la frecuencia de la misma.
 Se rompe la contingencia (positiva o negativa) existente entre conducta
y reforzador (R – Reforzorzado, ausencia de R – Reforzador, donde la
contingencia es + y -, respectivamente), en presencia de un estímulo
discriminativo.
 Es muy eficaz (sobre todo en combinación con Ref+ de R alternativa)
pero requiere no sólo de la identificación del reforzador sino el control
sobre la aparición de dichos reforzadores.
 La R puede empeorar antes de reducirse, pero se debe continuar con la
extinción. Puede provocar fuertes efectos emocionales → frustración,
que en ocasiones puede ser lo bastante intensa como para provocar
agresión (hacia otros).

No implica un desaprendizaje o un olvido, sino un nuevo aprendizaje


(asociación inhibitoria E-R). La R extinguida puede reaparecer si hay un cambio
en el contexto, un nuevo contacto con el E discriminativo extinguido o una
nueva exposición al reforzador.
 Fenómenos que lo indican (visto también en condicionamiento clásico):
- Recuperación espontánea: la conducta puede reaparecer tras un
periodo de descanso.
-Renovación de la R: recuperación del desempeño mostrado en la
adquisición cuando se cambian las señales contextuales que estaban
presentes durante la extinción (p.ej., volver al contexto original).
-Restablecimiento de la R: la recuperación de la R condicionada como
consecuencia de la exposición al estímulo incondicionado o
discriminativo.
¿Como mejorar la extinción? → más ensayos (mejor masivos que espaciados),
en distintos contextos.

CONDICIONAMIENTO INSTRUMENTAL- SUSTRATO CEREBRAL

El condicionamiento instrumental implica asociación E – R – C. El


procesamiento de esta información implica varias regiones cerebrales,
incluyendo: cortezas sensoriales primarias (visual, somatosensorial) que
reciben el E, corteza frontal (que permite la toma de decisión de realizar la
respuesta voluntaria) y sistema motor (corteza motora y ganglios basales,
conectados con corteza motora).

En esta respuesta también se ve implicado un sistema de reforzamiento


cerebral, que permite el aprendizaje de la respuesta instrumental
(consecuencia):

Que la conexión E-R (entre sistema visual y motor) se fortalezca y haya


aprendizaje depende del sistema de reforzamiento: La R de leer un libro, la
comida, el dinero, drogas, etc. puede activar este sistema de reforzamiento; la
convergencia de entradas visuales y del sistema de reforzamiento fortalece la
activación del sistema motor y, por tanto, del aprendizaje.

PRÁCTICA 1: APRENDZAJE PROCEDIMENTAL

Aprendizaje implícito (no declarativo) que se lleva a cabo de forma


inconsciente a partir de la práctica repetida. Permite la automatización de
una tarea mediante la adquisición de una secuencia estereotipada de
acciones u operaciones mentales. Tres fases: cognitiva, asociativa y
autónoma.

Evoluciona desde el uso de reglas verbales (información declarativa), la


práctica consciente y controlada y la ejecución lenta, serial y con errores a
una ejecución automatizada, más rápida y precisa (información
procedimental). Depende del cerebelo, corteza motora (frontal) y
estructuras subcorticales como el estriado (en ganglios basales). Se clasifica
en dos tipo: perceptivo-motor y cognitivo

1- Aprendizaje perceptivo-motor: Respuesta motora a un determinado


estímulo sensorial.
Evaluación → Tarea de tiempo de reacción serial (Nissen and Bullemer,
1987)
Aparecen dos secuencias, una serial (pulsar siempre las mismas 4 teclas)
y una aleatoria (teclas distintas). A lo largo de las presentaciones, la
condición serial va mostrando una reducción gradual de los tiempos de
reacción, dando como resultado una pendiente más pronunciada que en
la condición aleatoria.

En este gráfico de líneas, podemos ver una línea de tendencia lineal que
indica la sentencia que llevan los datos, y en la que también puede aparecer
una pendiente negativa que nos índice que los tiempos de ejecución
disminuyen indicando un aprendizaje procedimental (y = -72,15x + 1548,5)

En la aleatoria, como no se repite no hay tendencia ni patrón motor por lo


que la ejecución no suele mejorar. La línea es estable y la tendencia tiende
a 0, no es negativa.
Por lo tanto, solo podemos decir que existe aprendizaje procedimental en la
serie con condición aleatoria, porque cuando es secuencial, puedo adquirir
un patrón motor y reducir mis tiempos aumentan la velocidad y la
automización.

En mi caso si disminuye la pendiente, pero no existe un aprendizaje


procedimental, podemos relacionarlo con un aumento de la atención o de la
soltura con las teclas.

¿Dónde tiene lugar este aprendizaje? Cerebro, corteza motora y GB. La


estimulación eléctrica del cerebelo mediante tDCS mejora el aprendizaje
procedimental en condicional con la condición de control. Lo que demuestra
la implicación del cerebelo en el aprendizaje implícito de secuencias
motoras.
2- Aprendizaje procedimental de tipo más cognitivo

Entra en juego monitorización, solución de problemas… Lo evaluamos


mediante el ejercicio de la Torre de Hanoi y vemos una clara muestra de la
Ley de Potencia: el tiempo que se tarda en realizar la tarea se reduce con la
práctica a u. Es decir, empezamos resolviendo el problema de forma torpe,
y vamos mejorando pero llega un punto en el que no podemos mejorar más,
cogemos estrategias motoras sin darnos apenas cuenta.

PRÁCTICA 2. APRENDIZAJE NO ASOCIATIVO

En esta práctica trabajamos el efeto de habituación de la respuesta de


orientación. Se presenta un sonido de forma aleatoria, y se mide si hay
respuesta y la intensidad de esta. Este fenómeno de habituación nos indica
que la respuesta de orientación de los sujetos experimentales al sonido se
redujo a lo largo de las exposiciones al mismo

DISTRACTORES
3.5
3
VD: respuesta de 2.5
orientación 2
VI: tiempo 1.5
1
0.5
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

DISTRACTORES

La primera presentación del sonido produce un sobresalto en el sujeto, pero


este se va adecuando debido a la exposición repetida al sonido. Los
siguientes picos corresponden a fenómenos de recuperación espontánea y
cambio de sonidos. La recuperación espontánea se produce por un periodo
de descanso sin presentación de estímulo y por el paso del tiempo y la
ausencia de exposición al estímulo durante este.

Podemos afirmar que este fenómeno presenta especificad de estímulo, ya


que la respuesta habituada se renueva con la aparición de otro estímulo con
características sensoriales diferentes.

PRÁCTICA 3: APRENDIZAJE ASOCIATIVO (CONDICIONAMIENTO


CLÁSICO)
-Conceptos
 Estímulo incondicionado, que provoca una respuesta amplia y
medible desde el inicio, y al unirse con él EN produce una respuesta
incondicionada
 Respuesta incondicionada en este caso la salivación producida antes
de empezar el experimento.
 Estímulo neutro
 Estímulo condicionado
 Respuesta condicionada: que elicita la respuesta después del
emparejamiento con el EI, posteriormente se llama estímulo
condicionado (EC). Por último, la RC es la que se termina
provocando.

En esta práctica hemos visto que la presentación repetida de un estímulo


neutro, como una palabra, y uno incondicionado, como una solución dulce,
provoca:
a) La asociación gradual entre ambos estímulos
b) La RC ante la presentación del estímulo inicialmente neutro
Aparece una fase de adquisición en la que el objetivo es implantar las bases
de la asociación entre los estímulos; una fase de generalización en la que se
utilizan palabras diferentes a las utilizadas anteriormente y por último una
fase de readquisición que es similar a la primera pero con un menor número
de ensayos.

PRÁCTICA 4: FORMACIÓN DE PREFERENCIAS, APRENDIZAJE ASOCIATIVO


(EVALUATIVO) VS NO ASOCIATIVO

En esta práctica, valoramos una serie de letras chinas que iban saliendo en
la pantalla.
Al analizar los resultados, aparecen mejores puntuaciones en aquellas que
han salido más
Esto se llama el “efecto de la mera exposición” es una modalidad de
aprendizaje no asociativo y muestra la existencia de una preferencia
inconsciente por los estímulos a los que estamos expuestos con más
frecuencia.
 Distintas teorías explicativas:

-Teoría de reducción de la incertidumbre: La exposición repetida al estímulo


reduce la competición entre las distintas R hacia ese E, lo se interpreta
como agradable y esto se atribuye al mismo
-Teoría de la fluidez perceptiva: el estímulo repetido es más fácil de percibir
que otro similar y nuevo, fluidez que es atribuida a ese estímulo
El estudio de la formación de preferencias (por ejemplo, mediante
exposición repetida a estímulos) tiene gran importancia en el ámbito de la
conducta de consumo (p.ej., preferencia por marcas y productos).
Para estudiar este efecto, comprobaremos los valores de preferencia
obtenidos para cada tipo de estímulo en la escala (conjunto de datos de
todos los alumnos participantes en la sesión).
En la sesión 2, hacemos lo mismo, pero con una serie de símbolos gráficos
seguidos de determinadas imágenes. En este caso aparece vemos que el
condicionamiento clásico, al igual que la mera exposición a los estímulos,
también permite la formación de repuestas afectivas (preferencia) hacia
estímulos novedosos.
El emparejamiento de estímulos originalmente neutros con otros cargados
de connotaciones afectivas y motivacionales modifica las actitudes y
preferencias estos.
El condicionamiento clásico es uno de los procesos responsables de la
formación de respuestas afectivas hacia marcas y productos, tal como
demostraron trabajos pioneros
-Gorn (1982): presentación EC boli beige/azul – EI música +/-
-Groenland y Schoormans (1994): EC – estado ánimo +/-

Este fenómeno se le denomina aprendizaje evaluativo: nuestro agrado o


aprecio por un estímulo cambia en virtud de que ese estímulo se asocie con
algo que nos gusta o nos disgusta (se condiciona una respuesta evaluativa
en lugar de una fisiológica) y se utilixa también en el ámbito de la
publicidad.

El aprendizaje evaluativo tiene características particulares:


- No existe correlación entre conciencia de relación EC-EI y nivel de
aprendizaje
- Se puede dar de manera subliminal
- Retroactivo: se puede establecer independientemente del orden de
presentación (EI-EC)

MERA EXPOSICIÓN VS CONDICIONAMIENTO CLÁSICO


¿Qué procedimiento es más útil para la formación de preferencias?
Distintos estudios han encontrado que la eficacia de ambos
procedimientos varía dependiendo de distintas variables:
- La mera exposición depende de la frecuencia y se ha observado su
mayor efectividad en condiciones de presentación subliminal o
enmascarada
- El condicionamiento clásico depende de variables como la
contigüidad (presentación conjunta), contingencia (correlación EC-
EI), frecuencia de asociación
Distintos estudios han demostrado la similar utilidad de ambos
procedimientos para
la formación de preferencias.

PRÁCTICA 5: CONTIGÜIDAD, CONTINGENCIA Y CAUSALIDAD

CARACTERÍSTICAS DE LOS ESTÍMULOS:


- Intensidad y saliencia
- Novedad (preexposición al EC y al EI)
- Naturaleza (relevancia, fuerza biológica; fenómenos de
condicionamiento de segundo orden, contracondicionamiento y
precondicionamiento sensorial)
- Contigüidad

¿Cómo se asocian estos?  CONTINGENCIA

Contigüidad
1. Intervalo EC-EI:
-La RC es mas fuerte cuanto más corto es el intervalo EC-EI.
-Intervalos más cortos implican RC de orientación al EC, mientras que
intervalos más grandes suponen orientación hacia el EI.
2. Intervalo entre ensayos:
El condicionamiento es mejor si los ensayos de asociación EC-EI están más
distanciados en el tiempo.
Las mejores condiciones para el aprendizaje implican intervalo EC-EI corto
con ensayos distanciados en el tiempo.

La contigüidad entre dos E (que EC-EI se presenten juntos, relación


temporal) no implica necesariamente que se de un aprendizaje asociativo
entre ambos.
La contingencia o grado de correlación entre el EC y el EI es fundamental
para que se establezca una relación causal entre ambos.
Conocer la contingencia permite medir el grado en que un EC predice la
aparición del EI. Posibles alternativas de emparejamiento de EC-EI:

EXPERIMENTO ALERGÍAS

Las dos combinaciones de estímulos AX y BX presentan una correlación de


co- ocurrencia con el EI diferente en las dos tareas (condiciones):
Condición 1: la combinación AX (fresas – gambas) y BX (cacahutes –
gambas) se correlacionaban igual con la aparición o no aparición del EI
(r=0.5 para cada combinación)
la diferencia entre las dos combinaciones en la probabilidad de causar EI
es 0.
Condición 2: la combinación AX (fresas – gambas) se asoció siempre con la
aparición del EI (r=1) y BX con la ausencia del EI (r=0).
la diferencia entre las dos combinaciones en la probabilidad de causar EI
es 1.

La clave en este experimento es que la probabilidad de considerar el


estímulo X como causante de la aparición del EI decae en las condición 2, a
pesar de presentarse siempre asociado al EI (a pesar de la contigüidad).
El estímulo X se presenta siempre en contigüidad con EI (se asoció de
manera equivalente con el EI en cada condición de entrenamiento);
sin embargo, la presentación de A y B en una correlación diferente con la
aparición o no del EI en la condición 2 (r= 1 y r=0) provoca una reducción
en la capacidad predictiva del estímulo X,
en comparación con la condición 1, donde la presentación de A y B no
mostraba una correlación diferente en su asociación o no con el EI (siempre
r=0.5).

Veamos ahora cuál es el juicio de causalidad en cada una de las condiciones


para el estímulo X, dependiendo de la correlación o contingencia de los
estímulos A y B con el EI:
El estudio original de Wasserman (1990) muestra como el juicio acerca de la
causalidad de X decae drásticamente en función de la diferencia en la
correlación de cada combinación AX y BX con la aparición del EI (a pesar de
la contigüidad X-EI)
También se observa que la eficacia de A para predecir el EI aumenta con la
mayor diferencia en la correlación de cada combinación AX y BX con el EI
(así como se reduce la eficacia de B).

- Dos fenómenos, en ambos hay una reducción de la asociación, a


pesar de haber una contingencia perfecta entre EC-EI, el aprendizaje
no se produce
Bloqueo: un estímulo bloquea el condicionamiento o el aprendizaje de otro.
Tono más descarga, produce RC al tono. Pero si hay
Si hay contingencia y una buena asociación, al presentar dos estímulos
deberían provocar la misma respuesta ante el miedo a la descarga

Tenemos situación previa con condicionamiento y adquisición de respuesta


de miedo.
En el grupo de control no hay primera fase de tono que asociar a la
descarga, presentan las dos a la vez. No hay fase 1.
Si hay diferencias, se debe a la diferente manipulación entre los dos.
1- Aprende asociación tono- descarga
2- Aprende asociación tono+luz descarga
3- Ante el tono si hay RC, pero no hacia la luz
4- En el grupo de control, no hay asociación única con el tono.
Si hay diferencias, se deberán a la manipulación previa. El
tono Bloquea que aprendamos con otros estímulos, el
condicionamiento de la luz.

Ensombrecimiento: Hay una situación más sencilla, combinando las


claves tono-luz con descarga. No hay un bloqueo, pero uno de los dos
estímulos ensombrece el condicionamiento del otro. Una de las respuestas
condicionadas va a quedar siempre por debajo de la otra. En este caso el
grupo de control también se presenta sin combinación. No aparece la parte
inicial, y la luz no bloquea al tono si no que lo ensombrece.
 Experimental: tono+luz descarga
 Control: solo tono, produce mucha más respuesta
condicionada que cuando el tono iba con otro.

Comprobación con Sniffy nos da otros dos términos:

Razón de movimiento
- Medida más simple
- Evalúa cuánto tiempo se paraliza la rata durante la presentación del
EC
- Medida directa: 0 indica que no hay paralización y 1 indica
paralización completa y por tanto condicionamiento
La razón de supresión
- Medida más compleja y más utilizada
- Involucra una RC previamente aprendida (p.ej., presión de la palanca)
- Medida indirecta: 0 indica que no hay movimiento, supresión total de
la RC es total y máximo condicionamiento; 0.5 indica misma RC
durante el EC que antes del EC, no hay condicionamiento

PRÁCTICA 6: CONDICIONAMIENTO INSTRUMENTAL

Antecedentes del CI: Thorndike, estudios con cajas-problema en gatos


- cuando la R de un animal va seguida de una consecuencia
satisfactoria (como escapar de la caja problema u obtener comida),
se incrementa la probabilidad de que ocurra de nuevo.
- Cuando la R va seguida de una consecuencia insatisfactoria
(descarga eléctrica), la probabilidad de que se repita la conducta
disminuye.
Formalización en ley del efecto (asociación E-R): probabilidad de que se de
una R ante un E depende de la C que ha seguido a la R en el pasado:
Condicionamiento Instrumental - Proceso que da lugar a que la
probabilidad de una respuesta se vea modificada por sus consecuencias, es
decir, por los efectos que tiene el ambiente sobre dicha conducta.
Conducta instrumental - Actividad que ocurre debido a que produce una
consecuencia particular o reforzador.
Contingencia - en presencia de un estímulo específico (discriminativo), el
reforzador se presentará si y solo si la respuesta operante sucede.
La respuesta (conducta instrumental) está mas relacionada con lo que
sucede después de que ocurra (dirigida a meta), más que con estímulos que
la provoquen (resultado de las consecuencias que ha tenido en el pasado,
de que haya sido reforzada). No es elicitada, sino emitida.

Skinner: ensayos discretos vs. operante libre


Las investigaciones de Thorndike se llevaban a cabo mediante
procedimientos de ensayo discreto; Skinner introdujo el procedimiento de
operante libre (caja de Skinner):
- Ensayo discreto: cada ensayo es separado/ discreto y termina con la
salida del animal del aparato. La respuesta instrumental sólo se
realiza una vez en cada ensayo. El experimentador es quien decide la
organización temporal de los ensayos sucesivos (o repeticiones de la
respuesta), cuando se inician y terminan. Se mide latencia de R.
- Procedimientos de operante libre: el animal puede operar el aparato
con libertad, repitiendo la respuesta instrumental todas las veces que
quiera. El sujeto es quien determina la organización temporal de las
repeticiones sucesivas de la respuesta. Se mide tasa de R (frecuencia
con la que ocurre).
Tanto los paradigmas de ensayo discreto como de operante libre son
condicionamiento instrumental (el condicionamiento operante es solo una
parte del CI).

PRÁCTICA 7: CONDICIONAMIENTO INSTRUMENTAL, PROGRAMAS DE


REFORZAMIENTO
Programas de reforzamiento

Regla o criterio que determina qué ocurrencia de una respuesta será


seguida por el reforzador.
En muchas ocasiones, la relación entre la R y la C no es continua (p.ej., no
siempre que hay R hay reforzador, sino que son necesarias varias
respuestas o que pase un tiempo determinado).
Existen 4 programas básicos:
 Programas de razón fija
 Programas de intervalo fijo
 Programas de razón variable
 Programas de intervalo variable

Todos ellos producen una ejecución conductual característica y diferente,


que puede ser apreciada a simple vista examinando la forma en cómo se
distribuyen las R a lo largo del tiempo (p. ej., observando la conducta en un
registro acumulativo).

1) PROGRAMAS DE RAZÓN
El reforzamiento sólo depende del número de R realizadas (las cuales
deben darse a una razón fija o variable).
Si cada R siempre va seguida de la consecuencia, se trata de un
programa de reforzamiento continuo, pero si la R sólo es reforzada
algunas veces, se un reforzamiento parcial o intermitente.
- Programa de razón fija: entrega del reforzador después de N
respuestas, razón fija N o RF N
El patrón de R característico es que una vez que se inicia la conducta,
la tasa de R es alta y estable, pero puede haber una pausa (pausa
posreforzamiento) antes de iniciar el número requerido de respuestas
(ver registro acumulativo)
- -Programa de razón variable: el n° de R requeridas para obtener el
reforzador varía de una situación a otra, la cantidad de R necesarias
es impredecible.
Patrón de R: las pausas posreforzamiento son menos probables y más
cortas que en RF (la tasa de R es más estable, línea continua o no
quebrada)

2) PROGRAMAS DE INTERVALO
Las R únicamente se refuerzan si ocurren después de cierto tiempo
(intervalo temporal que puede ser siempre el mismo o variar):
- Programa de intervalo variable: las R sólo se refuerzan si ocurren
después que ha pasado un intervalo de tiempo impredecible desde el
inicio del ensayo. Provocan tasas estables y constantes de respuestas
sin pausas regulares (como RV)
Producen tasas relativamente fijas o constantes de R, mientras que
los fijos producen tasas variables (en los que se detecta el intervalo
fijo y se responde solo al final del mismo, o se descansa una vez se
ha hecho el número o razón de R necesarias)

Importante: el intervalo, variable en este caso, solo determina cuando


estará disponible el reforzador, no cuando será entregado (esto depende de
la R).
Por ejemplo:
-la comida podrá ser dispensada tras un minuto desde el inicio de la sesión
en el primer ensayo, pero tras 3 minutos desde el reforzador anterior en el
segundo ensayo, y tras 2 minutos desde el reforzador anterior en el tercer
ensayo. Programa de IV 2 minutos (promedio de tiempo antes de
reforzadores)

Los programas se diferencian en la magnitud de respuesta que producen y


en la estabilidad. Implican mecanismos motivacionales diferentes.

Por lo general, las tasas de R son más altas en los programas de razón que
en los programas de intervalo (un comportamiento adaptativo, en vista de
que la tasa de recompensa en tales programas se relaciona de forma
directa con la tasa de R)

PRÁCTICA 8: EVITACIÓN, ESCAPE Y CASTIGO

Procedimientos de control aversivo de la R: escape, evitación y castigo

Distinguir los procesos de evitación y escape: Ante la presentación de un


estímulo aversivo, se pueden llevar a cabo dos conductas, la evitación y el
escape (en ambos casos, se trata de un reforzamiento negativo, donde
existe una contingencia negativa entre una respuesta instrumental y el
estímulo aversivo):
- Evitación: el individuo realiza una respuesta específica para impedir
la presentación de un estímulo aversivo.
- Escape: el individuo realiza una respuesta específica para terminar la
presentación de un estímulo aversivo.

Castigo positivo: La presentación de estimulación aversiva tiene como


consecuencia la reducción de la respuesta. Se da una contingencia positiva
entre la respuesta y la consecuencia.
Hay distintos factores que afectan a la eficacia del castigo, entre ellos:
- intensidad del estímulo aversivo: castigos más severos son más
eficaces
- nivel introductorio del castigo: empezar el castigo con un nivel
intenso es más eficaz que hacerlo con un castigo débil
Reforzamiento por omisión Alternativa al castigo positivo para controlar la
conducta.
Se establece una contingencia negativa entre la R y el reforzador: el sujeto
debe omitir la respuesta para que aparezca el reforzador (castigo negativo).

También se denomina reforzamiento diferencial de otra conducta (RDO),


donde el reforzador está disponible siempre y cuando se realice otra
conducta alternativa.
La R instrumental impide la entrega de un E placentero o apetitivo (p.ej.,
portarse mal → quedarse sin chucherías); emitir la R objetivo tiene como
resultado la supresión de la recompensa que se habría entregado si el
individuo hubiese realizado otra R (se refuerza la alternativa).
Es preferible al castigo positivo porque no implica la aplicación de un
estímulo aversivo; además, a largo plazo supone la eliminación de la
conducta objetivo y es muy resistente al reacondicionamiento.

Extinción Alternativa al castigo positivo para controlar la conducta.


Si una conducta se presenta sin reforzamiento o con un reforzador de
menor magnitud (contraste negativo), causará una disminución en la
frecuencia de la misma. Se rompe la contingencia (positiva o negativa)
existente entre conducta y reforzador (R – Reforzorzado, ausencia de R –
Reforzador, donde la contingencia es + y -, respectivamente), en presencia
de un estímulo discriminativo.
Es muy eficaz (sobre todo en combinación con Ref+ de R alternativa) pero
requiere no sólo de la identificación del reforzador sino el control sobre la
aparición de dichos reforzadores.
La R puede empeorar antes de reducirse, pero se debe continuar con la
extinción. Puede provocar fuertes efectos emocionales → frustración, que
en ocasiones puede ser lo bastante intensa como para provocar agresión
(hacia otros).

La extinción no implica un desaprendizaje o un olvido, sino un nuevo


aprendizaje (asociación inhibitoria E-R). La R extinguida puede reaparecer si
hay un cambio en el contexto, un nuevo contacto con el E discriminativo
extinguido o una nueva exposición al reforzador. Fenómenos que lo indican
(visto también en condicionamiento clásico):
- Recuperación espontánea: la conducta puede reaparecer tras un
periodo de descanso.
- Renovación de la R: recuperación del desempeño mostrado en la
adquisición cuando se cambian las señales contextuales que estaban
presentes durante la extinción (p.ej., volver al contexto original).
- Restablecimiento de la R: la recuperación de la R condicionada como
consecuencia de la exposición al estímulo incondicionado o
discriminativo.

¿Como mejorar la extinción? → más ensayos (mejor masivos que


espaciados), en distintos contextos

También podría gustarte