Manual de ingenieria civil descargar gratis

UNIVERSIDAD DE GUADALAJARA
CENTRO UNIVERSITARIO DE CIENCIAS BIOLÓGICAS Y AGROPECUARIAS
DEPARTAMENTO DE CIENCIAS AMBIENTALES
CENTRO DE ESTUDIOS E INVESTIGACIONES EN COMPORTAMIENTO
Análisis experimental del reforzamiento cualitativamente variado
cuando las consecuencias entregadas son substituibles
TESIS QUE PARA OBTENER EL GRADO DE
MAESTRO(A) EN CIENCIA DEL COMPORTAMIENTO
PRESENTA
JESÚS CUITLÁHUAC NÚÑEZ SANTANA
Director: Dr. Oscar García Leal
Comité: Dr. Cristiano Valerio dos Santos
Julio de 2014
Agradecimientos
Agradezco al Consejo Nacional de Ciencia y Tecnología por el apoyo prestado para la elaboración
de este proyecto, en el marco del número de beca para posgrado 255338.
Agradezco también a mis compañeros del Centro de Estudios e Investigaciones en
Comportamiento, en especial a Hugo Enrique Vélez y Gabriela Eugenia López Tolsa quienes me
orientaron aún en los aspectos más básicos de la investigación animal, a Alejandro Macías y Maryed
Rojas por su acto totalmente desinteresado de bondad, a Zirahuén Vilchez quien me ayudó en la
realización del experimento 3 sin esperar más recompensa que aprendizaje y un ocasional chocolate, a
mi madre M. Justina Santana Tejeda por su apoyo. Agradezco también al personal y cuerpo docente del
CEIC, especialmente al Dr. Cristiano Valerio dos Santos por hacerme cuestionar y comprender de manera
más profunda aún los conceptos más fundamentales del análisis experimental de la conducta y al Dr.
Oscar García Leal ya que sin su casi infinita paciencia este proyecto no habría sido posible.
Contenido
Resumen .................................................................................................................................................................... iii
Introducción ...............................................................................................................................................................5
El estudio del reforzamiento cualitativamente variado: Estudios experimentales ...............................................6
La noción de demanda en economía conductual y su utilidad para el estudio del
reforzamiento cualitativamente variado............................................................................................................. 17
Objetivo ................................................................................................................................................................... 24
Serie experimental .................................................................................................................................................. 26
Prueba preliminar ................................................................................................................................................ 26
Experimento 1 ..................................................................................................................................................... 28
Objetivo particular........................................................................................................................................... 28
Método ............................................................................................................................................................ 28
Resultados ....................................................................................................................................................... 31
Experimento 2 ..................................................................................................................................................... 37
Objetivo particular........................................................................................................................................... 37
Método ............................................................................................................................................................ 37
Resultados ....................................................................................................................................................... 38
Experimento 3 ..................................................................................................................................................... 41
Objetivo particular........................................................................................................................................... 41
Método ............................................................................................................................................................ 41
Resultados ....................................................................................................................................................... 42
Conclusiones ............................................................................................................................................................ 45
Referencias .............................................................................................................................................................. 51
-1-
-2-
Resumen
Aunque, en la mayoría de los trabajos de condicionamiento operante, la emisión de una
respuesta conduce siempre a la entrega de una misma consecuencia, existen algunos estudios en que
realizar la tarea operante lleva a la obtención de dos o más consecuencias cualitativamente distintas y
que se entregan de manera variada. Los resultados obtenidos en los primeros trabajos realizados con
esta manipulación (Steinman, 1968a, 1968b; Wunderlich, 1961) se elaboraron bajo la premisa de que
entre dos posibles situaciones aquélla que proveyera mayor variación en las consecuencias sería la que
tendría mayor valor reforzante, lo que se reflejaría en mayores tasas de respuesta y una mayor
resistencia a la extinción. Trabajos más recientes (Roca et al., 2010) sugieren que el mero hecho de hacer
entrega de consecuencias cualitativamente distintas no necesariamente se traduce en mayor valor
reforzante. Una forma de dar cuenta de los resultados aparentemente discrepantes consiste en
considerar la manera en que la presencia de una consecuencia específica afecta el consumo de otra, es
decir la manera en que los distintos tipos de reforzadores interactúan entre sí. En este sentido, la
economía conductual provee un marco conceptual que permite interpretar los resultados que se han
obtenido en el estudio del reforzamiento cualitativamente variado, así como proponer nuevas hipótesis.
Con el propósito de evaluar el papel que juegan los distintos tipos de relaciones entre consecuencias
sobre la fuerza reforzante de su presentación variada en una situación de elección, se desarrolló una
serie de tres experimentos.
El primer experimento pretendía encontrar reforzadores substituibles entre sí. Con el fin de
identificar la relación entre dos reforzadores particulares, en este caso semillas de nabo y semillas de
mijo, se hizo uso del procedimiento conocido como paradigma del ingreso compensado.
En un segundo experimento, se analizó el efecto de presentar cada una de las dos consecuencias
anteriores de manera independiente sobre la tasa de respuesta, así como de su presentación simultánea.
-3-
Para ello, siguiendo el procedimiento utilizado por otros autores, se utilizó un programa múltiple de tres
componentes.
Finalmente, en el Experimento 3, se evaluó el efecto de presentar simultánea o aleatoriamente
cada una de las consecuencias sobre la tasa de respuesta. De nuevo se utilizó para ello un programa
múltiple, en este caso de dos componentes. El objetivo de este experimento fue determinar si la manera
distinta de presentar el reforzamiento cualitativamente variado entre el Experimento 2 y estudios
previos realizados por Roca y colaboradores y Steinman daría cuenta de los resultados obtenidos.
Los resultados obtenidos, en comparación con los reportados por otros autores, sugieren que el
tipo de interacción entre las consecuencias presentadas juega un papel importante sobre su fuerza
reforzante. Las implicaciones para la noción de reforzamiento se discuten.
-4-
Introducción
B.F. Skinner (1938) propuso una taxonomía que clasifica los diferentes eventos a
considerar en un análisis operante. La taxonomía clasifica los eventos en estímulos,
respuestas del organismo ante dichos estímulos y consecuencias que ocurren a causa de
esas respuestas. Las consecuencias, a su vez, se clasifican de acuerdo al efecto que tienen
sobre la probabilidad de que la conducta ocurra de nuevo en el futuro. A los eventos que
hacen más probable que una conducta determinada ocurra en el futuro se les conoce como
reforzadores.
El estudio del reforzamiento, esto es, de la acción de presentar una consecuencia
programada tras una respuesta fijada por el investigador, ha dado paso a diferentes líneas
de investigación en que se manipulan diferentes dimensiones de un mismo reforzador,
como la probabilidad de que el reforzamiento ocurra (Eckerman, 1969), la demora en la
entrega del reforzador (Mazur, 1997) y el efecto de la magnitud de reforzador (Lowe,
Graham, Harzem, & Harzem, 1974). Cuando solo es una de estas propiedades la que se
manipula, los resultados son muy consistentes: en general, dadas dos alternativas de
respuesta presentadas simultáneamente, los organismos eligen de manera sistemática
aquélla que les proporciona una mayor cantidad de reforzador, la que entrega la
consecuencia con mayor probabilidad o aquélla cuya recompensa está disponible en un
período de tiempo corto por encima de una que está disponible con una demora mayor.
Los resultados son consistentes tanto en humanos como en animales no humanos (Green
& Meyerson, 2004). En menor medida, se pueden encontrar estudios en los que se ha
abordado el estudio de los efectos de la presentación de dos o más consecuencias tras la
emisión de una respuesta. En estos casos, se habla del estudio del reforzamiento
cualitativamente variado (RCV a partir de este momento), por cuanto dos o más
reforzadores son asociados a una misma respuesta emitida. Los estudios sobre el RCV han
arrojado datos menos consistentes que en los casos anteriormente citados.
-5-
Este trabajo, se enmarca en esta área. En esta medida, tiene como propósito
abundar en el estudio del RCV. Específicamente, explora el efecto de la relación entre las
consecuencias presentadas sobre su valor reforzante cuando ambas son presentadas de
manera simultánea o aleatoria, en relación a cuando ambas consecuencias se presentan de
manera independiente. Con el objetivo de determinar la relación existente entre dos
bienes, se asume la diferenciación establecida desde la economía conductual entre bienes
independientes, complementarios y sustituibles.
El estudio del reforzamiento cualitativamente variado: Estudios experimentales
El primer estudio en que una misma respuesta llevaba a la obtención de dos
reforzadores distintos fue realizado por Wunderlich (1961). El objetivo de ese estudio fue
asociar dos tipos de reforzadores primarios a un solo estímulo, es decir analizar los efectos
del reforzamiento condicional generalizado, que en principio debía poseer mayor poder
reforzante que un reforzador condicionado simple. Wunderlich utilizó 60 ratas como
sujetos, que fueron divididas en cuatro grupos. La tarea consistía en recorrer un pasillo de
48 cm de largo que llevaba a una caja meta en la cual se encontraban dos recipientes, uno
para agua y otro para alimento. Los grupos diferían en el tipo de reforzamiento que
obtenían al completar cada ensayo. Así, el grupo F recibía comida en todos los ensayos, el
grupo W agua, el grupo F+W agua y comida en cada uno de los ensayos y, por último, el
grupo F/W recibía agua en la mitad de los ensayos y comida en los ensayos restantes,
distribuidos de manera aleatoria. Después de haber sido privados de alimento, y
familiarizados con el aparato experimental, todos los sujetos fueron expuestos a 50
ensayos, distribuidos en cinco días, con intervalos entre ensayos de 15s de duración.
Después de los ensayos con reforzamiento, a los sujetos se les expuso a 20 ensayos de
extinción, distribuidos en dos días. En el estudio, se analizaron tres medidas distintas: el
tiempo de carrera, la recuperación espontánea que ocurría en el segundo día de extinción
respecto al primero y la frecuencia con la que los sujetos del grupo F+W consumían comida
antes que agua en los 50 ensayos.
-6-
Los resultados mostraron que los sujetos de los grupos F/W y F+W realizaron
carreras más rápidas que los sujetos de los dos grupos restantes, pero no hubo una
diferencia significativa entre las velocidades de los grupos F+W y F/W. En lo que respecta a
la extinción, durante el primer día los sujetos del grupo F/W corrieron con una velocidad
mayor que los de cualquier otro grupo, seguidos de los sujetos de los grupos F+W, F y W,
en este orden. Los grupos F y F+W fueron los únicos en presentar una recuperación
espontanea significativa.
Más tarde, Steinman (1968a, 1968b) estudió en una serie de experimentos el efecto
del RCV sobre la tasa de respuestas. El primero de los estudios buscaba replicar los
resultados reportados por Wunderlich usando un diseño intra-sujeto e investigar el efecto
de reforzamiento variado cuando las recompensas eran distintas y semejantes en su fuerza
reforzante. En un primer estudio (Steinman, 1968a), 12 ratas fueron entrenadas a
responder en un programa de intervalo variable (IV) 45s. En una primera fase experimental,
se presentaba un tono (T1) por periodos de 5 minutos. En presencia de T1, los componentes
completados eran reforzados con la entrega de pellets. Cuando pasaban 5 minutos y T1 era
retirado, las respuestas de los sujetos no eran reforzadas. Cuando los sujetos dejaban de
responder por 15 segundos, se restablecía la condición de reforzamiento en presencia de
T1. Esta primera fase continuó hasta que las tasas de respuesta alcanzaron un valor
asintótico y ningún tiempo fuera de reforzamiento duraba más de 20 segundos. En una
segunda fase, además de las condiciones ya descritas, se incluyó un segundo tono (T2), en
cuya presencia los componentes eran reforzados con la entrega de una solución de agua y
sacarosa. Durante esta fase, T1 y T2 se alternaban de manera aleatoria. Por último, cuando
se obtuvieron tasas estables de respuesta ante T1 y T2, se agregó un tercer tono (T3). En la
presencia de T3, el reforzador consistía en la entrega aleatoria de pellets o la solución de
sacarosa. En la condición en que se hizo entrega únicamente de la solución de sacarosa, se
observaron tasas más altas en los doce sujetos que en la condición en que se entregaban
pellets. Asimismo, nueve sujetos respondieron con mayor frecuencia en presencia de T3.
Para dos sujetos, las tasas ante T3 no se estabilizaron sino hasta la mitad de la fase tres, y
-7-
para un sujeto, las tasas de respuesta observadas en presencia de T3 y T2 fueron muy
similares.
En un segundo estudio, Steinman (1968b) investigó el efecto del reforzamiento
variado sobre la tasa de respuesta cuando los reforzadores eran similares en su fuerza
reforzante. El arreglo utilizado en este segundo estudio fue idéntico al anteriormente
descrito tanto en diseño como en el número de sujetos con una única excepción: durante
la segunda fase, la solución de sacarosa fue disminuida progresivamente hasta que las tasas
de respuestas ante T1 coincidían con las que se presentaban ante T2. De nuevo, las tasas
de respuesta más altas observadas fueron obtenidas durante la condición de reforzamiento
variado, si bien para tres sujetos la diferencia entre las tasas de respuesta fue muy pequeña
en las tres condiciones.
Más recientemente, Roca, Milo y Lattal (2010) desarrollaron dos estudios para
abordar dos preguntas inconclusas en los estudios de Steinman: 1) el hecho de que los
sujetos fueran expuestos por un tiempo prolongado a las condiciones de reforzamiento
constante, antes de haber sido expuestos al reforzamiento variado, pudo haber
determinado los resultados y 2) si los hallazgos se replicarían en caso de que la entrega de
los diferentes tipos de reforzadores se realizara en distintas sesiones.
En el primero de los experimentos reportados, Roca et al. emplearon 7 ratas
privadas hasta el 80% de su peso ad libitum. Los sujetos fueron colocados en cajas
experimentales construidas ex profeso para los experimentos, las cuales contaban con
focos y dispensadores de comida y líquidos. Cuatro de los siete sujetos fueron expuestos a
un programa múltiple IV60s de dos componentes; en uno de los componentes, presionar la
palanca llevaba a la obtención de pellets y en el otro se entregaba una solución de 50%
leche condensada y 50% agua. Después de la presentación de 30 componentes distribuidos
de manera equiprobable en el transcurso de una hora, se daba por terminada cada sesión.
Esta primera fase continuó hasta que se obtuvieron tasas estables para los siete sujetos. En
una segunda fase, se añadió un tercer componente al que solo cuatro sujetos fueron
expuestos, durante el cual la entrega de reforzamiento se alternaba entre la solución de
-8-
leche y los pellets a condición de que no se presentaran más de tres entregas de un solo
reforzador de manera sucesiva. En esta segunda fase, la sesión se daba por terminada
cuando se había hecho entrega de 30 reforzadores (diez de cada una de las opciones
posibles). Por último, los cuatro sujetos que fueron expuestos al componente de
reforzamiento variado fueron expuestos de nuevo únicamente a los componentes de
reforzamiento constante. Las tres ratas restantes fueron expuestas desde el principio a los
tres componentes. El arreglo se muestra a detalle en la Tabla 1.
-9-
Tabla 1. Diseño usado por Roca y colaboradores en su primer estudio. El sujeto
J2 murió antes de completar el estudio y sus datos no se incluyen.
Rata
Condición 1
Condición 2
Condición 3
J1
IV (pellets), IV (leche)
IV (pellets), IV (leche)
J2
IV (pellets), IV (leche)
J3
IV (pellets), IV (leche)
J4
IV (pellets), IV (leche)
IV (pellets), IV (leche),
IV (pellets o leche)
IV (pellets), IV (leche),
IV (pellets o leche)
IV (pellets), IV (leche),
IV (pellets o leche)
IV (pellets), IV (leche),
IV (pellets o leche)
A1
IV (pellets), IV (leche),
IV (pellets o leche)
IV (pellets), IV (leche),
IV (pellets o leche)
IV (pellets), IV (leche),
IV (pellets o leche)
A2
A3
IV (pellets), IV (leche)
IV (pellets), IV (leche)
Los autores reportaron que uno de los sujetos que fue expuesto a los tres
componentes desde el inicio emitió tasas de respuestas más altas durante el componente
de reforzamiento variado, seguido del componente de la solución de leche y los pellets
respectivamente. Para los seis sujetos restantes, las tasas más altas de respuesta se
encontraron en el componente en que se hacía entrega de la leche condensada, seguido
del componente de reforzamiento variado, y los pellets respectivamente.
En un segundo experimento, estos mismos autores utilizaron cuatro de los sujetos
que habían sido utilizados en el experimento anterior. En esta ocasión, los sujetos eran
expuestos a tres tipos de sesiones distintas. En un tipo de sesión se hacía entrega de la
solución de leche, en otro de pellets y por último, en un tercer tipo de sesión el
reforzamiento se alternaba de manera aleatoria entre la solución de leche y pellets. Las
sesiones continuaron hasta que se observaron tasas estables de respuesta. Los tres tipos de
sesiones tenían una duración de una hora y eran presentadas en días distintos. Los
estímulos asociados a cada tipo de sesión variaban de acuerdo al sujeto (ver Tabla 2).
- 10 -
Tabla 2. Diseño y contrabalanceo usado por Roca y colaboradores en su segundo
estudio.
Sujeto
Luz frontal
Luz trasera
Oscuridad
A1
A2
A3
J1
IV pellets
IV leche
IV pellets o leche
IV pellets
IV leche
IV pellets o leche
IV pellets
Leche
IV Leche o pellets
IV Pellets
IV leche
Pellets o leche
Para una de las cuatro ratas, no se observaron diferencias significativas entre las
tasas emitidas en las sesiones de entrega de pellets y las de reforzamiento variado, pero las
tasas más altas se emitieron en las sesiones de entrega de la solución de leche. Para los tres
sujetos restantes, las tasas más altas de respuesta fueron emitidas en las sesiones de la
solución de leche, seguidas de las de reforzamiento variado y pellets respectivamente.
De este modo, los resultados reportados por Roca y colaboradores difieren de
aquellos reportados por Wunderlich (1961) y Steinman (1968a, 1968b) y no apoyan el
supuesto de que la mera variedad provea a una situación de valor reforzante.
Hasta este punto se han mencionado los principales estudios que han abordado el
estudio del RCV en condiciones controladas de laboratorio. Sin embargo, el estudio del RCV
ha ocupado también un papel fundamental en ámbitos más aplicados, en los que identificar
las mejores condiciones de reforzamiento para la adquisición de respuestas nuevas o la
modificación de otras evocadas se constituye en un problema fundamental. En este sentido,
la investigación aplicada acerca del reforzamiento variado, por lo general, centra su interés
en encontrar estrategias para la modificación de conductas inadecuadas o el
mantenimiento de comportamiento socialmente aceptable. A partir de este momento, se
analizarán algunos de los estudios más relevantes en este sentido.
Egel (1981) evaluó los efectos diferenciales de presentaciones de reforzamiento
constante contra presentaciones de reforzamiento variado en el comportamiento de niños
con retraso en el desarrollo en el aula escolar. Los participantes del estudio fueron tres
- 11 -
niños de entre seis y ocho años de edad, todos ellos diagnosticados con problemas en el
desarrollo, dos de ellos con autismo. Para cada niño, se establecieron tres reforzadores
comestibles distintos; el criterio utilizado para usarlos fue que cada reforzador hubiera
resultado previamente exitoso en mantener una conducta deseable en los niños. El efecto
diferencial de las dos condiciones de reforzamiento fue evaluado en un diseño BCBC (sic)
para los niños 2 y 3 y en un diseño para el niño 1, siendo B la condición de reforzamiento
constante y C la condición de reforzamiento variado. Para cada participante, se fijó una
conducta meta distinta: uno de los niños debía identificar de entre una hoja con tres dibujos
el que era distinto de los otros dos, el segundo participante debía identificar de entre dos
ilustraciones que representaban acciones la que correspondiera al mando del maestro (por
ejemplo “dame al niño que corre”) y al tercer participante se le enseñó a realizar una tarea
que consistía en discriminar grupos de más o menos objetos, por ejemplo, se le pedía al
niño señalar de entre dos grupos de lápices el que tuviera menos. Se evaluó también el
tiempo que los niños pasaban realizando la tarea.
En la condición de reforzamiento constante, se presentaba el mismo reforzador
hasta que el niño alcanzaba un 80% de respuestas correctas de entre 125 ensayos o hasta
que dejaba de responder por tres ensayos consecutivos. Durante la condición de
reforzamiento variado, se implementó el mismo procedimiento, pero aproximadamente
cada tres respuestas correctas se entregaba uno de tres reforzadores posibles. En todos los
casos, la condición inicial de reforzamiento constante produjo tendencias a decrementar
tanto las respuestas correctas como el tiempo que los participantes pasaban atendiendo a
la tarea. La condición de reforzamiento variado produjo tasas altas de respuestas correctas
así como de tiempo de atención a la tarea a través de los 125 ensayos. Cuando la condición
cambiaba de nuevo a reforzamiento constante, las tasas de respuestas correctas y de
atención a la tarea decrementaban después de pocos ensayos. Cuando se regresaba a la
condición de reforzamiento variado tanto las tasas de respuesta correcta como el tiempo
de atención a la tarea incrementaban de nuevo (niños 2 y 3).
- 12 -
Bowman, Piazza, Fisher, Hagopian y Kogan (1997) realizaron un estudio con el
objetivo de evaluar la preferencia relativa por un reforzador de alta calidad (HQ) presentado
de manera constante contra la preferencia de reforzadores de calidad ligeramente inferior
(SLQ) presentados de manera variada. Los participantes fueron siete niños diagnosticados
con retraso mental de moderado a profundo. Se elaboró para propósitos de la investigación
una lista de reforzadores potenciales utilizando una forma de entrevista estructurada con
los tutores de los niños llamada Evaluación de Reforzadores para Individuos con
Discapacidades Severas (RAISD por sus siglas en inglés). Cuando se completó la lista de
reforzadores potenciales, se realizaron pruebas de preferencia en las que los reforzadores
eran presentados por pares, y los participantes se aproximaban a uno de los dos. Con este
método, se estableció una relación jerárquica de los reforzadores más y menos preferidos.
Una vez establecidos los reforzadores, se implementó una fase de entrenamiento en la cual
a los participantes les fueron asignadas respuestas meta distintas: para cuatro de los
participantes la tarea consistía en sentarse en una silla, para un participante la tarea
consistía en pararse dentro de un cuadro, para otro presionar un interruptor y para el último
participante en llenar un sobre. A todos se les expuso a una fase previa de entrenamiento
en la que operaba un programa concurrente razón fija (RF) 1 de tres opciones, tales que dos
alternativas de respuesta producían reforzamiento constante de los ítems clasificados como
de mayor preferencia en la escala y la tercera alternativa no producía reforzamiento,
operando como control. Cuando los participantes producían respuestas sin instigación y al
menos 80% de esas respuestas eran reforzadas después de tres sesiones, se daba por
concluido el entrenamiento. Durante las sesiones experimentales los participantes seguían
expuestos al mismo tipo de programa de reforzamiento concurrente RF1. En cada ensayo,
los participantes podían emitir una de tres posibles respuestas iguales entre sí (sentarse en
una de tres sillas distintas, rellenar uno de entre tres sobres posibles, etc.), una de las cuales
llevaba a la obtención de reforzamiento constante, siendo el reforzador a obtener el que
había obtenido la puntuación más alta en la prueba de preferencia (HQ). La respuesta de
reforzamiento variado llevaba a la obtención de los reforzadores que se ubicaban en el
segundo, tercer y cuarto lugar en la prueba de preferencia (SLQ). En cada ensayo existía una
- 13 -
respuesta que no producía reforzamiento. Los autores reportaron que cuatro de los
participantes respondieron con mayor frecuencia en la opción de reforzamiento variado,
dos de los participantes respondieron con mayor frecuencia a la opción de reforzamiento
constante y uno de los participantes alternó sus respuestas entre ambas opciones. Los
autores señalaron que esto podía interpretarse como una condición de reforzamiento
variado creada por la participante.
Dando continuidad al estudio anterior, más recientemente Koehler, Iwata, Roscoe,
Rolider y O´Steen (2005) llevaron a cabo dos estudios. El primero de los dos estudios
replicaba los procedimientos usados por Bowman y colaboradores, pero en este caso
usando reforzadores que tuvieran mucha disparidad en las pruebas de preferencia, con el
objetivo de poner a prueba los alcances del reforzamiento variado. En el estudio, los
participantes fueron ocho adultos diagnosticados con retraso mental. Para el estudio, se
usaron dieciséis artículos comestibles como reforzadores. Antes del inicio del estudio se
realizaron pruebas de preferencia para establecer la relación jerárquica entre los
reforzadores. Los estímulos de alta calidad (HQ) fueron definidos como aquellos que eran
elegidos en al menos el 85% de los ensayos, los estímulos de calidad baja (LQ) fueron
definidos como aquellos que eran elegidos en 30% o menos de los ensayos y, por último,
los reforzadores de calidad ligeramente menor (SLQ) fueron definidos como los que
obtuvieron el segundo, tercer y cuarto lugar en la prueba de preferencia. Durante el
entrenamiento, los participantes fueron expuestos a un programa concurrente RF1 RF1 con
dos posibles alternativas de respuesta, una de las cuales llevaba a la obtención de un
reforzador comestible, mientras la otra no entregaba reforzador. En una fase subsiguiente
se introdujo una tercera opción de respuesta, de tal manera que dos de las opciones
producían reforzamiento constante y la opción restante no producía reforzador alguno. En
las sesiones experimentales, la primera condición fue la de HQ individual contra LQ
individual (el propósito de esta condición era verificar la preferencia del reforzador de
calidad alta contra el reforzador de calidad baja), la segunda condición consistía en la
presentación de los reforzadores HQ de manera individual contra los reforzadores de
calidad inferior (LQ) de manera variada (el propósito de esta condición era determinar si los
- 14 -
reforzadores de calidad menor competirían, si se les presentaba de manera variada con el
reforzador de calidad alta presentado de manera individual) y, en la tercera y última
condición, se contrastaban las tasas obtenidas en la opción de reforzadores de alta calidad
de manera individual con aquellas obtenidas mediante los reforzadores de calidad
ligeramente menor (SLQ) presentados de manera variada. En la condición de HQ individual
- LQ individual todos los participantes respondieron con una frecuencia mayor en la opción
del reforzador de calidad alta. En la condición HQ individual - LQ variado, uno de los
participantes alternaba sus respuestas entre ambas opciones, los otros seguían
respondiendo con mayor frecuencia en la opción de HQ. Por último, en la condición de LQ
- SLQ todos los participantes respondieron con mayor frecuencia en la opción de
reforzamiento variado, dos de los participantes respondieron exclusivamente en esta
opción, y dos participantes alternaron sus respuestas, pero la opción de reforzamiento
variado continuó siendo la que produjo mayores tasas.
En un segundo estudio, Koehler et al. (2005) buscaron determinar si la variación de
los estímulos podría añadir poder reforzante a estímulos que inicialmente no operaban
como reforzadores. En este estudio participaron tres adultos diagnosticados con retraso
mental. El diseño experimental fue el mismo utilizado en el estudio anterior, pero en esta
ocasión, además de entregar reforzadores altamente preferidos (HQ) y de menor
preferencia (SLQ), se usaron comestibles a los que los participantes no se aproximaron
durante cinco ensayos cuando estos fueron presentados de manera individual (non
preferred, NP). En las primeras dos condiciones, HQ individual - NP individual y HQ
individual - NP variado, todos los participantes distribuyeron sus respuestas en la opción de
reforzamiento de calidad alta. No obstante, en la condición HQ individual - SLQ variado,
todos los participantes alternaron sus respuestas entre ambas opciones, aunque el
desempeño de un participante tendía a favorecer la opción de reforzamiento constante.
En esta misma línea de trabajos, Najdowski, Wallace, Penrod y Cleveland (2005)
realizaron dos estudios. El primer estudio pretendía determinar si era posible que estímulos
de baja preferencia, al ser presentados de manera variada, evocaran las mismas tasas de
- 15 -
respuesta que un estímulo altamente preferido presentado de manera constante. Los
participantes fueron dos niños con retraso mental de leve a severo, de 5 y 7 años. Al igual
que en los estudios anteriormente descritos, las consecuencias utilizadas que fungirían
como reforzadores fueron ordenadas en una escala de preferencia utilizando el mismo
proceso de apareamiento utilizado por Bowman y colaboradores. Del mismo modo, se
utilizó un programa RF1, en el que cada participante debía emitir una respuesta meta
distinta. Se estableció una condición de línea base en la que las conductas no producían
consecuencias. Los efectos reforzantes del estímulo preferido y de los tres estímulos de baja
preferencia fueron evaluados usando un diseño ABAB. En una última condición, los efectos
de los tres estímulos de baja preferencia fueron evaluados de manera variada, es decir se
hacía entrega de uno de los tres reforzadores que obtuvieron índices bajos de preferencia
durante las pruebas. En la condición en que no se entregaba reforzador alguno, se
encontraron las tasas más bajas de respuesta. Las tasas más altas de respuesta fueron
emitidas durante la condición en que se hacía entrega del reforzador preferido, seguidas de
la condición en la que se entregaban reforzadores de baja preferencia de manera constante.
Sin embargo, cuando los reforzadores de baja preferencia fueron presentados de manera
variada, las tasas emitidas fueron siempre superiores a aquéllas que se obtenían en las
condiciones donde esos mismos reforzadores fueron presentados de manera individual.
En un segundo experimento, Najdowski et al. (2005) compararon los efectos
reforzantes de un estímulo de alta preferencia presentado de manera constante con los
efectos de tres estímulos de baja preferencia presentados de manera variada. Se evaluó
también el efecto de la presentación de los reforzadores sobre la adquisición de una
respuesta nueva y sobre una tarea previamente entrenada. Para esto, se utilizó un arreglo
de ensayo discreto con un intervalo fijo de 15 segundos para las respuestas cortas y 30
segundos para las respuestas largas, esto es, los participantes contaban con 15 segundos
para emitir las respuestas que requerían menos tiempo y 30 para consumar respuestas que
necesitaban tiempos mayores. De nuevo, se estableció una condición de línea base, durante
la cual las respuestas correctas no producían reforzamiento. Se utilizó una escala de
instigación para cada ensayo es decir, el investigador iniciaba dando la instrucción verbal
- 16 -
para realizar la respuesta; si el participante no emitía la respuesta, se realizaba el modelaje
de la respuesta blanco de manera que el participante pudiera verla y, por último se guiaba
físicamente (de ser posible) al participante a la realización de la respuesta. En la condición
de reforzamiento variado, las tareas novedosas eran reforzadas con la entrega del
reforzador de preferencia alta. Si la instrucción verbal no producía respuesta, se procedía
con las formas de instigación según correspondiera. Si ninguna de las tres formas producía
la respuesta en un lapso de 5 segundos, se daba por terminado el ensayo. Para las tareas
que habían sido entrenadas previamente, solo se presentaba la instrucción verbal. De
nuevo, se dispuso una condición de reforzamiento variado en la que las respuestas
correctas tenían como consecuencia la entrega de uno de los tres reforzadores de
preferencia baja, entregados de manera semialeatoria. En este segundo estudio, se
encontró que el reforzamiento constante de alta preferencia y el reforzamiento variado de
baja preferencia fueron igual de efectivos en mantener y adquirir respuestas. Además los
resultados mostraron que tanto la condición de reforzamiento variado como la condición
de reforzamiento constante mantenían el tiempo de atención a la tarea en un porcentaje
muy similar entre sí.
La noción de demanda en economía conductual y su utilidad para el estudio del
reforzamiento cualitativamente variado
Los primeros estudios en que se hacía entrega de reforzadores distintos como
consecuencia asociada la ocurrencia de una respuesta operante parecían indicar que la
mera variedad añadía poder reforzante a una situación. No obstante, existen
investigaciones en que se muestra que la mera variedad no necesariamente implica
mayores tasas de respuesta o mayor resistencia a la extinción. Entonces, si los resultados
que obtuvieron investigadores como Steinman (1968a, 1968 b) y Wunderlich (1961) no se
deben a la mera variedad, ¿cómo puede darse cuenta de los resultados que ellos
obtuvieron?
- 17 -
Hursh (1980) sugirió que, a causa de las relaciones entre reforzadores, ninguna regla
simple o unidimensional puede dar cuenta de cualquier conducta de elección.
Investigadores como Hursh (1980) y Green y Freed (1993) han sugerido incorporar
conceptos usados en la teoría económica para dar cuenta de los resultados obtenidos en
conducta de elección. Skinner (1953) fue quizá el primero en percatarse del enorme
paralelismo entre los conceptos básicos de la teoría económica y los supuestos básicos del
conductismo. Al respecto escribió;
Como la conducta del individuo que es positivamente reforzante al
grupo, los bienes son “buenos” en el sentido de ser positivamente
reforzantes (p. 384).
Es decir, los bienes son bienes ya que su entrega hace más probable que la conducta
que se realiza para obtenerlos ocurra en el futuro.
Ya que los términos usados para explicar el consumo de bienes en humanos pueden
también ser usados para dar cuenta de las conductas observadas por organismos no
humanos en el aparato experimental, es posible establecer analogías directas entre la
investigación básica y la lógica de la teoría económica.
Un concepto fundamental en economía es el de demanda. Este concepto se refiere
a la cantidad de un bien adquirido a un precio dado (Green & Freed, 1993). Tanto los
reforzadores como los bienes son cosas por las que un sujeto realiza conductas destinadas
a su obtención. En Análisis Experimental de la Conducta, el costo está determinado, entre
otras posibilidades, por las restricciones del programa de reforzamiento. Así, si una rata se
encuentra en un programa RF10, se puede decir que el precio del reforzador es de 10
presiones de palanca.
Cuando el sujeto modifica su consumo de manera inversa con los cambios en el
precio de un bien, se dice que está siguiendo la Ley de la demanda. El supuesto fundamental
de esta ley es que incrementar el precio de un bien modifica su consumo. Cuando los
cambios en el precio producen cambios en el consumo mayores a lo esperado, el cambio
no es proporcional. Cuando un pequeño cambio en el costo de obtención de un bien se
- 18 -
traduce en un cambio drástico en su consumo se dice que la demanda es elástica. Si, por
ejemplo, el precio de un artículo de primera necesidad como el agua incrementa, el
consumo de agua no se alterará mucho. Si, por otro lado, el precio de un artículo como
libros aumenta, es posible que incluso un incremento pequeño produzca un cambio drástico
en el consumo de libros. En dicho caso, diremos que la demanda por libros es muy elástica
y la demanda por agua es poco elástica.
La Ley de la demanda toma también en cuenta el consumo de un bien en función de
cambios en el precio de otro bien disponible en la situación. Con esto en cuenta, se
establecen tres tipos de interacciones entre consecuencias. Se dice que dos bienes son
substituibles cuando los consumos se intercambian fácilmente, de tal modo que
incrementar el precio de uno produce una disminución en su consumo y un incremento en
el consumo de su substituto (i.e., las sombrillas e impermeables son un ejemplo común de
bienes substituibles). La segunda relación entre consecuencias es la complementariedad.
Se dice que un bien es complementario a otro cuando éste es consumido en una proporción
rígida con relación a otro, de manera tal que incrementar el precio de uno disminuirá el
consumo de ambos (i.e., los alimentos salados y los refrescos suelen considerarse como un
ejemplo de bienes complementarios). Finalmente, cuando modificar el precio de un bien
no tiene efecto en el consumo de otro, se dice que los bienes son independientes entre sí
(i.e., cambios en el precio de zapatos deportivos no deberían tener efecto en el consumo
de libros de ficción).
En el pasado, se ha señalado que la función de cada reforzador es de suma
importancia para determinar qué tipo de relación existirá entre consecuencias (Green,
1993). Por ejemplo, las pelotas de tenis no son un buen substituto de las naranjas si se
pretende comerlas, no obstante ambos bienes pueden ser altamente substituibles entre sí
si se pretende hacer malabares con ellos. Es importante tener en cuenta que las relaciones
entre consecuencias no representan valores dicotómicos en que cualquier consecuencia
será un substituto o complemento de otra sino más bien un continuo en que el valor de un
reforzador y la elasticidad de su consumo serán siempre afectados en mayor o menor
- 19 -
medida por otras consecuencias disponibles; resulta contra-intuitivo asumir que un abrigo
pueda ser substituible por una barra de chocolate, no obstante si se considera que las barras
de chocolate son ricas en calorías están bien podrían ser un substituto del abrigo en una
situación de frío extremo.
Teniendo esto en cuenta, es posible establecer el grado de substitutabilidad entre
dos consecuencias enteramente en términos del comportamiento. Experimentalmente la
relación entre reforzadores se establece mediante el procedimiento del paradigma
compensado, un arreglo en que se les provee a los sujetos de un ingreso fijo en forma de
respuestas efectivas en una situación en la que uno o más bienes (o consecuencias) están
disponibles al mismo costo. Una vez que los sujetos desarrollan patrones estables de
elección se alteran los costos y se registran los cambios en el consumo de cada bien.
El grado de substitutabilidad entre dos bienes se calcula dividiendo el cambio
porcentual del consumo del bien X ante una variación porcentual del costo del bien Y. Si
los bienes son substituibles entre sí el aumento del costo del bien Y puede aumentar las
ventas del bien X, por lo que la elasticidad cruzada será positiva. Si los bienes son
complementarios (aumentar el costo de un bien disminuye el consumo de ambos bienes)
los cálculos arrojarán valores negativos. Por último, si alterar el precio de un bien no tiene
efecto alguno sobre el consumo de otro bien se espera encontrar un valor igual a 0, lo que
indicaría una relación de independencia.
El paradigma del ingreso compensado fue utilizado en un estudio realizado por
Green y Rachlin (1991). En el estudio, se usaron ratas wistar como sujetos y se utilizó un
diseño concurrente en una situación de economía abierta. Las cajas experimentales estaban
provistas de dos palancas y cada palanca estaba correlacionada con un reforzador positivo.
Durante una condición, responder en una palanca llevaba a la obtención de comida y
responder en la otra llevaba a recibir estimulación eléctrica en el cerebro (EBS, por sus siglas
en inglés). En otra condición, las dos consecuencias disponibles eran agua y EBS. El
programa utilizado fue un concurrente IV15 IV15. Los sujetos tenían un número
predeterminado de respuestas efectivas que constituían su presupuesto pero podían
- 20 -
distribuir sus respuestas de manera libre. Cuando se obtuvieron tasas de respuesta estables
para cada opción, los costos de cada reforzador (el requisito de obtención) fueron
aumentados de manera individual, aumentando también el ingreso de cada sujeto, de
manera tal que el consumo original de cada reforzador aún pudiera ser obtenido. Los
resultados mostraron que, en una condición inicial, los sujetos mostraban una marcada
preferencia por la EBS; en las condiciones en que su costo fue aumentado los sujetos
cambiaron sus consumos, mostrando que la EBS puede ser altamente substituible por
comida y en una menor medida por agua. No obstante los resultados mostraron también
que el agua y la comida no fueron substituibles entre sí.
La elasticidad cruzada de la demanda se calcula de la siguiente manera:

∆
�   � ∆ 



=
=
∙
∆
∆ 
�  �

donde P representa el precio de un bien y Q el consumo de un bien distinto.
La elasticidad cruzada de la demanda ha sido estudiada en condiciones de
laboratorio con sujetos humanos. Bernstein y Ebbessen (1978) realizaron un estudio en el
que determinaron cuán elástica era la demanda por un pasatiempo con respecto a otro.
Participaron en el estudio tres adultos que fueron aislados en una habitación,
monitoreándose el tiempo que pasaban realizando una diversidad de actividades. Se
estableció una línea base sobre la manera en que los participantes distribuían su tiempo
entre las distintas actividades disponibles en la habitación. En una segunda etapa, se les
exigía a los participantes realizar una de las actividades en las que habían invertido poco
tiempo durante la fase de línea base como requisito para ganar acceso a una de las
actividades en que habían invertido más tiempo, es decir, la actividad menos favorita se
convirtió en la respuesta operante y se usaron las actividades favoritas como reforzador
(e.g., una participante se le requería pasar 71 minutos leyendo para obtener acceso a 35
minutos de coser). Cada participante fue expuesto a condiciones en que una actividad era
contingente a otra y condiciones en que no existían restricciones sobre cómo distribuir el
- 21 -
tiempo, es decir a condiciones de operante libre. Lo que se observó fue que cuando existían
respuestas instrumentales como requisito los participantes nunca invertían el mismo
tiempo en la actividad reforzante como el que invertían en las condiciones de operante
libre; por el contrario, distribuían su tiempo realizando otras actividades disponibles. Los
autores concluyeron, a partir de fluctuaciones superiores a las esperadas entre el tiempo
de distribución entre actividades, que las actividades alternativas a la actividad favorita
fungieron como bienes substituibles.
Por otra parte, Iwata et al. (1997) realizaron un estudio en el que se pretendía
examinar en qué medida manipular objetos puede fungir como un bien substituible para la
conducta de daño auto infligido (SIB por sus siglas en inglés). Los participantes del estudio
fueron tres pacientes de una institución clínica que habían sido diagnosticados con retraso
mental profundo. Los sujetos fueron expuestos de una a tres sesiones diarias, cuatro o cinco
veces por semana. Previo a dar inicio al estudio se determinó que las SIB no eran
mantenidas por la estimulación social, ya que ocurrían aun cuando los participantes estaban
solos. Se utilizó un diseño ABAB. En una de las condiciones, el sujeto tenía acceso a objetos
manipulables (un vibrador para masajes, un tubo de hule o anillos de hule dependiendo del
participante) y en otra condición el objeto les era retirado. En las condiciones en que los
objetos no estaban disponibles, las SIB ocurrieron con mayor frecuencia que en las
condiciones en que los objetos manipulables estaban disponibles. Para uno de los tres
participantes, las SIB se redujeron de manera importante, en tanto que se extinguieron por
completo para los otros dos.
En otro experimento, los investigadores incluyeron una restricción al acceso a los
objetos manipulables alterando de manera sistemática la distancia entre el objeto y el
participante, de manera que alcanzarlo requiriera más esfuerzo en algunas condiciones que
en otras (dos de los tres participantes poseían muy limitadas habilidades ambulatorias). En
este experimento, los participantes invertían gran parte del tiempo de sesión manipulando
los objetos y se observó un número reducido de SIB cuando no se les requería cambiar de
posición para manipular objetos. Cuando los objetos eran alejados, se registraron más SIB.
- 22 -
Los autores interpretaron los resultados como una clara muestra de cómo una actividad
puede fungir como un bien substituible de otra.
- 23 -
Objetivo
En los primeros estudios en que se investigó el reforzamiento variado, se reportaba
que las condiciones en que se hacía entrega de dos o más consecuencias tenían un mayor
valor reforzante que las condiciones en que solo se entregaba un reforzador. Estudios más
recientes han arrojado resultados distintos aun cuando se usan métodos experimentales
muy similares a los iniciales. Roca et al. (2010) sugirieron que las interacciones de tipo
económico existente entre las consecuencias elegidas podrían haber determinado los
resultados en las diferentes investigaciones.
Con la finalidad de evaluar el efecto del reforzamiento cualitativamente variado
cuando las consecuencias entregadas son substituibles entre sí, se desarrolló la siguiente
serie experimental.
El objetivo del Experimento 1 fue encontrar reforzadores que fueran substituibles
entre sí para ser utilizados posteriormente en el Experimento 2, así como determinar el
grado de substitutabilidad entre ambos.
En el Experimento 2, se compararon las tasas de respuesta, entendidas como una
medida de preferencia, obtenidas en condiciones en que se entregaba reforzamiento
constante con aquéllas obtenidas en condiciones en que se entregaba reforzamiento
variado, cuando las dos consecuencias entregadas tenían una relación de substitutabilidad,
esto con el objetivo de investigar el papel que juegan los diferentes tipos de interacción
entre consecuencias sobre el poder reforzante cuando existe una opción de reforzamiento
variado.
Por último, Wunderlich reportó que no encontró diferencias significativas entre el
grupo en que entregaba agua y pellets en la misma sesión (F+W) y el grupo en que
entregaba agua o pellets de manera aleatoria (F/W). No obstante, no se cuentan con
estudios que contrasten las tasas de respuesta en un componente en que se entrega
- 24 -
reforzamiento variado de manera aleatoria con las de un componente en que se entrega el
reforzamiento variado de manera mezclada. El tercer experimento tuvo como objetivo
averiguar si existen diferencias significativas en el desempeño obtenido mediante estas dos
formas distintas de entregar reforzamiento variado.
- 25 -
Serie experimental
Prueba preliminar
Antes de iniciar los experimentos, se realizaron pruebas con diferentes tipos de
alimentos que serían usados como consecuencia. El criterio para elegir las consecuencias a
ser consideradas fue que los dispensadores de alimento disponibles modelo ENV-203M-45
(marca MED) entregaran una misma cantidad de manera constante. Después de hacer
pruebas con diferentes tipos de granos las consecuencias elegidas para toda la serie
experimental fueron semillas de nabo y semillas de mijo. Ya que los experimentos
requerirían que los sujetos se mantuvieran en una dieta exclusiva de dichos granos, fue
preciso cerciorarse de que los sujetos podrían mantenerse sanos durante la duración total
de los experimentos.
Con el objetivo de evaluar la posibilidad de alimentar exclusivamente a los animales
experimentales con semillas de mijo o nabo, se realizó un estudio preliminar en el que
participaron ocho ratas hembra de la cepa Wistar, cuatro de ellas mantenidas
exclusivamente con semillas de mijo y las cuatro restantes mantenidas exclusivamente con
semillas de nabo. A cada rata se le proporcionó 20 gr. diarios de semillas durante un periodo
de 14 días. Cada día se pesaron las semillas no consumidas con la finalidad de registrar los
consumos (véase Figura 1).
- 26 -
Mijo
Nabo
30
25
Gramos
20
y=-0.38x+18.33
15
10
y=-0.05x+8.37
5
0
2
4
6
8
10
12
14
Dias
Figura 1. Consumos diarios promedio (en gramos) correspondientes a ambos
grupos. Los cuadros representan los consumos de mijo (media ± error típico).
Los círculos representan los consumos de nabo (media ± error típico).
La cantidad diaria de consumo de semillas de mijo fue mayor que la de semillas de
nabo durante los 14 días de registro. El consumo de semillas de mijo decayó a lo largo del
periodo de registro, en tanto el consumo de semillas de nabo presentó mayor estabilidad,
observándose una pendiente cercana a 0 al considerarse el total de días registrados.
Después de dos semanas de ser alimentados de manera exclusiva con semillas de
mijo o nabo, ninguno de los ocho sujetos presentó alteraciones significativas en su peso o
señales aparentes de déficit alimenticio. Dado lo anterior, se decidió realizar la serie
experimental usando ambas clases de semilla.
- 27 -
Experimento 1
Objetivo particular
El primer experimento tuvo como objetivo identificar la relación económica
existente entre las semillas de nabo y las semillas de mijo, consecuencias que serían
utilizadas posteriormente en el Experimento 2 para evaluar el efecto del reforzamiento
cualitativamente variado. Con este propósito se utilizó el paradigma del ingreso
compensado descrito en Rachlin, Green, Kagel y Battalio (1976).
Método
Sujetos
Participaron en el experimento 6 ratas de la cepa Wistar de aproximadamente tres
meses de edad y experimentalmente ingenuas al inicio del experimento. Quince días antes
de iniciar el experimento a todos los sujetos se les retiraron los nutricubos, alimento que
habían consumido desde su nacimiento, y se les mantuvo en una dieta exclusiva de una
mezcla de semillas de mijo y nabo. Las ratas fueron mantenidas al 80% de su peso ad libitum
antes de iniciar el experimento.
Materiales
Se utilizaron dos cámaras experimentales modelo ENV-022MD fabricadas por
MedAssociates ® de 19 cm. de largo, 23 cm. de alto y 20 cm. de fondo. Las paredes laterales
y el techo de la cámara estaban hechos de plexiglas, en tanto que las paredes frontales y
posteriores estaban constituidas por láminas de aluminio. Las cámaras experimentales
fueron colocadas dentro de cajas sonoamortiguadas y estaban equipadas con ventiladores
que hacían circular el aire durante las sesiones. Cada caja experimental estaba provista de
dos dispensadores de alimento modelo ENV-203M-45 fabricados por MedAssociates ®, uno
para cada tipo de consecuencia. En la salida de cada dispensador se instaló un tubo, de tal
modo que ambos convergían en un embudo adaptado al receptor del alimento con la
finalidad de que ambas consecuencias se entregaran en un mismo receptáculo. En el centro
- 28 -
de la pared frontal de cada cámara se instaló el recipiente para alimento. También en la
pared frontal, una en cada lado de la caja, fueron colocadas dos palancas a 2 cm de distancia
del comedero y 4 cm del piso. 2 cm arriba de cada palanca se encontraba una luz verde o
blanca que señalizaban el tipo de consecuencia asociado a la palanca. En la pared posterior,
a 8 cm. del piso, se colocó un emisor de ruido blanco que permanecía encendido durante
las sesiones experimentales. Los eventos de las sesiones fueron controlados y registrados
mediante una interfaz MedAssociates ®
Diseño y procedimiento.
Antes de dar inicio al experimento, las ratas fueron expuestas a un procedimiento
de moldeamiento. El entrenamiento finalizó una vez que las ratas emitían al menos 100
respuestas por sesión. Cada sesión tuvo una duración de 30 minutos.
Finalizado el moldeamiento se dio inicio al estudio. Se definieron tres fases en el
estudio (véase Tabla 3). Cada fase finalizó cuando se observó estabilidad en la conducta,
definida cuando la probabilidad de elección de una alternativa en las últimas dos sesiones
del bloque no variaba en más de un 15% de su probabilidad de elección en las penúltimas
dos sesiones.
Durante todo el experimento se utilizó un procedimiento de economía cerrada, es
decir, el alimento se proporcionó únicamente durante las sesiones experimentales.
Tabla 3. Diseño utilizado. El primer componente del programa concurrente se
refiere al requisito de respuesta correspondiente a las semillas de mijo, y el
segundo a las semillas de nabo.
# sesiones
(bloque1/bloque2)
Programa
Fase 1
Sin restricción de
respuestas
Fase 2
Ingreso 200
(I-200)
Fase 3
Ingreso compensado
(IC)
15
5/10
9/13
conc RF5 RF5
conc RF5 RF5
conc RF8 RF4
Entre fases, se modificó el requisito de respuesta de cada componente del programa
concurrente, siguiendo el procedimiento que a continuación se detallará. En cada ocasión
- 29 -
en la que el requisito de respuesta era alcanzado, las palancas se retraían hasta que los
dispensadores de alimento dejaban de girar. Una vez que la recompensa había sido
entregada, ambas palancas eran activadas de nuevo.
Durante la Fase 1, las ratas fueron expuestas a un programa de reforzamiento conc
RF5 RF5. Una de las alternativas de respuesta entregaba 0.225 gr de semillas de mijo, en
tanto que la otra entregaba la misma cantidad de semillas de nabo. Si los sujetos alternaban
sus respuestas el programa guardaba las respuestas dadas en cada palanca de manera
individual hasta que se alcanzaba el requisito de 5, una vez entregada la consecuencia el
contador reiniciaba desde 0.
El objetivo de esta fase era determinar el consumo aproximado de cada sujeto
durante las sesiones para poder fijar el ingreso óptimo. En esta fase, los sujetos no tuvieron
restricción de ingreso, esto es, los sujetos podían responder tantas veces como les fuera
posible durante la sesión. En esta fase, cada sesión tenía una duración de 2 horas. Se
programaron un total de 15 sesiones. Considerando las tres últimas sesiones, se obtuvo un
promedio grupal de 48.05 reforzadores obtenidos por sesión. Este dato fue considerado
para fijar el límite de respuestas (ingreso) que determinaba el criterio de finalización de las
siguientes sesiones correspondientes a la Fase 2 del estudio, de tal modo que el consumo
de los animales durante la Fase 2 fuera ligeramente inferior al promedio obtenido durante
las tres últimas sesiones de la Fase 1. De este modo, se fijó un criterio de finalización de
cada sesión de la Fase 2 de 200 respuestas o 1 hora de sesión, que permitían la obtención
de un máximo de 40 reforzadores.
La Fase 2 del estudio tenía como finalidad determinar el consumo de cada
consecuencia bajo condiciones de restricción de ingreso. Se implementó un procedimiento
por bloques similar al propuesto por Stephens (2008) de tal modo que la consecuencia
asociada a cada palanca era alternada por bloques. Si durante el primer bloque, la palanca
izquierda entregaba semillas de mijo, durante el bloque 2 entregaría semillas de nabo, y del
mismo modo para la palanca localizada en el lado derecho de la caja. El primer bloque de
- 30 -
esta fase tuvo una duración de cinco sesiones, mientras que el segundo tuvo una duración
de 10 sesiones.
La Fase 3 del estudio tuvo como finalidad analizar el efecto sobre el consumo de
ambos bienes de incrementar el requisito de respuesta de uno de ellos. En concreto, a la
consecuencia que produjo un mayor número de respuestas durante las Fases 1 y 2 (semillas
de mijo) se aumentó el requisito de respuesta de 5 a 8, en tanto que se disminuyó el
requisito para la consecuencia de menor preferencia (semillas de nabo), pasando de 5 a 4
respuestas. De este modo, los sujetos pasaron de estar en un programa concurrente RF5
RF5 a un programa concurrente RF8 RF4, de tal manera que el requisito de respuesta para
la alternativa con mayor probabilidad de elección durante la Fase 2 fue el doble en relación
al de la alternativa con menor probabilidad de elección. Simultáneamente, el número
máximo de respuestas que cada sujeto podía emitir por sesión fue incrementado y ajustado
para cada rata de manera individual, de manera tal que cada rata pudiera obtener la misma
cantidad promedio de semillas de mijo y nabo que las obtenidas en promedio durante las
tres últimas sesiones de la Fase 2. Para ello, se estimó el consumo promedio de semillas de
mijo durante estas sesiones, el consumo promedio de semillas de nabo, y cada uno de ellos
se multiplicó por el nuevo requisito de respuesta programado. La suma de ambos valores
proporcionó el ingreso o número máximo de respuestas establecido para cada sesión de la
Fase 3. Cada sesión finalizaba una vez emitidas el total de respuestas disponibles o después
de 1 hora. El primer bloque de esta última fase tuvo una duración de nueve sesiones,
mientras el segundo tuvo una duración de 13 sesiones. Se aplicó el mismo criterio de
estabilidad que durante la Fase 2 del experimento.
Resultados
En las Figuras 2 y 3, respectivamente, se grafican la probabilidad promedio de
elección de semillas de mijo y la cantidad de reforzadores obtenidos de cada tipo de semilla
para cada una de las fases.
- 31 -
1.00
0.98
0.96
0.94
0.92
0.90
p(mijo)
0.88
0.86
0.84
0.82
0.80
0.78
0.76
0.50
Fase 1
Fase2
Fase3
Figura 2. Probabilidad de elección promedio para la palanca en que se
entregaban semillas de mijo. Para esta Figura se tomaron las últimas tres
sesiones de cada bloque para cada una de las tres fases.
Mijo
Nabo
50
Reforzadores obtenidos
40
30
20
10
0
1
2
3
Fases
Figura 3. Promedio de reforzadores obtenidos de cada tipo durante las tres fases
del experimento 1.
- 32 -
Al final de la Fase 1 el promedio de entregas de mijo fue de 45.25 mientras que el
número de entregas promedio para las semillas de nabo fue de 5.91 (véase Figura 3.) La
probabilidad de elección para las semillas de mijo fue también muy superior: al final de la
fase la probabilidad de elección de las semillas de mijo fue de 0.9 (véase Figura 2).
Durante la Fase 2, establecido un límite de 200 respuestas por sesión, la preferencia
por las semillas de mijo se mantuvo para todos los sujetos. Al final de la fase los sujetos
obtenían en promedio 35.53 entregas de mijo y 3.86 entregas de semillas de nabo (véase
Figura 3). Esto constituyó un muy pequeño incremento en la probabilidad de responder en
la palanca en que se hacía entrega de semillas de mijo con relación a la Fase 1. Al finalizar
la Fase 2, la probabilidad de que los sujetos respondieran en la palanca en que se hacía
entrega de semillas de mijo era de 0.9.
Por último, durante la Fase 3, tanto la probabilidad de elección como el número total
de reforzadores entregados para las semillas de mijo fueron las más bajas registradas a lo
largo del experimento (véase Figure 3). Al final de esta fase, el promedio de entregas para
las semillas de mijo fue de 30.02 reforzadores obtenidos y de 13.31 reforzadores obtenidos
para las semillas de nabo. La probabilidad de que los sujetos respondieran en la palanca en
que se hacía entrega de mijo fue de 0.78 (véase Figura 2).
Como se puede apreciar en la Figura 3, el consumo de semillas de mijo fue siempre
superior al consumo de semillas de nabo. Cabe mencionar en este punto que durante la
Fase 1 no existía límite de respuestas programado, de allí que el promedio de reforzadores
obtenidos sea tan alto en relación a las dos fases restantes aún cuando la probabilidad de
responder en la palanca correspondiente a la entrega de mijo fue similar. Durante la Fase
2, la tendencia se mantuvo aunque no en la misma proporción. Cuando, durante la Fase 3,
el límite de respuestas individual fue ajustado de manera tal que a cada sujeto le fuera
posible obtener la misma cantidad de reforzadores que en la Fase 2, el consumo de semillas
de nabo (la consecuencia de menor costo) tuvo un incremento significativo, mientras que
el consumo de semillas de mijo mostró una leve disminución.
- 33 -
La Fase 1 fue en la que se registró un mayor número promedio de reforzadores
obtenidos debido a que ésta fue la única fase en que los sujetos no tenían restricción de
respuestas programada. No obstante, la probabilidad promedio de que los sujetos
respondieran en la palanca en que se hacía entrega de semillas de mijo fue muy similar
durante las Fases 1 y 2. Esto apunta a que la restricción de ingreso no tiene efecto sobre la
elección de los sujetos en tanto las clases de semillas tengan el mismo costo. Evidencia de
esto son los resultados registrados durante la Fase 3, aunque los ingresos de los sujetos
fueron ajustados de manera tal que les fuera posible obtener su consumo promedio de
semillas de nabo y mijo o consumir el doble de semillas de nabo que de semillas de mijo, el
promedio de reforzadores obtenidos así como la probabilidad de elección para las semillas
de mijo fueron los más bajos registrados en el experimento.
La relación existente entre semillas de mijo y de nabo fue analizada considerando el
promedio de consumo de cada tipo de semilla en las tres últimas sesiones de cada bloque
de las Fases 2 y 3. En la Figura 4, se grafica el número promedio de elecciones de mijo y
nabo para las Fases 2 (ingreso 200) y 3 (ingreso compensado) del experimento.
I 200
IC
40
35
30
Nabo
25
20
15
10
5
0
0
5
10
15
20
25
30
35
40
Mijo
Figura 4. Promedio en gramos de consumo de semillas de mijo y nabo para las
Fases 2 y 3.
- 34 -
Los valores considerados para la Figura 4 fueron la variación porcentual del consumo
de mijo entre las Fases 2 y 3 y el promedio de cambio porcentual de las últimas sesiones de
cada bloque para las semillas de nabo.
Aun cuando el costo de las semillas de mijo era el doble del de las semillas de nabo,
los sujetos no invirtieron su preferencia. No obstante, como puede apreciarse en la Figura
5, los valores obtenidos fueron, con excepción del sujeto 4, siempre positivos, de manera
que es posible afirmar que la relación entre las semillas de mijo y las semillas de nabo es de
substitutabilidad.
Sujetos
2.5
Promedio
Elasticidad cruzada
2.0
1.5
1.0
0.5
0.0
1
2
3
4
5
6
7
-0.5
Figura 5. Las columnas del 1 al 6 representan los grados de substitutabilidad para
cada sujeto, mientras que la columna 7 representa el grado de substitutabilidad
promedio considerando todos los sujetos.
- 35 -
Ya que el precio de las semillas de nabo era dos veces menor que el de las semillas
de mijo con el ingreso compensado, a los sujetos les habría sido posible costear cerca del
doble de semillas de nabo en relación con las semillas de mijo con el ingreso de 200
respuestas efectivas. No obstante, es pertinente recordar en este punto que la definición
de bienes substituibles radica en observar cambios en el consumo de un bien en relación
directa con el costo de otro. El incremento en el consumo de semillas de nabo y el
decremento en el consumo de semillas de mijo en la Fase 3 relativos a los consumos de la
Fase 2 muestran una clara relación de substitutabilidad entre las consecuencias entregadas.
En consecuencia, los experimentos 2 y 3 se llevaron a cabo asumiendo una relación de
substitutabilidad entre ambos reforzadores.
- 36 -
Experimento 2
Objetivo particular
El objetivo de este experimento fue analizar el efecto del reforzamiento
cualitativamente variado sobre la tasa de respuesta, utilizando como consecuencias
semillas de mijo y nabo que, de acuerdo a los resultados obtenidos en el Experimento 1,
muestran una relación de substitutabilidad.
Método
Sujetos
Participaron en el experimento 8 ratas Wistar experimentalmente ingenuas de
aproximadamente tres meses de edad. Las ratas fueron mantenidas al 80% de su peso ad
libitum, restringiendo la cantidad de comida que se les entregaba después de cada sesión.
Los sujetos fueron mantenidos con una dieta exclusiva de una mezcla de semillas de mijo y
nabo 15 días previos al inicio del experimento. Al igual que en el Experimento 1, los sujetos
fueron sometidos a un periodo de moldeamiento cuyo criterio de finalización fue que
emitieran al menos 100 respuestas en una sesión.
Materiales
Para el Experimento 2 se utilizaron los mismos aparatos experimentales descritos en
el Experimento 1 con sólo dos excepciones: en el centro de la pared posterior de cada una
de las cámaras experimentales a 8 cm. de las rejas sobre las que se colocaba a los sujetos
se localizó una luz general que, junto a las luces que se encontraban arriba de las palancas,
señalizaban los tres diferentes componentes del programa utilizado y de las dos palancas
usadas en el Experimento 1 sólo se conservó la que estaba a la izquierda del comedero.
Diseño y procedimiento
Una vez moldeados, los sujetos fueron expuestos a un programa múltiple de
intervalo variable 60 s de tres componentes. En un componente se entregaron 0.225 gr de
- 37 -
semillas de nabo aproximadamente de manera constante, en otro 0.225 gr de semillas de
mijo de manera constante y en el tercer componente se entregó una mezcla de 0.225 gr de
ambas clases de semillas (mijo+nabo). De este modo, para cada entrega de reforzador
constante se programaron 4 giros de tobela de uno de los dos comederos, mientras que
para el componente de RCV se programaron solo 2 giros de tobela de ambos comederos.
Cada componente tuvo una duración de 120s y cada sesión experimental finalizó después
de la presentación de 30 componentes (diez de cada tipo). El orden de presentación de los
componentes fue aleatorio. Se controló la luz asociada a cada componente (véase Tabla 4).
El estudio finalizó después de 40 sesiones. A lo largo del experimento los sujetos estuvieron
en una situación de economía cerrada aunque tenían acceso libre a agua fuera de las
sesiones experimentales.
Tabla 4. Estímulos asociados para cada componente para cada uno de los 8
sujetos.
Grupo 1
n=3
Grupo2
n=3
Grupo3
N=2
Mijo=Luz general
Nabo=Luz izquierda
Ambos=Luz derecha
Mijo=Luz izquierda
Nabo = Luz derecha
Ambos=Luz general
Mijo= Luz derecha
Nabo=Luz general
Ambos=Luz
izquierda
Resultados
En la Figura 6, se muestra la tasa de respuesta promedio por componente para cada
una de las 40 sesiones programadas.
No se observó estabilidad de la respuesta. Sin embargo, en la Figura 6 se aprecia
cómo las tasas de respuesta correspondiente al componente en el que se entregaba nabo
fueron inferiores durante la mayor parte de las sesiones a las correspondientes a los
componentes de mijo y mijo+nabo. No se observaron, por el contrario, diferencias en las
tasas de respuesta de los componentes de mijo y mijo +nabo.
- 38 -
Se comparó la tasa de respuesta por componente considerando las 10 últimas
sesiones. Se realizó un ANOVA de medidas repetidas aplicando el criterio de corrección de
Bonferroni para controlar la tasa de error (véase Figura 7). Se observaron diferencias
estadísticamente significativas en la tasa de respuesta del componente que entregaba nabo
tanto con el componente que entregaba mijo como con el que entregaba mijo+nabo
(F(1)=37.439; p<0.01). No se observaron diferencias estadísticamente significativas entre
los componentes mijo y mijo+nabo.
nabo
mijo
mijo+nabo
0.7
Tasa de respuesta
0.6
0.5
0.4
0.3
0.2
0.1
0.0
0
5
10
15
20
25
30
35
40
sesiones
Figura 6. Tasas de respuesta promedio por sesión para cada componente.
- 39 -
**
0.6
**
Media
0.5
0.4
0.0
Nabo
Mijo
Mijo+Nabo
Componente
Figura 7. Promedio de tasa de respuesta por componente considerando las
últimas 10 sesiones.
- 40 -
Experimento 3
Objetivo particular.
Considerando que en los estudios de Roca et al. (2010) y Steinman (1968a, 1968b)
el componente que entregaba reforzamiento variado liberaba de manera aleatoria una de
dos posibles consecuencias, y que en el Experimento 2 de este trabajo el componente
variado entregaba simultáneamente una cantidad igual de ambas consecuencia, se realizó
un tercer estudio en el que se evaluó el efecto de entregar en el componente variado ambas
consecuencias de manera aleatoria o simultánea.
Método
Sujetos
Participaron en el experimento 8 ratas de la cepa Wistar ingenuas de
aproximadamente tres meses de edad. Las ratas fueron mantenidas al 80% de su peso ad
libitum, restringiéndoseles el acceso a comida. Se expusieron a una situación de economía
cerrada, si bien tuvieron acceso libre a agua fuera de la sesión experimental. Los sujetos
fueron mantenidos con una dieta exclusiva de una mezcla de semillas de mijo y nabo 15
días previos al inicio del experimento.
Materiales
Se utilizaron cuatro cajas experimentales con las mismas especificaciones que las
usadas en el Experimento 2 con una única excepción: la luz general que se encontraba
localizada en la pared posterior de cada caja experimental fue eliminada, de manera que
únicamente se localizó una luz encima de cada una de las palancas ubicadas en el panel
frontal.
- 41 -
Diseño y procedimiento
Al igual que en los experimentos previos, los sujetos fueron sometidos a un periodo
de moldeamiento con el criterio de finalización de emitir al menos 100 respuestas en una
sesión de 30 minutos.
Los sujetos fueron expuestos a un programa mult IV 120s de dos componentes, cada
componente tenía una duración de 2 minutos y cada clase de componente se presentaba
15 veces durante cada sesión. Los componentes se presentaban de manera aleatoria así
que era posible que una misma clase de componente se presentará en más de una ocasión
consecutiva. Se corrieron un total de 18 sesiones de 60 minutos de duración. Cada
componente fue señalado por una luz blanca fija ubicada en el lado izquierdo o derecho del
panel frontal de la caja operante. La posición de las luces fue contrabalanceada. Uno de los
componentes (mijo/nabo) entregaba 0.225 gr de semillas de mijo o semillas de nabo,
mientras que el otro (mijo+nabo), al igual en el que Experimento 2, entregaba 0.225 gr de
una mezcla de semillas de mijo y nabo.
Resultados
En la Figura 8, se muestra el promedio de la tasa de respuesta por componente para
las 18 sesiones del experimento. No se observaron diferencias en las tasas de respuesta
para ambos componentes.
- 42 -
mijo+nabo
mijo/nabo
0.60
0.55
Tasa de respuesta
0.50
0.45
0.40
0.35
0.30
0.25
0.20
0.15
0
2
4
6
8
10
12
14
16
18
Sesiones
Figura 8. Tasa de respuesta promedio por componente por sesión.
En la Figura 9 se grafica la tasa de respuesta promedio para las cinco últimas sesiones
del experimento. No se observaron diferencias estadísticamente significativas
(t(576)=0.714;p=0.475).
- 43 -
0.6
Tasa de respuesta
0.5
0.4
0.3
0.2
0.1
0.0
Mijo+Nabo
Mijo/Nabo
Componente
Figura 9. Tasa de respuesta promedio por componente considerando las 5
últimas sesiones.
- 44 -
Conclusiones
La ley de igualación (Hernstein, 1961) postula que el valor reforzante de una alternativa
depende también del valor de otras alternativas presentes en una situación. Si un estímulo funge
como reforzador y cuán grande será su valor reforzante dependerá de factores como, por ejemplo,
si el organismo obtiene todo su alimento gracias a sus respuestas o el experimentador entrega
consecuencias no contingentes a las respuestas (Hursh, 1980), de variaciones en los intervalos entre
ensayos (Roper, 1975), del nivel de privación (Logan, 1970) y de la presencia de reforzadores
distintos en una misma condición (Hursh, 1978). Lo anterior es evidencia de la naturaleza relativa
del reforzamiento, si un evento ambiental tiene efecto o no sobre la conducta dependerá de otros
factores, más allá de las propiedades inherentes al estímulo.
El presente trabajo se enfoca en el efecto que tiene presentar reforzadores cualitativamente
distintos sobre el valor reforzante de una situación. Como se mencionó antes, los primeros trabajos
en que se hacía entrega de reforzadores cualitativamente distintos en una misma condición
reportaron que las condiciones en que se hacía entrega de reforzamiento cualitativamente variado
presentaban mayor fuerza reforzante (Steinman 1968a,1968b; Wunderlich, 1961). No obstante,
estudios posteriores mostraron que presentar reforzamiento cualitativamente variado en una
condición no necesariamente aumenta su valor reforzante en relación a condiciones de
reforzamiento constante (Koehler et al., 2005; Bowman et al., 1997; Roca et al., 2010). Roca et al.
(2010) postularon que tomar en cuenta las interacciones de tipo económico entre las consecuencias
entregadas podría dar cuenta de los resultados mixtos reportados en la literatura. La serie
experimental de este trabajo tuvo como objetivo poner a prueba dicha hipótesis.
El Experimento 1 tuvo como objetivo establecer la relación existente entre las semillas de
mijo y las semillas de nabo. Durante la prueba previa a los experimentos y las primeras dos fases del
Experimento 1, los sujetos mostraron una preferencia muy marcada por las semillas de mijo. Cuando
los costos de ambos reforzadores fueron alterados, el consumo promedio de semillas de mijo
disminuyó mientras que el de semillas de nabo aumentó. De este modo y considerando la noción
de elasticidad cruzada de la demanda, es posible afirmar que la relación encontrada entre las
semillas de mijo y nabo fue de substitutabilidad. En este punto, resulta pertinente mencionar que
- 45 -
las relaciones de substitutabilidad y complementariedad no son valores dicotómicos, de tal modo
que es posible observar distintos grados. Green y Freed (1993) encontraron que aun cuando se
realiza el paradigma del ingreso compensado entregando la misma consecuencia en ambas
alternativas estas no fueron substitutos perfectos entre sí. De este modo, la substitutabilidad
perfecta entendida como un cambio directamente proporcional entre el incremento del costo de
un bien y el consumo de otro bien no es necesaria para predicar la relación de substitutabilidad.
En el Experimento 1 del presente trabajo el precio de las semillas de mijo era dos veces más
alto que el precio de las semillas de nabo, así que con los ingresos compensados a los sujetos les
habría sido posible consumir hasta dos veces más semillas de nabo que de semillas de mijo. No
obstante, el consumo de las semillas de nabo no se duplicó o se acercó siquiera a duplicarse. Roca
et al. (2010) postularon que, ya que sus sujetos estaban privados de alimentos, la solución de agua
y leche condensada, siendo rica en calorías, habría fungido como substituto de alimento, mientras
que el agua y comida y l asolución de sacarosa y comida que Wunderlich (1961) y Steinman (1968a,
1968b) usaron en sus respectivos estudios actuaron como complementos incrementándose su valor
reforzante. Si bien los análisis muestran que las semillas de mijo y nabo son bienes substitutos, la
elasticidad del mijo fue baja, y es posible que el grado de substitutabilidad de las consecuencias
elegidas por Roca et al. (2010) haya sido mayor que el de las consecuencias elegidas en el
Experimento 1 del presente trabajo.
El objetivo del Experimento 2 fue analizar los valores reforzantes en un componente en que
se entregaba reforzamiento cualitativamente variado y dos componentes en que se entregaba
reforzamiento constante usando la tasa de respuesta como variable dependiente. En el segundo
experimento, se implementó un diseño muy similar al que utilizaron Steinman (1968a, 1968b) y
Roca et al. (2010), pero en los tres casos se obtuvieron resultados distintos. Steinman (1968a,
1968b) reporta las tasas más altas en el componente en que se entregaba reforzamiento
cualitativamente variado, Roca et al. (2010) reportan que las tasas más altas se registraron para la
mayoría de los sujetos en el componente que entregó una solución de agua y leche condensada (el
componente de reforzamiento constante) y en el Experimento 2 del presente estudio no se
observaron diferencias significativas entre el componente en que se entregó reforzamiento
cualitativamente variado y el componente en que se hizo entrega de mijo de manera constante.
- 46 -
Es posible proponer al menos tres posibles explicaciones que permiten dar cuenta
de los resultados mixtos.
Por un lado, los resultados podrían ser atribuidos a la saliencia de las consecuencias;
si la mera variedad en la entrega de reforzamiento no añade fuerza reforzante a una
situación, como Steinman (1968a) supuso, las tasas de respuesta más altas deberían
haberse obtenido en el componente en que se hacía entrega de la consecuencia preferida
(el mijo, de acuerdo a los datos registrados durante la prueba inicial y el Experimento 1),
seguidas del componente en que se hacía entrega de ambas consecuencias y por último el
componente en que la consecuencia preferida no se entrega. Los resultados obtenidos en
este trabajo muestran que las tasas de respuesta correspondientes al componente en que
se entregaban semillas de nabo de manera constante fueron las más bajas mientras que las
tasas de respuesta de los dos componentes restantes fueron siempre muy similares entre
sí. Ya que las semillas de mijo se entregaban durante dos de los tres componentes, es
posible que la saliencia entre los componentes de mijo exclusivamente y reforzamiento
variado no fuera tan grande como la saliencia entre el componente en que se entregaban
semillas de mijo de manera exclusiva y el componente en que se entregaban semillas de
nabo únicamente, haciendo que a los sujetos les resultara más difícil discriminar entre el
componente en que se hacía entrega de solo mijo y el componente en que se entregaba
una mezcla de semillas de mijo y nabo. En consecuencia, resultaría más difícil discriminar
entre un componente que entregaba sólo el reforzador preferido y un componente que lo
entregaba en menor proporción, que discriminar entre el componente que entregaba el
reforzador preferido y el componente que no lo entregaba. Esto daría cuenta de los
resultados discrepantes entre el estudio de Roca et al. (2010) y el Experimento 2 del
presente estudio, pero no da cuenta de las discrepancias entre los resultados de Steinman
(1968a, 1968b) y los de Roca et al. (2010) en los que las diferencias entre las tasas
registradas en los distintos componentes son más marcadas.
- 47 -
Una segunda explicación aludiría a diferencias en los procedimientos. En este caso,
la única distinción significativa entre los estudios radica en la manera en que las
consecuencias fueron entregadas.
En los estudios de Roca et al. (2010) las consecuencias elegidas fueron pellets y una
solución de leche condensada y en los estudios de Steinman (1968a, 1968b) las
consecuencias elegidas fueron agua y pellets y una solución de agua y sacarosa; en ambos
casos los componentes de RCV se presentaban entregando las consecuencias de forma
aleatoria. Dado que, en el Experimento 2 del presente estudio, las consecuencias elegidas
fueron dos clases de grano distintas, el componente de RCV consistía en entregar una
mezcla de ambas consecuencias. Lo anterior abre la posibilidad a que la forma en que se
entregó el reforzamiento cualitativamente variado haya influido sobre los resultados. Con
el propósito de descartar esta posibilidad se implementó el Experimento 3 de la serie del
presente trabajo. El Experimento 3 tuvo como objetivo comparar las tasas de respuesta de
un componente en que se entregaba una mezcla de semillas de mijo y nabo (como se hizo
en el componente de RCV del Experimento 2) con las de otro componente en que se
entregaban de manera aleatoria semillas de mijo o semillas de nabo (como se hizo en los
componentes de RCV de estudios previos). Al finalizar el experimento, no se encontraron
diferencias estadísticamente significativas entre las tasas de ambos componentes, de tal
modo que no existe razón para asumir que la manera en que se hizo entrega del RCV haya
influido en los resultados.
Por último, la hipótesis planteada por Roca et al. (2010) según la cual es la interacción entre
consecuencias y no la mera variedad la que determina los resultados en el estudio del reforzamiento
cualitativamente variado se basa, en parte, en demostraciones empíricas en las que se ha observado
que las ratas tienden a consumir mayores cantidades de alimento cuando tienen agua disponible
(Fitzsimons y Le Magnen, 1969; Toates, 1980). De este modo, en los estudios de Steinman (1968a,
1968b) las consecuencias habrían interactuado como bienes complementarios dotándose de valor
reforzante adicional mutuamente, mientras que, en el estudio de Roca et al. (2010), la solución de
agua y leche condensada, siendo rica en calorías, habría actuado como un substituto de la comida.
No obstante como se mencionó antes, las relaciones de substitutabilidad y complementariedad no
- 48 -
son valores dicotómicos, las consecuencias usadas en el estudio de Roca et al. (2010) y, como se ha
puesto de manifiesto las utilizadas en el presente estudio, quizá sean bienes substituibles, pero
haber diferido en cuanto a su grado de substitutabilidad. En dado caso manipular el grado de
substitutabilidad de las consecuencias debería tener también un efecto sobre el valor reforzante del
componente en el que los valores más cercanos a la complementariedad serían los que posean
mayor valor.
Aunque los resultados del presente trabajo distan de ser conclusivos, sí ofrecen nuevos
hallazgos sobre el estudio del reforzamiento cualitativamente variado. Los estudios más antiguos
acerca del reforzamiento cualitativamente variado indicaban que la mera variedad en la entrega de
reforzamiento le agrega valor reforzante a una situación, pero los resultados del presente trabajo
así como posibles estudios anteriores muestran que éste no es necesariamente el caso. Existe
evidencia que indica que es posible que una condición de reforzamiento variado posea mayor valor
reforzante, o como el caso del Experimento 2 del presente trabajo ,que la condición de RCV posea
el mismo valor que una situación en que se entrega reforzamiento constante. La serie experimental
apunta a que los distintos modos de entregar el RCV no es un factor relevante sobre el valor
reforzante de una situación, al menos cuando se toma como variable dependiente la tasa de
respuesta. Los resultados reportados por Wunderlich (1961) muestran que el efecto del RCV sobre
una variable dependiente como el tiempo de carrera en ensayo discreto no necesariamente se
traducen a otras variables dependientes como la recuperación espontanea.
Antes de establecer si la interacción particular entre dos bienes contribuye a establecer el
valor reforzante de una alternativa de respuesta, sería necesario a acometer el estudio de, al menos,
lo siguiente:
1. Manipular el grado de substitutabilidad de distintas consecuencias, así como realizar
experimentos
con
consecuencias
que
hayan
mostrado
una
relación
de
complementariedad.
2. El presente trabajo estudia el poder reforzante en función de la tasa de respuesta, pero
los resultados reportados por Wunderlich (1961) muestran que entregar RCV puede
tener un efecto sobre una variable dependiente como el tiempo de carrera pero no
tenerlo sobre otra variable dependiente como la recuperación espontanea. Antes de
llegar a conclusiones, es necesario realizar estudios con variables dependientes distintas
a las tasas de respuesta, tales como la resistencia a la extinción, el tiempo de atención
- 49 -
a la tarea, la latencia, la recuperación espontanea, la probabilidad de elección o el
tiempo de respuesta en diseños de ensayo discreto.
Si experimentos posteriores confirman la hipótesis postulada por Roca et al. (2010) y las
interacciones de tipo económico juegan un rol importante sobre el poder reforzante de una
situación, este hallazgo tendrá implicaciones no sólo para el estudio del reforzamiento variado sino
para el concepto de reforzamiento en general. La forma en que las consecuencias ambientales
interactúen entre sí se sumará a la lista de factores que influyen sobre si un estímulo es reforzante
o no y de serlo cuán grande será su valor reforzante. Estos resultados, a su vez, tendrán
implicaciones para la identificación de mejores estrategias para el aprendizaje y mantenimiento de
nuevas conductas.
- 50 -
Referencias
Baumol, W.J. (1972). Economic theory and operation analysis. Prentice Hall: Englewood Cliffs.
Bernstein, D.J. & Ebbesen, E.B. (1978). Reinforcement and substitution in humans: a multipleresponse analysis. Journal of experimental analysis of Behavior, 30, 243-253.
Bowman, L. G., Piazza, C. C., Fisher, W. W., Hagopian, L. P., & Kogan, J. S. (1997). Assessment of
preference for varied versus constant reinforcers. Journal of Applied Behavior Analysis, 4, 345350.
Egel, A. L. (1980). The effects of constant vs. varied reinforcer presentation on responding by autistic
children. Journal of Experimental Child Psychology, 30, 455-463.
_______ (1981). Reinforcer variation: Implications for motivating developmentally disabled
children. Journal of Applied Behavior Analysis, 14, 345-350.
Eckerman, C.O. (1969). Probability of reinforcement and the development of stimulus control.
Journal of Experimental Analysis of Behavior, 12, 551–559.
Fisher, W.W. & Mazur., J.E. (1997). Basic and applied research on choice responding. Journal of
Applied Behavior Analysis, 30, 387-410.
Green, L. & Freed, D., (1993). The substitutability of reinforcers. Journal of experimental analysis of
Behavior, 60, 141-158.
Herrnstein, R.J. (1961). Relative and absolute strength of a response as a function of frecuency of
reinforcerment. Journal of Experimental Analysis of Behavior, 4, 267-272.
Hursh, S.R. (1978). The economics of daily consumption controlling food- and water- reinforced
responding. Journal of Experimental Analysis of Behavior, 29, 475-491.
________ (1980). Economic concepts for the analysis of behavior. Journal of Experimental Analysis
of Behavior, 34, 219-238.
Koehler, L.J., Iwata, B.A., Roscoe, E.M., Rolider, N.U. & O'Steen, L.E. (2005). Effects of stimulus
variation on the reinforcing capability of nonpreferred stimuli. Journal of Applied Behavior
Analysis, 38, 469-484.
Logan, F. (1970) Fundamentals of learning and motivation. California: W. C. Brown Co.
Lowe, C.F., Graham, C.L. Harzem D. & Harzem P. (1974). Effects of reinforcement magnitude on
interval and ratio schedules. Journal of the Experimental Analysis of Behavior, 22, 553-560.
- 51 -
Mazur, J.E. (1997). Choice, delay, probability, and conditioned reinforcement. Animal Learning &
Behavior, 25(2), 131-147.
Najdowski, A.C., Wallace, M.D., Penrod, B. & Cleveland., J. (2005). Using stimulus variation to
increase reinforcer efficacy of low preference stimuli. Behavioral interventions, 20, 219-224.
Parkin, M. (2006) Microeconomía (versión para Latinoamerica).México D.F. Pearson.
Rachlin, H., Green, L., Kagel, J.H. & Battalio,R. (1976). Economic demand theory and psychological
studies of choice. The Psychology of Learning and Motivation, 10, 129-154.
Roca, A., Milo, J.S. & Lattal, K.A. (2010). Efectos del reforzamiento cualitativamente variado sobre la
tasa de respuesta en ratas. Acta comportamentalia, 19, 3-18.
Roper, T.J. (1975). Nest material and food as reinforcers for mixed-ratio responding in mice.
Learning and motivation, 6, 327-343.
Skinner, B.F. (1938). The behavior of the organisms: an experimental analysis. New York. AppletonCentury-Crofts.
Steinman, W.M. (1968a). Response rate and varied reinforcement: Reinforcers of different
strengths. Psychonomic Science, 10, 37-38.
________ (1968b). Response rate and varied reinforcement: Reinforcers of similar strengths.
Psychonomic Science, 10, 35-36.
Stephens, D.W. (2008) Decision ecology: Foraging and the ecology of animal decision making.
Cognitive, Affective, & Behavioral Neuroscience, 8(4), 475-484.
Wunderlich, R.A. (1961). Strength of generalized conditioned reinforcer as a function of variability
of reward. Journal of Experimental Psychology, 62, 409-415.
- 52 -