Programa intermitente de refuerzo - una visión general | ScienceDirect Topics

Principios básicos de la conducta

El refuerzo puede ser considerado el principio más importante de la conducta y es la clave para el cambio de comportamiento. El refuerzo se produce cuando hay un cambio en un evento o condición de estímulo que sigue inmediatamente a una respuesta, que aumenta la frecuencia futura de esa respuesta en condiciones similares. Los cambios en los estímulos que funcionan como reforzadores pueden describirse como la presentación de un nuevo estímulo en el entorno o la eliminación de un estímulo ya presente en el entorno.

El refuerzo positivo se produce cuando un comportamiento es inmediatamente seguido por la presentación de un estímulo que, como resultado, aumenta la frecuencia futura de ese comportamiento. Por ejemplo, una rata presiona una palanca en una cámara operante y recibe una bolita de comida. Si la frecuencia de pulsar la palanca aumenta, se puede concluir que la presentación de la bolita de comida reforzó positivamente la conducta de pulsar la palanca. Un efecto similar podría observarse en el caso del niño que hace una rabieta en los grandes almacenes. Si el padre «cede» ante el comportamiento del niño comprando un juguete, la futura ocurrencia de la rabieta se refuerza de tal manera que el niño puede ser más propenso a hacer una rabieta en el futuro para producir un resultado deseado. (Cabe señalar que el refuerzo positivo es un término técnico que se utiliza para describir el efecto de una contingencia en la aparición de una respuesta. Esto contrasta con el término «recompensa», que se utiliza para describir un elemento o actividad que se presenta a alguien en un intento de cambiar el comportamiento. Es decir, el refuerzo es un efecto demostrado por un aumento de la conducta, mientras que una recompensa es simplemente algo presentado a una persona que puede o no afectar a su conducta).

Cuando la frecuencia de una conducta aumenta porque se ha eliminado un estímulo del entorno, el proceso se denomina refuerzo negativo. El refuerzo negativo se caracteriza por contingencias de escape o evitación en las que el organismo emite una respuesta que elimina o evita la presentación de un estímulo aversivo. El concepto de refuerzo negativo puede demostrarse volviendo a la rata y a la cámara operante. Por ejemplo, se envía una dosis baja de electricidad a través del suelo de la cámara operante, lo que provoca una leve descarga a la rata y, cuando ésta presiona la palanca, se termina la descarga. Si la frecuencia de presionar la palanca en presencia del choque aumenta, la respuesta de presionar la palanca ha sido reforzada negativamente. En un ejemplo más aplicado, aflojarse el cinturón tras una comida copiosa suele atenuar temporalmente el malestar asociado a comer demasiado. En este ejemplo, la respuesta de aflojarse el cinturón se ve reforzada por el cese de la estimulación aversiva (malestar físico) que aumenta la probabilidad futura de esta respuesta en situaciones similares.

Es importante tener en cuenta que una vez que un comportamiento se ha establecido y reforzado con el refuerzo, no es necesario reforzar ese comportamiento en cada ocurrencia. Muchas conductas se mantienen reforzando intermitentemente su ocurrencia. Un programa de refuerzo intermitente es una contingencia de refuerzo en la que algunas ocurrencias de la conducta, pero no todas, producen refuerzo. Sin embargo, si el refuerzo para una conducta que fue previamente reforzada se retiene para todas las ocurrencias, la frecuencia de esa conducta disminuirá a niveles similares demostrados antes del refuerzo o cesará por completo. Este procedimiento conductual se denomina extinción.

El castigo es otro principio de la conducta que se define en base a su función. El castigo ocurre cuando un cambio en un estímulo, evento o condición sigue inmediatamente a un comportamiento y disminuye la frecuencia futura de ese comportamiento. Al igual que el proceso de refuerzo, el castigo afecta al comportamiento a través de la presentación o la eliminación de un estímulo. Si se presenta un estímulo aversivo contingente a un comportamiento particular que resulta en una disminución de ese comportamiento, se ha producido un castigo positivo. Por ejemplo, cuando un niño corre hacia la calle sin supervisión, su madre le reprende. Por tanto, la frecuencia con la que el niño corre hacia la calle disminuye. Por el contrario, el castigo negativo se produce cuando se retira un estímulo (o el acceso a formas de estimulación) del entorno contingente a una respuesta, y disminuye la frecuencia futura de esa respuesta. Un ejemplo de contingencia de castigo negativo puede demostrarse con una situación en la que un niño tira un juguete. La madre le quita el juguete para que no pueda jugar con él. En este ejemplo se retira un estímulo preferido, el juguete, tras un comportamiento inadecuado. El tiempo de espera es otro ejemplo de contingencia de castigo negativo en el sentido de que, mientras está en el tiempo de espera, el individuo no puede acceder a las fuentes de refuerzo. Si se elimina una contingencia de castigo, el comportamiento acabará revirtiéndose (aumentando) hasta alcanzar niveles cercanos a los observados antes del castigo. Este proceso se denomina recuperación del castigo.

Aunque se ha demostrado que el castigo es un procedimiento eficaz para disminuir la conducta, se puede argumentar que hay posibles efectos secundarios y problemas que se producen al aplicar los procedimientos de castigo. En primer lugar, el castigo puede producir reacciones emocionales y agresivas. Esto se observa especialmente cuando se utilizan procedimientos de castigo positivo cuando se presenta un estímulo aversivo como consecuencia de una respuesta. En segundo lugar, pueden surgir conductas inapropiadas de escape y evitación cuando se castiga una conducta. Por ejemplo, un niño puede empezar a mentir u ocultar conductas para evitar el contacto con la contingencia del castigo. En tercer lugar, el castigo puede implicar el modelado indeseable de la conducta de castigo. Por último, la disminución de la conducta indeseable de la persona castigada puede reforzar negativamente la conducta del castigador. En otras palabras, la persona que implementa la contingencia de castigo puede continuar implementando procedimientos de castigo con más frecuencia en el futuro.

Las variables críticas para el uso tanto del castigo como del refuerzo son la consistencia y la contigüidad. Una consecuencia debe aplicarse de forma consistente para obtener el efecto deseado en la conducta. Si el refuerzo se aplica esporádicamente, la respuesta será más resistente al refuerzo y menos resistente a la extinción. Del mismo modo, si el castigo se aplica de forma variable, la conducta no disminuirá tan rápidamente. La contigüidad también desempeña un papel en la eficacia de los procedimientos de refuerzo y castigo. En general, las consecuencias retardadas son menos eficaces para cambiar la conducta que las consecuencias más inmediatas.

Algunos analistas de la conducta sostienen que, desde una perspectiva funcional, el refuerzo y el castigo son los únicos principios necesarios para explicar los efectos básicos de las consecuencias conductuales. Sin embargo, hay una serie de factores que pueden influir en una respuesta dentro de las contingencias conductuales. Uno de estos factores es el estímulo antecedente que señala la disponibilidad del refuerzo a producirse. Dicho estímulo se denomina estímulo discriminativo (ED). Por ejemplo, un amigo que pregunta «¿Cómo estás?» actúa como SD para que uno diga «Estoy bien», lo que se refuerza con la aprobación social. Uno no diría «estoy bien» si no hubiera otra persona que le preguntara cómo se siente. Asimismo, detenerse en una señal de tráfico es un ejemplo de comportamiento bajo la influencia de una DS. No hay una respuesta fisiológica que gobierne este comportamiento; más bien, nuestra historia de aprendizaje dicta la relación entre parar o moverse en presencia de luces rojas, amarillas o verdes. Cuando una respuesta está bajo el control de algunos estímulos y no de otros, se dice que está bajo el control del estímulo (como en el caso de detenerse en lugar de conducir en presencia de una luz roja).

Otro factor que puede influir potencialmente en una respuesta dentro de una contingencia conductual es el valor reforzador de la consecuencia. Una operación motivadora (MO) se refiere a una variable ambiental que altera la eficacia reforzadora de un estímulo, evento o condición y altera la frecuencia actual de toda la conducta que ha sido reforzada por ese estímulo evento o condición. Un ejemplo común de una MO es la privación de comida. La privación de comida actúa como una MO que aumenta la eficacia reforzadora y el valor de la comida. Por lo tanto, la privación de comida evoca un comportamiento que, en el pasado, ha sido reforzado con comida. Por ejemplo, la respuesta de ingestión de comida (por ejemplo, comer un sándwich) es más probable que ocurra cuando uno no ha comido durante varias horas. Es poco probable que el sándwich sea altamente reforzante inmediatamente después de comer un gran almuerzo.

A lo largo de los últimos 70 años, literalmente miles de estudios han apoyado los principios fundamentales del análisis de la conducta a través de una extensa investigación empírica llevada a cabo tanto en el laboratorio básico como en entornos aplicados. En las siguientes secciones, se describirá el enfoque de la investigación y la práctica tanto para EAB como para ABA.

Principios básicos de la conducta

Deja una respuesta Cancelar la respuesta