Principes de base du comportement
Le renforcement peut être considéré comme le principe le plus important du comportement et constitue la clé du changement de comportement. Le renforcement se produit lorsqu’il y a un changement dans un événement ou une condition stimulus qui suit immédiatement une réponse, ce qui augmente la fréquence future de cette réponse dans des conditions similaires. Les changements dans les stimuli qui fonctionnent comme des renforçateurs peuvent être décrits comme la présentation d’un nouveau stimulus dans l’environnement ou le retrait d’un stimulus déjà présent dans l’environnement.
Le renforcement positif se produit lorsqu’un comportement est immédiatement suivi par la présentation d’un stimulus qui, en conséquence, augmente la fréquence future de ce comportement. Par exemple, un rat appuie sur un levier dans une chambre opérante et reçoit une boulette de nourriture. Si la fréquence d’actionnement du levier augmente, on peut en conclure que la présentation de la boulette de nourriture a renforcé positivement le comportement d’actionnement du levier. Un effet similaire peut être observé pour l’enfant qui fait une crise de colère dans un grand magasin. Si le parent » cède » au comportement de l’enfant en achetant un jouet, le fait de piquer une colère à l’avenir est renforcé, de sorte que l’enfant sera plus enclin à piquer une colère à l’avenir pour obtenir le résultat souhaité. (Il convient de noter que le renforcement positif est un terme technique utilisé pour décrire l’effet d’une contingence sur l’apparition d’une réponse. Il s’oppose au terme « récompense », utilisé pour décrire un objet ou une activité présenté à une personne dans le but de modifier son comportement. C’est-à-dire que le renforcement est un effet démontré par une augmentation du comportement, alors qu’une récompense est simplement quelque chose présenté à une personne qui peut ou non affecter son comportement).
Lorsque la fréquence d’un comportement augmente parce qu’un stimulus dans l’environnement a été supprimé, le processus est appelé renforcement négatif. Le renforcement négatif est caractérisé par des contingences de fuite ou d’évitement dans lesquelles l’organisme émet une réponse qui supprime ou évite la présentation d’un stimulus aversif. Le concept de renforcement négatif peut être démontré en revisitant le rat et la chambre opérante. Par exemple, une faible dose d’électricité est envoyée à travers le sol de la chambre opérante, ce qui donne un léger choc au rat et lorsque le rat appuie sur le levier, le choc prend fin. Si la fréquence des pressions sur le levier en présence du choc augmente, la réponse de pression sur le levier a été renforcée négativement. Dans un exemple plus appliqué, le fait de desserrer sa ceinture après un repas copieux a souvent pour effet d’atténuer temporairement l’inconfort associé à un excès de nourriture. Dans cet exemple, la réponse consistant à desserrer la ceinture est renforcée par l’arrêt de la stimulation aversive (inconfort physique), ce qui augmente la probabilité future de cette réponse dans des situations similaires.
Il est important de noter qu’une fois qu’un comportement a été établi et renforcé par un renforcement, il n’est pas nécessaire de renforcer ce comportement à chaque occurrence. De nombreux comportements sont maintenus par un renforcement intermittent de son occurrence. Un programme de renforcement intermittent est une contingence de renforcement dans laquelle certaines occurrences du comportement, mais pas toutes, produisent un renforcement. Cependant, si le renforcement d’un comportement qui a été précédemment renforcé est supprimé pour toutes les occurrences, la fréquence de ce comportement diminuera jusqu’à atteindre les mêmes niveaux qu’avant le renforcement ou cessera complètement. Cette procédure comportementale est appelée extinction.
La punition est un autre principe de comportement qui est défini en fonction de sa fonction. La punition se produit lorsqu’un changement dans un stimulus, un événement ou une condition suit immédiatement un comportement et diminue la fréquence future de ce comportement. Comme le processus de renforcement, la punition affecte le comportement par la présentation ou la suppression d’un stimulus. Si un stimulus aversif est présenté en fonction d’un comportement particulier et qu’il entraîne une diminution de ce comportement, il s’agit d’une punition positive. Par exemple, lorsqu’un enfant court dans la rue sans surveillance, sa mère le réprimande. Par conséquent, la fréquence à laquelle l’enfant court dans la rue diminue. En revanche, la punition négative se produit lorsqu’un stimulus (ou l’accès à des formes de stimulation) est retiré de l’environnement en fonction d’une réponse, ce qui diminue la fréquence future de cette réponse. Un exemple de punition négative peut être illustré par une situation dans laquelle un enfant lance un jouet. La mère lui retire alors le jouet pour qu’il ne puisse pas jouer avec. Dans cet exemple, un stimulus préféré, le jouet, est retiré à la suite d’un comportement inapproprié. Le temps d’arrêt est un autre exemple de punition négative en ce sens que, pendant qu’il est en temps d’arrêt, l’individu n’a pas accès aux sources de renforcement. Si l’on supprime une condition de punition, le comportement finira par s’inverser (augmenter) pour atteindre des niveaux proches de ceux observés avant la punition. Ce processus est appelé récupération de la punition.
Bien que la punition se soit avérée être une procédure efficace pour diminuer le comportement, on peut soutenir qu’il y a des effets secondaires potentiels et des problèmes qui se produisent lors de la mise en œuvre des procédures de punition. Premièrement, la punition peut produire des réactions émotionnelles et agressives. Cela est particulièrement vrai lorsque des procédures de punition positive sont utilisées et qu’un stimulus aversif est présenté comme conséquence d’une réponse. Deuxièmement, des comportements de fuite et d’évitement inappropriés peuvent apparaître lorsqu’un comportement est puni. Par exemple, un enfant peut commencer à mentir ou à cacher des comportements pour éviter d’entrer en contact avec la contingence de la punition. Troisièmement, la punition peut impliquer une modélisation indésirable du comportement punitif. Enfin, la diminution du comportement indésirable de la personne punie peut renforcer négativement le comportement de la personne qui punit. En d’autres termes, la personne qui met en œuvre la contingence de punition peut continuer à appliquer des procédures de punition plus fréquemment à l’avenir.
Les variables critiques pour l’utilisation à la fois de la punition et du renforcement sont la cohérence et la contiguïté. Une conséquence doit être mise en œuvre de manière cohérente pour obtenir l’effet souhaité sur le comportement. Si le renforcement est appliqué sporadiquement, la réponse sera plus résistante au renforcement et moins résistante à l’extinction. De même, si la punition est appliquée de manière variable, le comportement ne diminuera pas aussi rapidement. La contiguïté joue également un rôle dans l’efficacité des procédures de renforcement et de punition. En général, les conséquences différées sont moins efficaces pour modifier le comportement que les conséquences plus immédiates.
Certains analystes du comportement soutiennent que, d’un point de vue fonctionnel, le renforcement et la punition sont les seuls principes nécessaires pour expliquer les effets de base des conséquences comportementales. Cependant, un certain nombre de facteurs peuvent influencer une réponse au sein des contingences comportementales. L’un de ces facteurs est le stimulus antécédent qui signale la disponibilité du renforcement. Un tel stimulus est appelé stimulus discriminant (SD). Par exemple, un ami qui vous demande « Comment allez-vous ? » agit comme un SD qui vous incite à répondre « Je vais bien », ce qui est ensuite renforcé par l’approbation sociale. On ne dirait pas « Je vais bien » en l’absence d’une autre personne demandant comment on se sent. De même, s’arrêter à un feu de signalisation est un exemple de comportement sous l’influence d’un SD. Il n’y a pas de réponse physiologique qui régit ce comportement ; c’est plutôt notre histoire d’apprentissage qui dicte la relation entre s’arrêter ou bouger en présence de feux rouges, jaunes ou verts. Lorsqu’une réponse est sous le contrôle de certains stimuli et pas d’autres, on dit qu’elle est sous le contrôle du stimulus (comme dans le cas de s’arrêter au lieu de rouler en présence d’un feu rouge).
Un autre facteur qui peut potentiellement influencer une réponse au sein d’une contingence comportementale est la valeur renforçante de la conséquence. Une opération motivante (MO) désigne une variable environnementale qui modifie l’efficacité du renforcement d’un stimulus, d’un événement ou d’une condition et qui modifie la fréquence actuelle de tous les comportements qui ont été renforcés par ce stimulus, cet événement ou cette condition. Un exemple courant de MO est la privation de nourriture. La privation de nourriture agit comme une MO qui augmente l’efficacité et la valeur renforçantes de la nourriture. Par conséquent, la privation de nourriture évoque un comportement qui, par le passé, a été renforcé par la nourriture. Par exemple, la réaction d’ingestion de nourriture (par exemple, manger un sandwich) est plus susceptible de se produire lorsqu’on n’a pas mangé depuis plusieurs heures. Il est peu probable que le sandwich soit hautement renforçant immédiatement après avoir mangé un gros déjeuner.
Au cours des 70 dernières années, des milliers d’études ont littéralement soutenu les principes fondamentaux de l’analyse du comportement par le biais de recherches empiriques approfondies menées à la fois en laboratoire de base et dans des contextes appliqués. Dans les sections suivantes, l’accent de la recherche et de la pratique sera mis sur la VAE et l’ACA.