Overblog
Editer l'article Suivre ce blog Administration + Créer mon blog
hulk-du-boxitan.overblog.com

Jamais sans mon chien!

Skinner et ses boites à problèmes

Publié le 29 Novembre 2012 par Philippe Roustant

Burrhus Frédéric Skinner (1904-1990)

(J'ai fait un mélange de ce qu'on trouve sur le net et de ce que j'ai déniché dans ma bibliothèque...)

Sa contribution théorique majeure en psychologie est le concept de conditionnement opérant qu'il distingue du conditionnement répondant (Pavlovien). .
Par exemple, on dira qu'une action est conditionnée de manière opérante quand sa fréquence augmente dans le comportement d'un organisme du fait de ses conséquences positives pour l'organisme.
Dans le conditionnement classique, un stimulus entraîne une réponse, dans le conditionnement opérant on renforce une réponse par la manipulation des contingences.
Skinner est l'inventeur d'un dispositif de conditionnement opérant communément appelé « Boites de Skinner ». Ce matériel de laboratoire a simplifié l'étude des mécanismes de conditionnement, notamment en favorisant le développement de modèles expérimentaux du comportement des organismes.
Le conditionnement opérant (aussi appelé conditionnement instrumental, apprentissage skinnerien ou conditionnement de type II) est un concept du béhaviorisme ,initié par Edward Thorndike .
Cette théorie s'intéresse à l'apprentissage duquel résulte une action, tenant compte des conséquences de cette dernière rendant plus ou moins probable la reproduction du dit comportement.
Skinner distingue le conditionnement opérant du conditionnement classique par ses conséquences sur l'environnement et par le fait que la réponse ne soit pas une réaction réflexe de l'organisme.
L'apprentissage skinnerien repose sur deux éléments, le renforcement et la punition pouvant chacun être soit positif soit négatif. Ces termes doivent être pris dans le sens précis du conditionnement opérant :
Renforcement : Conséquence d'un comportement qui rend plus probable que le comportement soit reproduit de nouveau.
Punition : Conséquence d'un comportement qui rend moins probable que le comportement soit reproduit de nouveau.
Un renforcement ou une punition peut être soit :
Positif : Par l'ajout d'un stimulus agissant sur l'organisme.
Négatif : Par le retrait d'un stimulus agissant sur l'organisme.
Ainsi, il existe 4 types de conditionnement opérant :
Renforcement positif : Procédure par laquelle la probabilité de fréquence d'apparition d'un comportement tend à augmenter suite à l'ajout d'un stimulus appétitif contingent à la réponse Ex: Ajout d'une récompense, félicitations...
Renforcement négatif : Procédure par laquelle la probabilité de fréquence d'apparition d'un comportement tend à augmenter suite au retrait d'un stimulus aversif contingent à la réponse. Ex: Retrait d'une obligation, d'une douleur...
Punition positive : Procédure par laquelle la probabilité de fréquence d'apparition d'un comportement tend à diminuer suite à l'ajout d'un stimulus aversif ou conséquence aversive contingente au comportement cible. Ex: Ajout d'une obligation, d'une douleur...
Punition négative : Procédure par laquelle la probabilité de fréquence d'apparition d'un comportement tend à diminuer suite au retrait d'un stimulus appétitif. Ex: Retrait d'un privilège, d'un droit...
Il existe 2 sortes de renforçateurs (éléments de renforcement) :
Renforçateur primaire : Le renforçateur répond directement à un besoin essentiel de l'individu. Ex: Nourriture...
Renforçateur secondaire : Une action est devenue un renforçateur par un certain apprentissage fait au préalable. Ex: Jouet, Jeu, Caresse.
Expériences de Skinner


La plupart des expériences effectuées à propos du conditionnement opérant sont faites sur des animaux. La boite de skinner est souvent utilisée comme outil.
Dans ses premières expériences, Skinner utilisait cette invention de son cru pour démontrer les mécanismes du conditionnement opérant. Il a d'abord pris un rat auquel il a appris à se nourrir de la nourriture qu'il laissait traîner dans la cage. Lorsqu'il le mit dans la boîte de Skinner, le rat se mit à agir comme les autres rats qui cherchent leur nourriture en courant et en reniflant. Ainsi, lorsque l'animal accrocha par inadvertance un levier, une boulette de nourriture tomba dans la cage. Ensuite, le rat continua de se comporter comme n'importe quel rat et finit par réaccrocher le levier. Une nouvelle boulette tomba. Peu à peu, le rongeur commença à appuyer plus souvent sur le levier et, finalement, à le faire chaque fois qu'il avait faim. Ce système est un système de renforcement positif (la nourriture).
Puis Skinner introduisit une variable de récompense: il ne fallait plus presser le levier une seule fois pour obtenir une récompense mais deux fois , puis trois fois, puis quatre...etc...
à chaque fois le comportement du rat s'accéléra . Il ne regardait plus si le distributeur était plein avant d'avoir ,très vite, poussé le nombre de fois demandé sur le levier.
Il n'y a pratiquement pas de limite à ce système, Skinner amena un rat à presser plus de 100 fois sur le levier à toute vitesse. Mais il remarqua aussi que le rat faisait une pause après chaque distribution et il tenta de réduire cette pause en en récompensant de façon aléatoire.
Dès lors, le rat ne s'accorda plus une seconde de répit ,dans l'espoir sans cesse renouvelé que la prochaine pression serait la bonne.
C'est ce que j'appelle le « syndrome du chercheur d'or » connu depuis la ruée vers l'or dans le Yukon: Les prospecteurs qui triaient les boues pour séparer régulièrement les paillettes d'or n'avaient aucune peine à s'arrêter pour manger ou dormir. Ceux qui creusaient sans fin à la recherche d'une pépite ne connaissaient pas de répit car ils pensaient toujours que le prochain coup de pioche allait leur apporter la fortune.
Essayez juste d'imaginer la puissance d'un tel concept appliqué au dressage canin.

Commenter cet article