Overblog
Editer l'article Suivre ce blog Administration + Créer mon blog
hulk-du-boxitan.overblog.com

Jamais sans mon chien!

Renforcement et punition: Définitions sommaires.

Publié le 22 Mars 2013 par Philippe Roustant

Comme je prépare un article sur les performances comparées des différentes méthodes d'apprentissage, il m'a semblé utile de revenir sur les termes employés par les théoriciens du comportement.
L'apprentissage repose sur deux éléments, le renforcement la punition, pouvant chacun être soit positif soit négatif. Ces termes doivent être pris dans le sens précis du conditionnement opérant :
Renforcement : Conséquence d'un comportement qui rend plus probable que le comportement soit reproduit de nouveau.
Punition : Conséquence d'un comportement qui rend moins probable que le comportement soit reproduit de nouveau.
Un renforcement ou une punition peut être soit :
Positif : Par l'ajout d'un stimulus agréable (nourriture par exemple)
Négatif : Par le retrait d'un stimulus désagréable (On enlève quelque chose de désagréable, par exemple, un choc électrique)
Renforcement positif (R+): Procédure par laquelle la probabilité de fréquence d'apparition d'un comportement tend à augmenter suite à l'ajout d'un stimulus agréable. Ex: Ajout d'une récompense
Quand on parle de récompense, on pense souvent à une friandise, au jouet ou à une caresse mais la vraie récompense pour un chien c'est ce dont il a envie dans l'instant.
Si l'on essaie par exemple de récompenser un chien qui s'assoie, en lui donnant une friandise alors que son plus grand désir est, à ce moment précis, d'aller jouer avec un congénère, nous ne sommes pas dans le renforcement. A cet instant, la nourriture n'est pas perçue comme une récompense, même si habituellement ce chien aime les friandises.

Renforcement négatif (R-) : Procédure par laquelle la probabilité de fréquence d'apparition d'un comportement tend à augmenter suite au retrait d'un stimulus aversif. Ex: Retrait d'une douleur... Le renforcement négatif consiste à supprimer un stimulus désagréable ou douloureux lorsque le comportement du chien devient adéquat. C'est un évènement qui augmente la fréquence d'apparition d'un comportement grâce à un retrait ou à l'arrêt d'un stimulus désagréable, quelle que soit son intensité.
le R- est aussi appelé "confort/inconfort".
par exemple, apprendre à un chien le « assis » en tapotant son arrière train avec une badine( inconfort). Lorsque le chien s'asseoit pour s'éloigner du stimulus perturbant ou désagréable, celui-ci cesse (confort). Avec les répétitions , le simple fait de le toucher avec la badine le fera asseoir, puis associer cette action avec l'ordre qui sera posé dessus.
Qu'il soit positif ou négatif le renforcement sert à augmenter la fréquence d'apparition d'un comportement.

Punition positive (P+) : Procédure par laquelle la probabilité de fréquence d'apparition d'un comportement tend à diminuer suite à l'ajout d'un stimulus aversif Ex: Ajout d'une douleur... Dans la punition positive , le mot positif veut dire qu'on ajoute quelque chose.
Exemple: Le chien qui aboie après un congénère est soulevé de terre et reposé dès qu'il se tait.
Punition négative (P-): Procédure par laquelle la probabilité de fréquence d'apparition d'un comportement tend à diminuer suite au retrait d'un stimulus agréable Ex: Non attribution d'une récompense.Dans la punition négative, le mot négatif veut dire que l'on retire quelque chose.
Qu'elle soit positive ou négative, la punition sert a réduire la fréquence d'apparition d'un
comportement.
Exemple: Le chien aboie pour réclamer sa balle dans les mains du conducteur, celui-ci la range.
Par extension, l'utilisation globale du clicker, qui ne vient récompenser que les bonnes attitudes et ignore les mauvaises, participe aussi de ce procédé
Il existe 2 sortes de renforçateurs (éléments de renforcement) :
Renforçateur primaire : Le renforçateur répond directement à un besoin essentiel de l'individu. Ex: Nourriture...
Renforçateur secondaire : C'est un renforçateur créé par un apprentissage réalisé au préalable. Ex: Jeu.

Commenter cet article