Overblog
Editer l'article Suivre ce blog Administration + Créer mon blog
hulk-du-boxitan.overblog.com

Jamais sans mon chien!

Traduction du texte de Karen Prior sur la MAP de base

Publié le 22 Octobre 2014 par Philippe Roustant

Renforcer tous les comportements

Une marche polie, à la portée de tous

En septembre, j'ai animé un atelier au cours de la réunion annuelle de l'Association des formateurs d'animaux de compagnie, ce qui est toujours à la fois un honneur et un plaisir. Dans cet atelier, j'ai fait la démonstration d'un exercice que m'avait enseigné à une réunion précédente de l'Association le formateur Tibby Chase, qui vise à apprendre aux chiens inattentifs à marcher poliment à côté de quelqu'un. L'exercice implique un ciblage et une formation et est efficace même si ni le conducteur ni le chien ne connaissent rien de l'entraînement avec le clicker.

L'APDT s'était arrangée pour qu'un propriétaire de chiens de compagnie amène trois chiens gentils mais qui n'avaient pratiquement reçu aucune formation. Aucun des chiens n'était habitué à paraître en public, et tout en étant relativement tranquilles, ils essayaient, naturellement, de renifler tout et d'accueillir tout le monde, tirant sur leurs laisses et ne prêtant que peu d'attention à la personne qui les tenait. Le propriétaire trouva un dresseur volontaire pour chaque chien, de façon à que je puisse leur faire faire l'exercice l'un après l'autre.

Configuration du jeu

Je plaçai environ dix jalons circulaires colorés (du genre de ceux que l'on utilise pour l'entraînement des enfants au football) sur une ligne droite à peu près à quatre pieds ( ou deux pas) l'un de l'autre à travers la pièce. Je fis partir le dresseur et le chien à un bout de la ligne et je les fis marcher jusqu'à l'autre bout: la seule instruction était que chaque fois que je cliquais, le dresseur devait s'arrêter et donner une récompense au chien.

Si le chien marchait à la gauche du propriétaire, je cliquais juste avant qu'ils n'arrivent au prochain point. Au cinquième point, je n'avais pas à me soucier de la position du chien. J'avais placé les points si proches les uns des autres que le chien avait à peine le temps d'être distrait ou de bouger entre les points.

A la fin de la rangée, je demandai au dresseur de tourner et de ramener le chien le long de la ligne. Au début le chien était distrait au moment du du demi-tour, et il pouvait arriver que le chien ou le dresseur tirent sur la laisse, mais dès qu'ils repartaient sur la ligne, le chien se remettait en position. Clic-arrêt, récompense clic-arrêt, récompense, clic-arrêt, récompense, tout au long des dix jalons. A ce stade, le chien restait près du dresseur délibérément, et la laisse était relâchée entre eux.

Jusque là, j 'utilisais un programme de renforcement. Le chien faisait ce que j'avais en tête, le click le ponctuait encore et encore, et le clic était toujours suivi de nourriture.

Ça devient plus délicat

Avant le nouveau passage, j'intervins et j'enlevai les troisième, cinquième et septième jalons. J'avais ainsi introduit un nouveau critère: la distance. Maintenant il y avait trois espaces dans la ligne qui étaient plus longs qu'auparavant. " Quelquefois, chien, tu dois aller un peu plus loin pour avoir le moment du clic". Comme je m'y attendais, le premier chien vagabonda un peu dans le premier espace. Puis comme le chien et le dresseur approchaient du nouveau jalon, si le chien était de nouveau plus près du dresseur, je cliquais. J'étais en train de façonner le comportement suivant: "marche près du dresseur sur des distances de plus en plus longues". Généralement, au moment où le dresseur et le chien atteignaient l'intervalle entre le sixième et le huitième point, le chien était de nouveau collé à côté du dresseur et restait ainsi jusqu'à la fin. Pour un des chiens cependant, un grand chien de meute issu d'un croisement qui avait été le plus inattentif et qui tirait le plus sur la laisse au début , il fallut trois passages le long de la ligne pour rester au pied pendant tous les espaces plus grands entre les jalons.


Vous pourriez dire que je renforçais le comportement continuellement, puisque je cliquais résolument à chaque fois que le comportement correct se produisait: à chaque fois que le chien, la personne et le point étaient très proches. Mais, du point de vue du chien, il était renforcé sur une base prévisible, et, maintenant, soudain, il n'était plus aussi prévisible. Le chien doit faire un peu plus d'efforts, maintenir le comportement un peu plus longtemps, pour trouver la manière de faire revenir le clic à coup sûr.

Les programmes de façonnage

Au cours du programme de façonnage, à chaque fois que vous établissez le comportement, le chien est renforcé suivant un programme continu: c'est-à-dire qu'il adopte le comportement et qu' il obtient le clic/ récompense. Dès que vous voulez améliorer le comportement, cependant, et que vous introduisez un critère, le chien se trouve dans un programme moins prévisible. Les exigences sont un peu différentes et il ne sera pas renforcé à chaque fois. Du point de vue du chien, le programme est devenu variable. Quand le chien répond au nouveau critère à chaque fois, le renforcement redevient continu.

Marian Brelan Bailey m'a dit qu'elle appelait cela un "programme de façonnage", c'est une séquence naturelle du processus de façonnage. Le renforcement peut aller du prévisible au moins prévisible, et de nouveau au prévisible, tandis que vous avancez, pas à pas, vers votre but ultime.Quelquefois un animal novice peut trouver cela déconcertant. Si deux ou trois renforcements échouent à se matérialiser, l'animal peut simplement renoncer et vous laisser tomber. On peut voir cela clairement sur la vidéo de mon poisson apprenant à nager à travers un cerceau. Quand trois essais "n'ont pas marché", non seulement le poisson a renoncé, mais il a eu un effondrement émotionnel, il était couché au fond de l'aquarium dans un état de détresse visible.Il ne proposait plus de nage dans le cerceau, les scientifiques diraient que le comportement était éteint.

Retrouver des comportements éteints

L'extinction n'efface pas un comportement; une fois qu'il a été appris, il existe toujours dans le système nerveux de l'animal. Il y a un certain nombre de manières de retrouver un comportement qui s'est éteint, tels que réduire le critère (revenir à un point tous les deux pieds) ou simplement faire appel à quelque autre comportement bien assimilé, ou attendre une heure et faire un nouvel essai. Mais peut-être la manière la plus élégante est de faire naître chez l'animal un peu de confiance, un peu de résilience , en introduisant un peu de variabilité dans le programme de renforcement, mais avec beaucoup de précautions. Le chien obtient principalement le renforcement qu'il attendait pour le comportement qu'il est juste en train d'apprendre, mais quelquefois, il doit adopter le comportement deux fois, ou aller deux fois au même point, ou deux fois aussi loin pour un simple clic.C'était ce que je provoquais dans ces chiens naïfs, en enlevant un jalon point par-ci, par-là: quelquefois les chiens devaient parcourir la distance habituelle et quelquefois deux fois la distance habituelle.

Tout d'abord, chacun des chiens pensait que le jeu était fini, et puis ils découvrirent que ça marchait toujours. A la fois leur confiance et la force du comportement s'accrurent. Au cinquième passage le long de la ligne, chacun des trois chiens avait l'air d'un diplômé policé d'une classe d'obéissance: bloqué en position près du dresseur avec sa laisse bien relâchée, remuant la queue, la tête tournée pour regarder impatiemment le visage de la personne, attendant le prochain moment magique où un clic-arrêt/récompense surviendrait.

Des progrès surprenants
Juste pour le plaisir, quand le dernier chien, ce gros chien de meute croisé, parcourut la ligne parfaitement, obéit avec une allure altière, tourna la tête, et tout, j'attrapais quelques jalons et les plaçai séparés de plusieurs mètres en travers d'une partie vide de la salle dans la direction de l'entrée, éloignée. Depuis la fin de la ligne j'envoyai le dresseur au travers des espaces vides, avec les jalons comme cibles pour la guider. Avec juste deux ou trois clics et récompenses dans les deux sens, le chien marcha gentiment au pied, la regardant fixement, pendant la traversée de la salle et le trajet de retour. Le chien facile à vivre pouvait alors accepter de grands accroissements en critère, et avoir encore un comportement tellement adapté qu'il était de nouveau sur un programme continu. Bon chien!
Des pourcentages variables
Ainsi il y a un moment où un pourcentage variable de clic/ récompense pour un comportement proposé survient: quand vous vous renforcez de manière sélective un comportement meilleur ou plus fort ou différent. Cela peut encore se produire quand vous ajoutez le signal. Quelques comportements peuvent être renforcés et d'autres pas du point de vue de l'animal, sans qu'il y ait de certitude , et cela suppose un peu d'endurance à propos de ces clics manqués pour envisager comment satisfaire le nouveau critère. Et encore une fois, quand le comportement devient une partie d'un répertoire plus fourni et qu'il est transposé dans la vie courante, et que les renforcements naturels prennent le dessus, il se peut que le renforcement soit imprévisible, et, en conséquence (à mon avis) sur un programme à pourcentage variable. Cependant le comportement est maintenu.
Une fois qu'un comportement simple a été appris, un programme long et imprévisible peut en fait maintenir avec une force incroyable un comportement dont vous NE VOULEZ PAS; Les gens par inadvertance dressent les chats à les faire se lever pendant la nuit, les chiens à tirer comme des trains de marchandises, et les enfants à avoir des caprices, en en refusant à certains moments et cédant à d'autres, donnant à manger au chat, allant où le chien veut aller, ou achetant des bonbons au supermarché irrégulièrement sans raison particulière . Les casinos, croyez-moi, utilisent le pouvoir du programme du pourcentage variable pour développer des comportements, tels que celui de jouer aux machines à sous, qui sont vraiment difficiles à éradiquer, en dépit de renforcements variables et imprévisibles.
Aussi, quand utilisez-vous délibérément un programme de renforcement à pourcentage variable? En augmentant les critères. Pour construire une résistance à l'extinction durant le façonnage. Pour étendre la durée et la distance d'un comportement (faire du ping-pong, comme disent Morgan Spector et Corally Burmaster)
Quand ne l'utilisez-vous PAS?
Jamais simplement comme outil de maintien. Les comportements qui surviennent avec le même niveau de difficulté à chaque fois sont mieux maintenus par un renforcement continu ou par un renforcement avec des combinaisons diverses avec d'autres comportements, plutôt qu'en négligeant délibérément de renforcer des comportements satisfaisant.
Jamais pour maintenir des chaînes. J'ai eu un jour le privilège de présenter un atelier avec Debi Davis et je vis son chien de compagnie, un papillon, sauter de ses genoux pour ramasser et lui rapporter un billet d'un dollar qu'elle avait laissé tomber. Debi cliqua rapidement et donna une récompense, et puis elle me dit que des gens lui reprochaient régulièrement d'agir ainsi, et lui disaient que le comportement ne devait PAS être renforcé à chaque fois. Mais c'était un comportement qui impliquait une chaîne d'étapes multiples. L'environnement fournissait le signal pour chaque étape de la chaîne. ( voir l'argent tomber, , sauter, atteindre l'argent, le ramasser. Tu as l'argent? Rapporte-le à Debi. etc..).Chaque signal renforçait le comportement qui le précédait. Mais ne pas renforcer toute la chaîne à la fin mettrait inévitablement en pièces la chaîne qui commencerait à s'éteindre en cours de route. Debi avait raison. Payez le bon chien pour cet excellent travail !
Jamais pour des problèmes de sélection tels que des articles qu'il doit flairer. Si vous demandez à un chien de choisir entre deux objets ou stimuli, vous devez lui dire quand il a raison, le mettre dans une situation : deux articles pour le prix d'un , revient à le punir les réponses correctes.
J'ai été très heureuse de la super-performance de mes trois chiens-qui- tirent- sur-la- laisse à l'APDT, heureuse de démontrer comment passer d'un renforcement continu à intermittent et réciproquement vous permet d'accroître les critères très vite- jusqu'à ce qu'un dresseur se plaigne ensuite de ce que j'avais utilisé des chiens inadéquats. " Cela aurait été une meilleure démonstration, dit-elle, s'ils n'avaient pas été déjà si bien entraînés."
.

Commenter cet article