Quand puis-je arrêter de récompenser avec de la nourriture en Clicker Training ?

  

Cet article est un article d’Hippologic « When can I stop using food? in Clicker Training » traduit en français dont voici l’original (clic).
Merci beaucoup à Sandra Poppema pour ses ressources précieuses !

  

  

 

C’est une question que beaucoup d’entraîneurs se posent et c’est une question vraiment fascinante pour moi en tant qu’entraîneur au renforcement positif. Je comprends que ça soit une préoccupation pour les personnes qui s’intéressent au Clicker Training et à ceux qui en explorent ses avantages et ses inconvénients.
Cela semble être un problème, non ?

Pourquoi est-ce une question intrigante ?

Si vous connaissez les principes de l’apprentissage, vous comprendrez.
Laisse-moi expliquer. Fondamentalement, il n’y a que deux façons de motiver un cheval à l’entraînement :

  • Renforcer un comportement en enlevant un stimulus aversif. Un stimulus aversif (ex : une pression) est quelque chose que le cheval veut éviter ou fuir.
  • Renforcer un comportement en donnant une récompense. Une récompense est quelque chose que le cheval veut recevoir, quelque chose qu’il aime.

Donc, si quelqu’un me demande « Quand puis-je arrêter d’utiliser de la nourriture durant les entrainements ? », Il semble que la personne veut savoir « Quand puis-je arrêter de renforcer mon comportement ? » Ou « Quand puis-je cesser d’offrir des récompenses ? ».

Je n’ai jamais entendu quelqu’un demander à un moniteur d’équitation « Quand puis-je arrêter d’utiliser ma cravache ? » ou à un employeur qui veut savoir quand il peut cesser de payer ses employés nouvellement embauchés.

C’est une question légitime

Cependant, je comprends d’où vient cette question. La peur de ne plus pouvoir faire faire quoique ce soit à son cheval si vous n’avez pas de nourriture avec vous. Je comprends cela, mais un renforçateur n’est pas quelque chose que vous devez utiliser à chaque fois et qui doit également augmenter avec le temps.

Voici ce qui se passe si vous commencez à utiliser le renforcement positif :

  • Votre cheval apprendra qu’il peut influencer l’entraînement par ses propres actions (le bon comportement mène à un clic, ce qui conduit à une récompense)
  • Votre cheval gagnera en confiance pour essayer de nouveaux comportements car cela augmentera ses chances d’obtenir ce qu’il aime (nourriture). Il s’amusera à découvrir ce qui l’amène à la récompense ou pas.
  • Il aimera évoluer avec vous, car il y a un «puzzle» à résoudre et il n’y a pas de punition pour les «mauvaises réponses». Toutes les réponses sont «bonnes» ou, dans le pire des cas, « non renforcées ».
  • Au début, il s’agira de la nourriture, oui, mais si le dresseur utilise un marqueur (le clic) pour marquer le comportement désiré de manière cohérente, le cheval détournera son attention du renforçateur, la nourriture, au marqueur, le clic. Ainsi, le cheval sera plus axé sur le comportement à effectuer plutôt que sur la nourriture.
  • Dès que le signal du marqueur (le clic) devient un annonceur fiable de la récompense, le clic devient alors aussi précieux que la nourriture. Désormais, le clic devient un renforçateur secondaire. Quelque chose que le cheval a appris à apprécier. Au départ, cela ne signifiait rien, maintenant cela signifie « une récompense arrive ».

Le renforcement ne s’arrête jamais

En renforcement positif comme en renforcement négatif (méthode traditionnelle), le renforcement ne s’arrête jamais.

Si le renforcement s’arrête, le comportement disparaîtra (à l’extinction), à moins qu’il ne s’agisse d’un comportement auto-récompensant, comportement qui se renforce sans interférence extérieure.

Tout comportement doit être renforcé afin de rester dans le « répertoire » des chevaux.
Les cavaliers n’arrêteront jamais d’utiliser des aides à la jambe (relâchement de pression). Si le cheval diminue sa réponse, il recevra un rappel (le cavalier utilisera un renfort) pour répondre plus vite en utilisant par exemple une aide de la jambe plus forte, ou encore l’utilisation de la cravache ou d’éperons.

Est-ce qu’un cheval (bien entraîné) a besoin de souffrir à chaque fois que vous le montez ? Non, il va apprendre à anticiper grâce à un signal, qui est maintenant un indicateur fiable d’une aversion. C’est ce principe qui « maintient le cheval en ligne ». Le cheval a appris à l’éviter.

Qu’en est t’il de l’éducation au renforcement positif ? dois-je toujours conserver la nourriture ?

Oui et non.

Explications

Oui, vous devrez renforcer un comportement appris une fois de temps en temps après son apprentissage. Cela empêchera l’extinction. Cela signifie que vous devrez rappeler à votre cheval qu’il y a « encore une chance d’obtenir quelque chose de bon » (nourriture) de temps en temps pour de bonnes performances.

Non, ça ne doit pas être de la nourriture !

Oui, vous porterez de la nourriture presque à tous les entraînements, mais ce n’est pas ce que vous pensez. Une fois que vous avez découvert à quel point il est amusant (pour vous et votre cheval) de le former et de la facilité avec laquelle vous obtiendrez de nouveaux comportements, vous ne pourrez plus arrêter de lui enseigner encore et toujours plus.

La nourriture est un renforçateur primaire puissant et est utile pour enseigner de nouveaux comportements. C’est pourquoi les entraîneurs de clicker portent presque toujours de la nourriture : ils sont prêts à entraîner de nouveaux comportements !

Non, vous n’avez pas à renforcer chaque fois un comportement bien connu avec de la nourriture. Cela peut prendre beaucoup de temps avant que le comportement positivement renforcé disparaisse. Votre cheval apprendra que vous y êtes indifférent et qu’il est prêt à faire beaucoup plus pour vous lorsque vous ne donnez pas de nourriture. Une fois que votre marqueur devient précieux, vous pouvez remplacer la nourriture avec d’autres renforcements, comme des gratouilles ou d’autres comportements.

 

 

  

Cet article est un article d’Hippologic « When can I stop using food? in Clicker Training » traduit en français dont voici l’original (clic).
Merci beaucoup à Sandra Poppema pour ses ressources précieuses !