Винагорода для дресирування собак: як це працює та де його межі
Навчання з винагородою не є новим. Принципи сягають фундаментальної науки про поведінку, яка передувала сучасному дресирування собак на десятиліття. Що змінилося за останні п'ятнадцять-двадцять років, так це популяризація цілеспрямованого та систематичного застосування цих принципів у дресируванні собак, замінюючи старі методи, які більшою мірою покладалися на корекцію. Ця зміна дала кращі результати для більшості собак. Але «кращий» не означає ідеальний, і нюанси мають значення.
Чому навчання винагород працює надійно
Позитивне підкріплення збільшує частоту поведінки, якій воно слідує. Це не думка; це спостережуваний принцип поведінки, який застосовується до всіх видів. Собака, яка сидить і отримує a лікування собаки буде сидіти частіше в подібних ситуаціях. Чим послідовніше підкріплення, тим швидше зміцнюється поведінка. Ось чому точний час має значення: винагорода має відбутися протягом однієї-двох секунд після бажаної поведінки, щоб собака правильно зв’язала їх.
A клікер дресирування собак робить синхронізацію точним, оскільки звук швидший і чіткіший, ніж лише словесна похвала. При постійному використанні клацання позначає точний момент правильної поведінки та передбачає винагороду. Поведінка, яка відбувалася в момент клацання, є поведінкою, яка посилює. Ось чому помилки часу натискання дають суперечливі результати.
Цінність винагороди та конкуруючі мотиви
Навчання винагородою залежить від того, чи винагорода є більшою мотивацією для собаки, ніж будь-яка альтернатива. У вітальні, де нічого не відволікає, достатньою винагородою для того, щоб посидіти, є шматок крокет. У парку для собак, де видно інших собак, шматок крупи не може конкурувати. Це не помилка навчання винагороди — це помилка калібрування. Цінні нагороди (маленькі шматочки справжнього м'яса, сир, сублімовані ласощі для собак) повинні бути підібрані для середовища з високим рівнем відволікання. Більшість невдач у навчанні з методами винагороди насправді є невдачами калібрування винагороди.
Межі та комбінований підхід
Самого тренування винагороди інколи недостатньо для собак із дуже сильним потягом до здобичі, собак, які працюють у середовищах із високим збудженням, або собак, чия проблемна поведінка внутрішньо підсилює так, як їжа не може конкурувати. Собака, яка ганяється за білками, підкріплюється самою погонею — більш потужним підкріплювачем, ніж будь-які ласощі, доступні від стаціонарного провідника. Це не означає, що навчання винагороди не вдається; це означає, що керування повідком, контроль навколишнього середовища та тренування імпульсів повинні працювати разом із цим.
Найкращі результати в більшості програм дресирування поєднують позитивне підкріплення як основний інструмент із належним керуванням і чітким повідомленням про те, що не приносить винагороди — не виправлення в традиційному значенні покарання, а чіткий нейтральний маркер, який говорить собаці, що «це не та поведінка, яку я шукаю».
Що б я пропустив
Пропустіть ідеологічну версію навчання винагороди, яка відмовляється визнавати вищезазначені обмеження. Собака з істинним укусом, сильним компульсивним поведінкою або сильним страхом може потребувати фармацевтичної підтримки разом із поведінковою роботою. Наполягати на тому, що одних лише ласощів завжди достатньо, не можна чесно сказати про повну картину.
Я б також пропустив припущення, що поступова відмова від ласощів означає поступову відмову від підкріплення. Переривчасте підкріплення — лікування за змінним графіком після встановлення певної поведінки — насправді створює більш надійну, наполегливу поведінку, ніж постійна винагорода. Мета полягає не в тому, щоб завжди носити з собою ласощі, а в тому, щоб використовувати їх стратегічно під час навчання, а потім підтримувати поведінку з періодичним підкріпленням, щоб собаці було вигідно продовжувати пропонувати його.
Готові робити покупки? Порівняйте Домашні тварини по магазинах →





