Коли "позитивне" не означає м'яке, добре, корисне для собаки.
Про позитивне підкріплення - далі ПП.
Позитивне підкріплення часто сприймається як "м'який" спосіб навчання - достатньо дати ласощі, і потрібна поведінка закріплюється. Це спрощений і не завжди точний погляд.
Насправді позитивне підкріплення - не про доброту і не про гуманність.
Це один із чотирьох квадрантів оперантного обумовлювання, описаних психологом Б. Ф. Скіннером. Його ефективність залежить не від намірів людини, а від точності застосування, контексту та стану собаки. Наскільки він буде безпечним і коректним - залежить від того, як і навіщо він використовується.
Позитивне підкріплення - додаємо стимул, значущий для собаки, щоб потрібна нам поведінка повторювалася частіше (наприклад, ласощі за сидіння, подивитися в очі).
Негативне підкріплення - прибираємо аверсивний стимул, щоб поведінка повторювалася частіше (наприклад, прибираємо натяжіння, ривки повідка, коли собака йде в потрібному темпі).
Позитивне покарання - додаємо аверсивний стимул, щоб поведінка припинилася (наприклад, різкий низький голос у момент небажаної дії).
Негативне покарання - прибираємо доступ до значущого стимулу, щоб поведінка припинилася (припиняємо гру, коли собака починає грубо грати).
Усі чотири техніки можуть змінювати поведінку, але їхня ефективність і побічні ефекти залежать від контексту, цілей і особливостей собаки.
У термінології "позитивне" означає додавання стимулу, "негативне" - його видалення, це технічні позначення, а не оціночні судження.
Детальніше про ПП
Це додавання значущого стимулу після бажаної поведінки для збільшення її частоти. Їжа, гра, ласка, увага - все це може бути підкріпленням, якщо посилює поведінку.
Ключовий момент: підкріпленням є лише те, що реально збільшує ймовірність повторення поведінки.
Якщо собака не повторює дію - значить, те, що ви даєте, не є підкріпленням для неї, яким би "приємним" воно не здавалося вам.
ПП може застосовуватися як шанобливо, так і примусово. Різниця в контексті та в тому, чи залишається у собаки свобода вибору і чи допомагає їй та дія, яку підкріплюють.
Коли ПП стає контролем
Багато хто думає: якщо не караю - значить, поводжуся гуманно. Але заохочення також може бути формою примусу, особливо коли у собаки немає вибору.
Приклад: собака дивиться на господаря - отримує ласощі. Типу вчимо очі. Відволікається на іншу собаку - залишається ні з чим. Поведінка закріплюється, але природні інтереси придушуються.
Практично всім собакам потрібно стежити за сигналами іншої собаки, передавати свої сигнали тілом, щоб нормально спілкуватися. Навіть на відстані. Дивитися в очі власнику - не дуже корисно в такі моменти.
Ми отримуємо не розвиток самостійних здібностей собаки, а звуження можливостей. Собака пристосовується, щоб не втратити доступ до людини.
Любов треба заслужити
Необдумане застосування ПП легко перетворюється на систему умов: увага, ласка, гра - тільки за виконання команд. Контакт стає нагородою, а не основою відносин.
Собака гавкає - гавкіт ігнорують. Мовчить - хвалять. Але гавкіт - це зазвичай вираження емоційного стану, комунікація собаки зі світом, а не так зване "погана" поведінка. Ігноруючи поведінку, ми не навчаємо - ми знецінюємо її сенс.
Ми не вчимося бачити, розуміти собаку в її складних станах, небажаних реакціях. Ми далеко від собаки.
Право сказати "ні"
Якщо собака боїться втратити контакт за "неправильну" поведінку, позитивне підкріплення перетворюється на тиск - це і є те примус, який ми докладно розглянули.
Шанобливе навчання - коли:
  • собака може відмовитися
  • ресурси даються не тільки за поведінку
  • поведінка розглядається через стан собаки
Собака тягне повідок. Зупиняємося/сповільнюємося, собака підлаштовується під потрібний темп. При цьому ще даємо час на обнюхування, достатньої довжини повідок, не пригнічуючи ініціативу собаки. Контакт залишається завжди, а не стає платою за слухняність.
Про ефективність ПП
Ряд досліджень вказує, що позитивне підкріплення знижує рівень стресу і сприяє більш швидкому навчанню порівняно з покаранням.
Але ці дані слід трактувати з обережністю:

У таких роботах ПП порівнюється не з покаранням (ПП, НП) у строгому сенсі, а з примусовими впливами (coercive procedures), що розмиває межі застосування термінів.
Крім того, у деяких дослідженнях присутні методологічні спрощення, які не завжди дозволяють об'єктивно оцінити відмінності між підходами (так, не все, що науково - об'єктивно і практично).
Тож, якщо собака не може відмовитися, не може впливати на процес - навчання перетворюється на управління. Поведінка формується, але стійкість не розвивається.
Така собака може виконувати команди, але погано справляється з несподіванками та стресом.
Ефективність "тільки ПП і більше нічого в житті та навчанні собаки" - це щось із області фантастики або малих знаннях про формування поведінки. Про це ми ще окремо поговоримо.
Коротко про побічні ефекти "тільки на ПП"
Залежність від підкріплення - собака працює тільки з їжею, грою, значущим підкріпленням.
Згасання природної поведінки - самостійні альтернативи, які могли б йти від собаки, не розвиваються.
Виснаження саморегуляції - поведінка постійно спрямовується ззовні, власником.
Набута безпорадність (певною мірою) - зовнішнє управління сприймається як єдиний спосіб.
Маніпуляції через потреби - наприклад, якщо собака голодна, їжа стає не підтримкою, а точкою вразливості.
Контроль без болю - це все одно контроль. Підкріплення може посилювати поведінку, але не завжди залишає свободу вибору.
Наприклад, коли собаці страшно, а їжу використовують для придушення її реакції - наприклад, щоб відволікти від гавкоту або спроб вийти з ситуації, - це не переробка досвіду, а підміна: замість вираження стану формується навчена, часто умовна поведінка.
При цьому те, що в практиці називають "роботою на позитивному підкріпленні", нерідко включає і покарання: різкі звуки, клацання, обмеження доступу до ресурсів. Якщо такі впливи знижують ймовірність поведінки, вони виконують функцію покарання, незалежно від їхньої інтенсивності.
Це не робить метод жорстким, але ставить питання про точку відліку:
Що саме робить втручання гуманним?
Відповідь -
У сприйнятті собаки та в її реальній свободі поведінкового вибору.
Отже,
Позитивне підкріплення - не "м'який" і не "добрий" метод.
Це про формування поведінки шляхом додавання значущого стимулу, що підвищує ймовірність потрібної дії.
Цей підхід вимагає точності, спостережливості та здатності враховувати не лише зовнішню форму поведінки, а й внутрішній стан собаки.
Етичність у роботі визначається не назвою методу, а тим, чи залишається у собаки можливість вибирати, відмовлятися і при цьому зберігати контакт з людиною.
Запитайте себе:
  • Ви реагуєте лише на поведінку чи помічаєте емоції собаки, що стоять за нею?
  • Чи може собака відмовитися, не втративши вашу довіру?
  • Ви навчаєте собаку чи формуєте зручність для себе?
Позитивне підкріплення - в хорошій практиці та відносинах - це спосіб вибудовувати живу взаємодію, в якій важливі обидві сторони.