Правила кликер-дрессировки - Форум стаффи в Сибири

[ Новые сообщения · Участники · Правила форума · Поиск · RSS ]

Страница 1 из 1
1

Правила кликер-дрессировки

Diva

Дата: Суббота, 07.04.2012, 19:47 | Сообщение # 1

Группа: Администраторы

Сообщений: 586

Статус: Offline

Щелчок заканчивает поведение
Это одна из областей работы с кликером, которую многие сначала понимают с трудом. Сила кликера в точности, с которой он отмечает отдельное правильное действие. Собака, с которой провели подготовительное обучение, понимает, что когда она слышит щелчок, то она заслужила поощрение. Поэтому это закон - каждый щелчок сигнализирует собаке о том, что она сделала то, что вы от нее хотели и работа окончена. И это закон, что услышав щелчок, собака вольна прекратить то, что она делала, и получить кусочек. Например, в обучении высылу вы можете щелкнуть, когда собака двигается от вас и уже прошла, скажем, пять шагов по прямой. Когда вы щелкнете, собака может (и так она и сделает!) остановиться; ей позволено вернуться за лакомством. Точно так же в обучении апортировке, если вы щелкнули за подбор предмета, собака имеет полное право его бросить и прийти за лакомством. Это звучит страшновато. "Я не хочу, чтобы собака бросала гантель". Справедливо. Но беспокоиться не о чем.
Помните одно из главных правил отбора поведения: Вы работаете только над одним критерием за раз. В примере с гантелью вы тренируете одну вещь - подбор. Вы получили и поощрили нужное поведение (поднятие гантели). Когда вы добавите "и принеси ее мне", вы больше не будете щелкать за поднятие, а будете подкреплять только полный поднос, нечто более комплексное, чем простой подбор предмета.
Не используйте щелчок в значении "продолжай".
Многие дрессировщики, особенно те, кто относит себя к той или иной "мотивационной" школе - пытаются использовать кликер как поддержку в середине поведения (щелчок - "продолжай"). Есть несколько проблем с использованием щелчка в значении "продолжай". Щелчок означает "хорошо сделано, приходи за поощрением". Это своего рода сделка. Если я использую его в значении "продолжай", я не соблюдаю условия сделки. Я обещал что-то, что не доставил по назначению. Вместо поддержания значимости кликера как условного подкрепления я подрываю ее. Через не очень продолжительное время щелчок станет просто еще одним звуком среди других.
Использование щелчка со значением "продолжай" создает недопонимание. В первый раз, как я щелкну с этой мыслью, собака прекратит делать то, что делала. Теперь я должен объяснить ей, что лакомства не будет. Другими словами, в интересах того, что я считаю ободрением и поддержкой, я на самом деле меняю правила, делая их бессмысленными для собаки, и подрываю наш уже существующий "договор". Эта та ошибка, которую я прошел и сам. Когда я переучил их, моя нужда в ободрении собаки прошла. Теперь, когда она знала, что надо делать, я мог щелкнуть за все поведение в целом, не заботясь о том, чувствует ли она себя уверенной в том, что делает. Это не значит, что я не могу щелкнуть и поощрить собаку в середине поведения без полного разрыва поведенческой цепочки. У меня с собаками есть маленькая система. Когда они занимают статичную позицию и слышат щелчок, они сохраняют эту позицию до специального сигнала, отменяющего эту команду. Так что, например, на укладке во время подзыва я щелкаю в момент укладки, подхожу к собаке, даю ей лакомство и возвращаюсь на место. Затем я либо подзываю ее, либо отпускаю гулять. Я изолирую конкретное поведение для поощрения без нарушения нашей сделки. И есть дополнительный побочный эффект - собака приучается сохранять позицию до получения следующей команды. Это может помочь сделать выполнение всего упражнения более надежным.
"Щелчок" как "мост".
Некоторые из дрессировщиков дельфинов называли свой условный сигнал "мостом" или "соединяющим стимулом". Он имели в виду, что условное подкрепление позволяло им поощрить действие на расстоянии и "заполняло брешь" между моментом подачи условного подкрепления и моментом подачи безусловного подкрепления. Термин постепенно забылся, но смысл не потерялся. В дрессировке "вкусняшка" не всегда прибывает немедленно. Например, в обучении высылу я щелкаю, когда Сэм касается мишени. Затем он поворачивается и бежит ко мне за лакомством. Так что проходит несколько секунд до получения им поощрения. Но когда он добегает до меня и получает свой кусочек, он знает, за что он его получил. В этом смысле кликер служит "мостом" между поведением и его безусловным подкреплением. Одно из сильных мест кликера в том, что вы можете сохранять эту ясность, иногда даже 30 секунд и более. Если мои собаки становятся "жрущими собаками", то есть тычутся мне в руки или лезут в сумку на поясе за лакомством, я использую эту идею "моста", чтобы прервать нежелательное поведение. Я складываю все лакомство в пластиковый контейнер, который ставлю на скамейку в нескольких метрах от нас, и мы начинаем заниматься. Когда я вижу то поведение, которое мне нужно, я щелкаю, и затем иду к скамейке за лакомством. Конечно, это немного затягивает занятие, и я не делаю так постоянно. Это мера коррекции чересчур настойчивых шелти, которым я таким образом напоминаю, что они работают, чтобы услышать щелчок, и только после этого появляется еда. При этом собаки, даже пройдя несколько метров до лавочки, все равно знают, за что именно они получат лакомство, потому что им об этом сообщил щелчок.
Отбор поведения с помощью положительного подкрепления.
Словосочетание "положительное подкрепление" (ПП) означает одновременно и подход, и метод. Оба очень важны в философии дрессировки. Когда я говорю "подход", я не имею в виду притворно счастливое лицо. Я говорю о внутреннем убеждении, или вере, в возможность собаки выполнить задачу. Применяя этот метод с умом, и вы как дрессировщик, и собака разовьете эту веру у себя и друг у друга.
Дрессировка с помощью кликера вырабатывает у собаки характер "игры на победу". Сам процесс обучения дает ей уверенность в том, что она может добиться успеха. Он учит ее, что если она что-то делает достаточно долго и старательно - она получит результат. Дрессировка не учит ее бояться ошибиться, она учит собаку, которая может столкнуться с ошибкой и продолжить работать, зная, что продолжение усилий принесет ей награду. По мере того, как у собаки будет повышаться уверенность, вы, как хэндлер, станете более уверены в собаке. И это будет видно в ринге. Как постепенный отбор поведения помогает получить стабильное выполнение навыков и уверенность собаки в возможности их выполнения? Давайте посмотрим на обучение собаки садиться методом отбора поведения. Собака садится на землю (хорошо), но заваливается на бедро (плохо). Эти качества выполнения и другие (скорость и внимательность) - критерии, т.е. необходимые элементы правильного исполнения упражнения. Чтобы обучить собаку садиться - или любому другому навыку - правильно, вам нужно знать критерии выполнения, и продумать, как объяснить их собаке. Каждый навык содержит несколько критериев, и есть логическая последовательность в их соблюдении. Есть несколько критериев хорошей посадки: 1) Собака должна касаться задом земли; 2) собака должна сидеть сбалансированно по оси "вперед-назад"; 3) собака должна сидеть прямо по оси "право-лево"; 4) посадка должна быть быстрой; 5) собака должна быть способна сидеть продолжительное время
Вы работаете над одним критерием за один раз. В посадке вы должны сначала поощрять касание задом земли. Потом вы учите собаку правильной "механике" посадки, чтобы она не заваливалась на бедро. Это уже "повышение критериев": смысл упражнения теперь не "сесть на землю", а "сесть на землю прямо, не заваливаясь". Когда собака усвоит и это новое требование, вы больше не поощряете расхлябанную посадку, только прямую. В научных терминах это "дифференцированное подкрепление" (ДП). Вы поощряете не все подряд, что делает собака, а только попытки определенного типа или качества. Это не меняет правила "дрессировочного договора". Вы по-прежнему даете собаке то, что она хочет получить в обмен на то, что она делает для вас. Вы просто повышаете уровень требований к выполнению. Собаке теперь приходится стараться немного больше и немного более последовательно, чтобы получить желаемое. Затем вы можете закрепить правильную посадку тем, что между посадкой и щелчком/поощрением будет проходить больше времени. Вместо того, чтобы щелкать в момент касания попой земли, вы увеличите время, отсчитывая одну секунду в течение пары тренировок, затем три, четыре секунды и так далее. (Я не использую часы. Я считаю "один банан, два банана" и т.д.) Этот процесс не только улучшает качество выполнения упражнения, он дает основу будущей выдержке сидя. Собака учится, что поощрение появится; просто чуть попозже.
Ваша задача - понимать критерии каждого упражнения и планировать, как их отрабатывать в логической последовательности. Когда вы это сделаете, и выстроите мастерство собаки, она всегда будет уверена в том, что она знает, что вы хотите, и в своей способности это сделать.
Случайное поощрение.
В каком-то смысле наше поведение "поощряется" каждый день жизнью. Вы улыбаетесь и машете другу, он улыбается и машет в ответ - ваше доброжелательное поведение поощрено. Вы голодны и идете к холодильнику, чтобы поесть, поскольку в прошлом вы не раз находили там еду. Поощрение - часть повседневной жизни. Дрессировщик использует поощрение сознательно. Мы много работаем над тем, чтобы с большой степенью вероятности собака выполняла определенные действия по команде. Поощрение повышает вероятность повторения поведения в будущем.
Два типа подкрепления.
Подкрепление усиливает поведение. Есть только два типа подкрепления: положительное и отрицательное. Оба призваны достичь одного и того же результата - увеличить вероятность того, что поведение, за которым немедленно следовало подкрепление, повторится. Моя философия заключается в том, что обучение поведению лучше всего происходит с помощью положительного подкрепления. Вы можете получить поощрение за что-то, что вы сделали в прошлом, но без особых ожиданий того, что вы повторите это в будущем (как награда за поимку разыскиваемого преступника). Подкрепление же всегда усиливает то поведение, которое его вызвало. Я не использую термины "положительный" и "отрицательный" как морально-этическую оценку "хороший" и "плохой". Эти термины имеют чисто математический смысл. Положительное подкрепление (+П) означает, что вы даете собаке что-то желаемое, чтобы подкрепить (поощрить) поведение, которое только что произошло (собака села и получила печенье). Отрицательное подкрепление (-П) означает, что вы убираете что-то желаемое собакой, чтобы подкрепить то поведение, которое только что произошло. Вся дрессировка с помощью поводка основана на отрицательном подкреплении. Вы применяете неприятное (дергаете поводок), чтобы вызвать поведение, и затем убираете неприятное (ослабляете поводок), когда собака делает правильно (идет рядом, садится, ложится и т.д.). Во всех этих случаях реакция собаки на команду происходит, чтобы избежать рывка поводка. -П учит собаку, как избежать неприятностей или наказания. Как говорит Карен Прайор, -П - это то, что заставляет собаку работать, чтобы избежать его. Вы можете научить собаку навыкам через отрицательное подкрепление, но вы всегда будете работать - и соревноваться - с неприятным воздействием и его избеганием. Вот почему "мотивационные" методы стали так популярны. Это попытка противодействовать неприятному характеру и последствиям обучения на отрицательном подкреплении. С +П мотивация как таковая становится неуместной; это неотъемлемое следствие самого метода.
Положительное подкрепление (обоюдная победа).
Положительное подкрепление - получение собакой того, что она хочет, в ответ на предложенное ей поведение. В "Не рычите на собаку" Карен Прайор определяет +П как "что-то, ради достижения которого собака будет работать". Скиннер писал, что "положительное подкрепление усиливает любое поведение, результатом которого является". Если собака села и я дал ей лакомство, поведение закрепляется. Вероятность того, что она снова сядет, возрастает, потому что это действие приносит приятный результат. Использование положительного подкрепления - это одноступенчатый процесс. Когда вы получите нужное вам поведение, поощрите его. Оперантное научение учит собаку "работать, чтобы заслужить" награду сев, без малейшего негативного оттенка. Другими словами, дрессировщик не реагирует наказанием на то, что собака не села. Он просто положительно реагирует на посадку, когда она случается. Сначала это будет происходить случайно. Но поскольку посадка приносит поощрение, приятное собаке, она будет садиться снова. Со временем собака обобщает полученный урок. Она выучивает, что у нее есть власть влиять на происходящее: делай правильно, и с тобой будут происходить хорошие вещи. Потом собака начинает предъявлять поведение сама, чтобы вызвать приятные последствия, которых ожидает. Поведение становится оперантным. Вот почему оперантное научение с положительным подкреплением, однажды выученное, легче использовать, чем традиционные методы, основанные на "коррекции" или отрицательном подкреплении. Дрессировка с положительным подкреплением гармонизирует желания собаки и дрессировщика. Это дрессировочная "сделка": Хэндлер говорит, "Бафи, сделай то, что мне надо, и я дам тебе то, что хочешь". Бафи отвечает: "Договорились". Вы развиваете утвердительное взаимодействие между собакой и хэндлером. Собака учится получать то, что хочет, делая то, что хотите вы. Когда движение начато, любое новое упражнение, которое вы учите, будет проходить по тем же правилам, и с опытом вам будет все легче. Положительное подкрепление учит животное не бояться нового. Как указывает Мюррей Сидмэн в его книге "Принуждение и его последствия", "И положительное, и отрицательное подкрепление эффективно учат, но они учат и другим вещам. В этом они отличаются. Положительное подкрепление дает нам свободу потворствовать своему любопытству в изучении новых вариантов. Отрицательное подкрепление прививает узкий поведенческий репертуар, оставляя нас боящимися нового, не решающимися исследовать". Собака, которая не боится пробовать новые варианты, будет готова принять новое поведение, и будет лучше воспринимать "отрицательную информацию". Что я имею в виду под "отрицательной информацией"? Когда собака делает ошибку, вы можете захотеть сообщить ей, что она ошиблась, но так, чтобы она не начала бояться. Для этой цели часто используется слово "неправильно", тихо сказанное в обычном тоне. Это подсказывает собаке: "Это не то, попробуй еще раз". Правильно развитое и применяемое, оно может помочь собаке еще раз подумать, что именно надо сделать. Например, в обучении выборке, если Сэм брал неправильную вещь, я мог тихо сказать ему "неправильно", пока он был еще в зоне выборки. Он бросал ее, снова искал и находил правильную. Никакого стресса, никакого шума. В обучении апортировке по направлениям, если я посылал его к вещи №3, а он шел к вещи №2, я мог сказать "неправильно", и он останавливался, задумывался и шел к нужной. Так что в буквальном смысле дрессировка становится диалогом дрессировщика и собаки. Отрицательная информация - это не отрицательное подкрепление. Она работает только потому, что впереди ждет положительное подкрепление. Собака понимает, что надо сделать правильно, она знает, что именно, так что она может понять подсказку, которая говорит, что она сбилась со следа, как информацию, переработать ее и вернуться на след. Это не работает, если собака боится ошибиться! В отсутствие страха, разум собаки становится свободным, и она может работать, несмотря на ошибки.
"Неправильно".
Гэри Уилкс популяризировал использование слова "Неправильно" в ответ на нежелательное поведение. Слово "Неправильно", на мой взгляд, просто сокращает процесс угасания. Оно говорит собаке то же самое, что и лишение ее поощрения в течение некоторого периода времени: "Я не хочу, чтобы ты это делала, так что прекрати так делать". Хоть слово и полезно, надо быть очень аккуратным в его использовании, особенно на ранних стадиях обучения. Весь смысл оперантного научения в том, чтобы собака училась на своем опыте, как выбрать нужное поведение, основываясь на истории его подкрепления. Слишком раннее введение слова "неправильно" может на вид упростить процесс дрессировки, но на самом деле помешает ему. Важно, чтобы и собака, и дрессировщик хорошо ориентировались в правилах поощрения. Собака должна научиться определять, когда ее не поощряют, а дрессировщик должен запастись терпением, чтобы не поощрить собаку в случае нежелательного поведения - точнее, не реагировать на него вообще. Если вы часто используете слово "неправильно", скорее всего, вы просите от собаки слишком многого - т.е. вы просите ее сделать то, что находится за пределами ее понимания. Если вы используете это слово до тоо, как собака поймет критерии и до того, как она поймет, что значит, когда вы не реагируете на предложенное поведение, это слово - не информация, а всего лишь костыль.
Отрицательное подкрепление (обоюдный проигрыш).
ОП, по Скиннеру, "усиливает любое поведение, которое помогает избежать или уменьшить его". Карен Прайор определяет ОП как "то, что заставляет собаку работать, чтобы избежать его". В обычной жизни это обычно процесс объективный. Вы перестаете пить воду, потому что это отрицательно подкрепляется - жажда исчезает после первых глотков. В дрессировке процесс субъективный. ОП в дрессировке имеет два аспекта: предъявление неприятного и его ликвидация. Другими словами, отрицательный раздражитель выполняет две взаимосвязанные функции: а) уменьшает вероятность повторения данного нежелательного действия в будущем; б) увеличивает (при его ликвидации) вероятность повторения желательного действия в будущем. Это определение отрицательного подкрепления не совсем соответствует научному. Думаю, с этим можно смириться. У теории бихевиоризма развит свой огромный словарь, в основном выработанный в лаборатории, и как все мы, я пленник этого словаря. Я считаю, что "Когда я использую слово, оно значит то, что я в данный момент для него выбрал - ни больше, ни меньше". Но в отличие от этого вздорного яйца, я попробую объяснить, что я имею в виду. Давайте опять возьмем наш пример с командой "Сидеть". В традиционной дрессировке собака сидит рядом с дрессировщиком. Он говорит "Бафи, сидеть", и тянет поводок назад, в то же время нажимая собаке на круп (или, в некоторых школах, хлопая по крупу, или сгибая ей задние ноги). Когда собака садится, натяжение поводка ослабевает. Это классическое использование отрицательного подкрепления. Стоять после команды "Сидеть" - нежелательное поведение. Рывок назад - "коррекция" (предъявление неприятного), направленная на исключение неправильного поведения путем связывания его с неприятными последствиями. Ослабление поводка поощряет поведение "сидения" удалением неприятного воздействия в момент совершения требуемого действия. Этот метод учит собаку избегать неприятного воздействия поводком тем, что она не стоит, услышав команду "Сидеть". Это метод дрессировки, используемый в традиционных школах. Умелый дрессировщик может очень эффективно работать поводком, не дергая постоянно собаку и не вызывая у нее кашель или рвотные позывы от рывков за шею. Но независимо от того, насколько нежна и элегантна работа поводком, она основана на отрицательном подкреплении: собака работает, чтобы избежать воздействия.
"Традиционная", или "основанная на командах", дрессировка основана на отрицательном подкреплении. Основной мотив - неприятные последствия всегда где-то рядом на случай, если собака не выполнит то, что требует от нее дрессировщик. Очень популярна фраза "Собака должна знать, что у нее нет выбора, кроме как послушаться". Я использую термин "основанная на командах", чтобы описать этот метод дрессировки, потому что он рассказывает, как происходит процесс обучения и показывает различие между традиционной и оперантной дрессировкой. В традиционной дрессировке процесс начинается с того, что дрессировщик дает собаке команду, которую она не понимает , а потом делает что-то - рывок поводком, щипок за ухо, наведение лакомством или удар током - что заставляет собаку послушаться. Концептуально тип коррекции, или степень гуманности, - нечто нематериальное. Наведение лакомством и удар током - просто противоположные крайности одного и того же: дать команду и заставить ее выполнить. "Основанная на командах" дрессировка работает на отрицательном подкреплении. Сначала поступает слово, а затем вы заставляете собаку выполнить ее. Она начинается с непонимания и имеет тенденцию вырабатывать поведение, неустойчивое к затуханию. Оперантное научение основано на положительном подкреплении. Сначала происходит поведение. Вы берете действия собаки, которые она предъявляет сама, и отбираете из них то, что в итоге формирует целый навык. Вы не прилагаете к этому "слово", пока навык не сформирован практически полностью. Так собака учится, что определенное слово связано с определенным действием, которое всегда приносит желаемый результат.

Diva

Дата: Суббота, 07.04.2012, 19:47 | Сообщение # 2

Группа: Администраторы

Сообщений: 586

Статус: Offline

Отличие отрицательного подкрепления от наказания
Я использую термин "отрицательное подкрепление" как для предъявления неприятного стимула, так и для его удаления при выполнении нужного действия, чтобы подчеркнуть связь во времени и единство целей этих действий. Я также люблю отделять предъявление неприятного стимула, чтобы повлиять на текущее действие, от предъявления такового в момент, когда он уже не может повлиять на действие собаки, поскольку случается долгое время спустя. Этот последний тип я называю "наказание".
Различие важно, поскольку освещает два вопроса: 1) время и 2) необходимость представления альтернативного, желательного поведения. Продолжительность концентрации внимания собаки измеряется в секундах (у отдельных знакомых мне экземпляров пшеничников в наносекундах). Так что, чтобы отрицательное подкрепление работало, оно должно немедленно отвечать на нежелательное поведение. И чтобы быть честным, оно должно предоставлять собаке альтернативу - то, что собака может сделать - и она должна это знать - чтобы вы убрали неприятное воздействие.
"Умная" собака.
В дрессировке собак поведение избегания слишком часто преобладает. Обычное дело - увидеть собак, "сдувшихся" при переходе из Новичков в Открытый класс. Когда в обучение вводят наказание, субъект слишком быстро учится избегать или обходить его, а не делать правильно. Это как минимум частично объясняет то явление, которое называют "собака знает, что она на соревнованиях, и ведет себя плохо". Это собака, которая плохо или совсем не работает в ринге. Некоторые спортсмены говорят, что она "издевается" над хэндлером. Некоторые говорят, что "она знает, что может не послушаться на соревнованиях, и ей за это ничего не будет". Такие объяснения обвиняют собаку или приписывают ей какие-то извращенные мотивы, вместо того, чтобы сфокусироваться на неэффективности обучения. Все, что делает собака - результат обучения! Измененное поведение в ринге подпадает под одну из двух категорий: "фальшивый позитив" или избегание.
"Фальшивый позитив".
Собака, которую учили с помощью отрицательного подкрепления, научена, что отсутствие неприятных последствий означает, что она делает правильно. В ринге и без поводка никакие действия собаки не вызывают неприятностей. Значит, все, что делает собака в ринге - правильно. Я называю это "фальшивый позитив" - собака неправа, но в соответствии с методикой ее обучения получается, что права.
Избегание.
Неприятные воздействия порождают избегание. При встрече с ними целью становится избежать их. Вы делаете то, что должны, только потому, что иначе не удастся их "выключить". Словами Мюррея Сидмана, "отрицательное подкрепление вызывает побег. Когда мы сталкиваемся с неприятностями, мы любым способом стараемся избежать их. Когда мы сталкиваемся с ними опять, мы используем то, что сработало в прошлый раз". В ринге собака может "смыться" как дословно, убежав оттуда, так и образно (не выполнив команду). И, как замечает Сидман, "если мы контролируем других с помощью неприятных воздействий, мы тоже ассоциируемся с неприятностями". Вот почему часто "отказное" поведение в ринге сопровождается действиями или движениями, показывающими неприязнь или боязнь хэндлера.
Положительное подкрепление - не "мотивационная" дрессировка.
Один из подходов к решению проблем "отказа в ринге" лежит в "мотивационной" технике. Я не буду говорить здесь о "мотивации" как таковой. Тренеры этой школы не отказываются от негативного воздействия на собаку как от основы дрессировки. Они просто "перевешивают" неприятное воздействие игрушками, лакомством и энергичной похвалой. Мотивационная дрессировка часто служит для маскировки скрытой проблемы: дрессировка, основанная на негативе, в действительности демотивирует и собаку, и хэндлера. Лучшие спортсмены зачастую долго и упорно ищут собаку, которая могла бы выдержать обучение. И очень мало спортсменов на самом деле могут хорошо дрессировать этим методом.
В отличие от метода дрессировки отрицательным подкреплением обучению с положительным подкреплением свойственно мотивировать обоих. Помните слова Скиннера: "Частое поощрение также строит и поддерживает заинтересованность человека в том, что он делает". С собакой то же самое. Собака работает потому, что она выучила, что ее собственные действия могут принести хороший результат. У нее развивается заинтересованность в том, чтобы сделать правильно. Многие тренеры традиционной школы, которым понравилась эта идея, возвращаются с вопросом "что же делать, если она не хочет делать то, что нужно?". Во-первых, если вы построили у собаки понимание "дрессировочной сделки" правильно, нет причин, по которым она откажется работать. В конце концов, когда вы даете команду, вы даете возможность "заработать". Почему она не послушается? Это не тот случай, когда собака не работает, пока ее не заставишь. Во-вторых, если собака не выполнила что-то - это ерунда. Цель дрессировки - получить очень высокую степень вероятности. Но неважно, насколько высока эта степень, все - и люди, и собаки - периодически ошибаются. Задача в том, чтобы получить максимально лучший результат с максимально возможной частотой. Дрессировка с положительным подкреплением дает возможность добиться этого быстрее, более надежно, чем дрессировка с принуждением.
"Суеверное" поведение.
Стиви Уандер объяснил это проще: суеверие - когда "вы верите в то, чего не понимаете". В дрессировке это то поведение, которое собака повторяет, потому что по причинам, которые она (еще!) не понимает, оно приносит хорошие результаты. Например, где-то в пост-юрском периоде, пока дикие пуделя еще скитались по земле, я охотился и собирал плоды и резал что-то мясное на разделочной доске. Поскольку Сэм крутился у меня под ногами, отлетевший кусочек мяса упал на пол, и Сэм его подобрал. С тех пор, как только я достаю разделочную доску и начинаю рубить, Сэм тут как тут. Он не знает, почему он получил вкусное, но оно было, и если по случайности изредка будут падать еще куски (не то чтобы постоянно, но я бываю неуклюж), то это увеличит вероятность того, что при виде доски он будет сидеть и облизываться.
Возможно, я уже рассказал все, что вам надо знать об отборе поведения и его сохранении. Однако я все же допишу книгу, если позволите. В обычном процессе оперантного научения вы просто положительно реагируете на желательное поведение, предложенное животным. Например, вы учите щенка сидеть. В первое время вы просто поощряете его, когда он садится сам. Через два-три раза щенок начнет садиться при каждой удобной возможности. Я учу "сидеть" с каждой собакой именно так, подлавливая момент. Мы взяли нашего трехлетнего метиса Шкипера в то время, когда у меня вообще не было ни минутки на дрессировку. Но я начал с ним "ознакомление с кликером", и уже после одного занятия он умел сидеть. Когда он думает, что он в беде или просто не уверен в смысле происходящего, он садится. У одного из моих клиентов собака отказывалась лечь. Неважно, как я двигал рукой, чтобы побудить ее лечь, она только наклоняла голову, оставляя ноги прямыми. Однажды я попробовал нажать на круп, она вывернулась и ушла. Так что я оставил ее в покое, и мы, люди, отправились поговорить о политике за чашкой кофе. Через несколько минут она легла в углу. Я щелкнул и бросил ей кусочек. Еще несколько повторений, и я смог ввести команду при укладке. Владелец занимался с ней всю следующую неделю, и она ложилась по команде. Начните с того, что дает вам собака. Поощряйте все, что отдаленно напоминает движение в нужном направлении. Поднятие планки просто означает, что собака должна приложить немного больше усилий именно в том направлении, которое нужно вам.

перевод В.Большакова

Diva

Дата: Вторник, 03.07.2012, 22:04 | Сообщение # 3

Группа: Администраторы

Сообщений: 586

Статус: Offline

http://povodok.org/povodok....emid=40
Выдержки из семинара Мери Рэй по поводу кликер дрессировки

Выдержки из семинара Мери Рэй по поводу кликер дрессировки

ОСНОВЫ КЛИКЕР-ТРЕНИНГА.ЛОМАЕМ СТЕРЕОТИПЫ

Кликать необходимо точно во время выполнения собакой нужного нам действия. Что сначала должен звучать щелчок кликера, а только после этого даваться лакомство. И что если прозвучал щелчок, собака обязательно должна получить награду.
В качестве награды Мэри предпочитает использовать сыр, потому что его не нужно долго грызть, как сухой корм. И он не крошится, как, например, вареная курица, поэтому собака во время дрессировки не отвлекается на вынюхивание упавших микрокусочков.

Все мы выучили азбучную истину о том, что еду собаке нужно давать только из руки или в миске. Каково же было удивление «семинаристов», когда знаменитая дрессировщица начала бросать лакомство для собаки на пол! Конечно, сразу же прозвучал вопрос: «А не приучит ли это собаку подбирать с земли?» «Нет, - ответила Мэри, - потому что собака видит момент броска. Она ждет, что хозяин бросит еще и не старается специально искать, где что-нибудь валяется». В подтверждение Мэри Рэй сказала о своих собаках (а их у нее девять), которые на прогулке всегда находятся под ее контролем. И если псы наткнутся на мертвого кролика, то по команде без проблем отходят от него.
На примере приглашенного «на ковер» лабрадора Мэри Рэй показала, как можно начать заниматься. После того, как сформирован рефлекс «щелчок кликера-лакомство» и собака после щелчка радостно настораживается в ожидании еды, переходим к следующему этапу – учим собаку эту еду зарабатывать. Мэри бросила лакомство в сторону, пес побежал за ним, подобрал и, решив поклянчить еще, подбежал к дрессировщице. В это время раздался щелчок, и лакомство опять улетело в сторону. И каждый раз подход собаки отмечался сигналом кликера. В результате лабрадор понял, что как только он подбежит к Мэри, будет щелчок и лакомство, что он радостно и демонстрировал. Здесь важно не звать собаку, не манить лакомством, не подсказывать ей даже телодвижениями. Собака сама должна открыть для себя способ, при котором она получит вознаграждение. А словесная команда прикрепляется уже после того, как собака стабильно начнет предлагать нужное нам поведение. Но с простыми командами типа «Сидеть», команду можно говорить сразу.
Награда после щелчка – это необязательно лакомство, можно использовать и игрушку. Но на начальных этапах Мэри Рэй рекомендует все же давать еду. На вопрос: «А если моя собака не пищевик?» она категорично ответила: «Чтобы жить, надо есть». На занятиях собака должна быть голодной настолько, чтобы хотеть предлагаемое ей лакомство.

ТАРГЕТ. «Трогательная» палочка

Таргет – это мишень, цель, до которой собака должна дотронуться носом или лапой. С его помощью проще объяснить собаке, что мы от нее хотим. Таргетом может быть все, что угодно - тыльная сторона ладони, палочка-указка с мячиком на конце или просто лист бумаги.
Кусок лакомства вкладывается между средним и безымянным пальцем и ладонь протягивается собаке. Как только она, потянувшись носом, тыкается в ладонь, звучит щелчок (и не забываем давать награду!). Когда собака начнет дотрагиваться носом осознанно, руку можно протягивать уже без зажатого в ней куска. Наученная таким образом, собака начинает следовать за ладонью. Мэри Рэй показывала, как подобный навык облегчает обучение разных команд: от хождения рядом до вращения собаки вокруг себя.
Еще один вид таргета – регулируемая по длине указка. Переводчица Варвара Большакова назвала ее «трогательная» палочка. Принцип обучения – такой же, как и с ладонью.
Даже лист бумаги можно использовать для обозначения мишени. Чтобы собака заинтересовалась, сначала можно класть на него кусок лакомства. И щелкать каждый раз, когда она пытается его съесть. Потом сделать вид, что лакомство положено, и как только собака потянется носом к бумаге, щелкнуть и дать еду. Чтобы опять получить награду, собака опять потянется носом к мишени. Если нам нужно, чтобы собака вставала на мишень лапами, нужно щелкнуть в тот момент, когда она случайно на нее наступит. Вскоре собака начинает понимать, за что ей кликают, и встает на бумагу специально. В Обидиенс мишень-бумажка необходима для обучения собаки высылу в квадрат. В дальнейшем листок делают все меньше и меньше, до тех пор, когда от него можно будет совсем отказаться

Diva

Дата: Вторник, 03.07.2012, 22:05 | Сообщение # 4

Группа: Администраторы

Сообщений: 586

Статус: Offline

Обидиенс. Двигай телом

Мэри Рэй обратила внимание на то, что наши собаки плохо управляют задней частью своего тела. Умение собаки чувствовать, «что происходит у нее сзади», она считает необходимым в любом виде кинологического спорта.
Еще один важный момент, по мнению Мэри Рэй, это рысь на команде «Рядом». Рысить собаку нужно учить. Иноходь – более простой аллюр, поэтому при таком движении собака расслабляется, начинает лениться и не концентрируется на дрессировщике. Рысь на «Рядом» требует от собаки больших усилий, но выглядит это красивее, чем «пеший шаг» и не дает собаке отлынивать от работы.
Для обучения хождения рядом маленьких собак Мэри предложила остроумный способ – обозначить мишень обыкновенным пластырем на брючине хозяина. При движении собачка будет дотрагиваться носом до таргета, сохраняя правильное положение у ноги хозяина.
Лакомство надо давать той рукой, к которой ближе собака, то есть при движении рядом – левой рукой. Если кормить пса с правой руки, то он будет забегать вперед, надеясь получить поощрение.
Обучение команде «Апорт» начинается с того, что мы просто поощряем собаку за касание его носом. Лучше сесть на пол, ближе к собаке, или на стул, потому что обучение этому навыку потребует некоторого времени. Постепенно мы усложняем задачу, щелкаем и кормим уже не за касание, а за попытку взять в пасть, потом – за то, что она несколько секунд подержала апорт во рту. И только после того, как собака хорошо и долго удерживает предмет, можно переходить собственно к апортировке.
Апортировочный предмет не должен быть приятен для жевания и игры с ним. Лучше всего сразу брать специальную деревянную гантель. Гантель должна подходить по размеру для собаки, чтобы ее было удобно брать. Цельные выточенные гантели, что продаются в наших зоомагазинах, Мэри Рэй не одобрила, потому что они катаются. Для Обидиенс подходит гантель, заканчивающаяся квадратами. Если собака хватает гантель не посредине, а за края, их нужно обернуть фольгой для выпечки, собакам она неприятна.
Оказывается, щелчок кликера не всегда означает окончание поведения. Например, на выдержке нужно сразу приучать собаку к тому, что после клика она не должна вскакивать, и что переход в свободное состояние возможен только после того, как хозяин сам подойдет, даст лакомство и отпускающую команду. В этом случае клик говорит собаке: «Ты все делаешь верно, продолжай так же дальше». Причем нужно сразу установить правила: на какой команде что будет означать щелчок кликера – окончание или продолжение поведения – и всегда этих правил придерживаться, чтобы собака не запуталась.
Кликер-тренинг для выставочного тренинга

Все, что Мэри Рэй говорила о хождении красивой рысью для Обидиенс, справедливо и для выставочного ринга. Собаку побуждают двигаться за ладонью-таргетом, при этом рука вытянута в сторону. Это нужно для того, чтобы собака бежала на некотором расстоянии от хендлера и было бы проще контролировать ее правильную походку. Как только шаг или галоп сменяются на рысь, звучит щелчок и собака получает вознаграждение. В результате пес начинает понимать, что лакомство очень просто получить, если бежать рысью.
Кликер помогает и в обучении правильной стойке. Нужное положение лап, головы и хвоста отмечается кликом с последующей вкусняшкой. В результате таких занятий собака сама, осознанно встает в выставочную стойку, потому что знает, какая ее поза одобряется хендлером.

Аджилити. Тише едешь – дальше будешь

Аджилити в Англии начинают заниматься только после того, как собаке исполниться год. До года ее учат основам послушания, так что собаки на тренировках сразу могут начинать работать без поводка. Прыгать собаке сначала дают через низкие барьеры, планку поднимают постепенно. Если собака начала сбивать палки, значит барьер подняли слишком рано и его нужно опять опустить. Конечно, в момент правильного преодоления собака слышит щелчок. То есть ей объясняют задачу – прыгать барьер, не дотрагиваясь до него лапами – на легко выполнимом примере, и понемногу эту задачу усложняют.
Высыл собаки на препятствие, команды «Право» и «Лево», остановка на зоновых снарядах – все это делается с таргетом. Зоны – это еще один случай, когда щелчок не отменяет поведения. Собака должна продолжать стоять на зоне, поставив передние лапы на мишень (лист бумаги), лежащую на земле у схода с бума, горки или качелей. Причем прохождение этих снарядов учат в обратном порядке: сначала собака должна просто стоять на зоне в конце бума, потом пробегать и вставать на зону, спускаясь с него, потом собаку ставят на горизонтальный трап бума. И только в конце можно перейти к прохождению всего снаряда целиком.

Diva

Дата: Вторник, 03.07.2012, 22:07 | Сообщение # 5

Группа: Администраторы

Сообщений: 586

Статус: Offline

Фристайл. «Вы само совершенство…»

Свои танцы с собаками показали 9 пар. По окончанию выступления Мэри очень тактично каждому давала советы, как улучшить их номер. Только про большого пуделя Винта Мэри сказала, что «у нее просто нет слов». А танцевал он, надо сказать, под музыку из фильма «Мэри Поппинс, до свидания!» с очень подходящей к событию песней «Леди Мэри».
На Винте было продемонстрировано обучение собаки движению вокруг хозяина по большому кругу. Для этого вокруг хозяйки пуделя поставили стулья (у себя дома Мэри для этого использует складной щенячий манеж), а Винт оказался снаружи этого «круга». Теперь оставалось только направлять его (лакомством или таргетом), поощряя кликом движение вокруг преграды. Как только в голове у собаки прочно закрепится, что по жесту или команде нужно бегать вокруг, стулья можно убрать.

Чтобы понять, как работает система кликер-тренинга, нужно хотя бы раз увидеть это вживую. Увидеть, как собаки включаются в процесс своей дрессировки, как они начинают понимать те задачи, которые перед ними поставил хозяин. Как они оживают и радуются этой веселой и несложной игре. И как дрессировка из нудной обязаловки превращается для них в любимое занятие.
С ростом популярности метода растет и количество мифов о нем. Вот самые распространенные из них:

Миф № 1: Кликер-тренинг – это панацея. С ее помощью можно обучить любую собаку чему угодно.

На самом деле: Панацея – это правильные отношения между хозяином и собакой. Без этого никакая дрессировка не будет достаточно эффективной.

Миф № 2 (противоположное мнение): Кликер-тренинг подходит только для домашней, трюковой дрессировки. Невозможно добиться от собаки безотказной работы только поощрением.

На самом деле: А кто сказал, что кликер-тренинг – это только поощрение? Просто в нем в качестве наказания используют игнорирование. И факты говорят сами за себя: по всему миру спортивные собаки, собаки-помощники инвалидов (вот уж где ежедневная проверка на прочность!) и пр., обученные с помощью кликер-тренинга, работают безотказно и с энтузиазмом!

Миф № 3. Хозяин собаки, обученной с кликером, обречен всю жизнь носить кликер с собой, иначе его собака не будет работать.

На самом деле: Ни в коем случае! Кликер нужен лишь на этапе обучения. Кликер – это не поощрение, это "переводчик", "объяснялка" для собаки. Когда навык разучен, когда объяснять больше ничего не надо, – кликер уже не нужен.

Миф № 4. Я не хочу, чтобы бездушная механическая штуковина заменила собаке мою похвалу.

На самом деле: Кликер ничего не заменяет. Кликер дополняет. Ваша похвала для собаки бесценна, она означает: "Я тебя люблю!". Щелчок кликера для собаки имеет вполне определенную цену. Он означает: "Ты все делаешь правильно, и за это непременно получишь награду!"

Миф № 5. Кликер заменяет еду (игрушку).

На самом деле: Еще раз – кликер ничего не заменяет, кликер дополняет! Кликер позволяет отсрочить поощрение собаки едой или игрой (что важно при отработке навыков в движении и на расстоянии), но отсутствие награды обесценивает щелчок кликера. Каждый клик должен быть подкреплен (едой или игрой – смотря по тому, в чем сильнее заинтересована собака).

Миф № 6: Собака будет слушаться любого человека, у которого в руках есть кликер.

На самом деле: Собака настроена не на кликер, а на хозяина. Группа собак может дрессироваться по методу кликер- тренинга, и каждая собака будет реагировать только на свой кликер, даже если у всех хозяев кликеры одной модели. Конечно, существуют определенные правила работы с кликером в группе. Как и для любой работы в группе :).

Чтобы лучше понять сущность метода, давайте обратимся к его истории. Более 30 лет группа американских ученых и дрессировщиков, работающих с дельфинами, изобрела новый метод обучения этих животных, основанный на положительном подкреплении желательного поведения и игнорировании нежелательного. Поскольку физический контакт с дельфином для человека затруднителен :), в качестве сигнала "Молодец, все правильно делаешь!" использовался свисток. Метод положительного подкрепления принес неожиданно высокие и стабильные результаты. Дельфины легко и быстро обучались, и работали с большим энтузиазмом.

Позже метод положительного подкрепления распространился и на кинологию. Дрессировщики собак заменили свисток на кликер, а сам метод получил, наконец, название кликер-тренинг.

Что же такое этот самый загадочный кликер? Это всего-навсего маленькая коробочка, чуть меньше спичечного коробка, с металлическим язычком внутри. Если надавить на язычок пальцем – раздается щелчок (клик). Кликер не издает ультразвук, не излучает инфракрасные лучи и не бьет собаку током (такие вопросы задают регулярно :))! Слово "клик" (click) в переводе с английского означает "щелчок". Он просто… щелкает! И в чем же его ценность? Перечислим:

Звук кликера уникален, он не дублирует звуки, встречающиеся в природе, в обычной жизни. Следовательно, собака не услышит его извне.

Правила кликер-дрессировки

Страница 1 из 1
1

Стаффи Сибири

Правила кликер-дрессировки - Форум стаффи в Сибири