Мы очень часто пользуемся этим термином, объединяя под его именем все неприятные и болевые воздействия на собаку, тем самым запутывая еще больше и так запутанное дело воспитания и дрессировки. По-
Рисунок 2. Принцип действия наказаний
этому, кстати, нам трудно согласиться с утверждением, что наказание нельзя использовать, воспитывая и дрессируя, что оно малоэффективно, что существуют другие, более гуманные и действенные способы, например отрицательное подкрепление.
Так что давайте сначала разберемся, что же такое наказание, чтобы не только согласиться с предложенным выше, но и, узнавая его в лицо, не пользоваться им так часто.
Наказание - это такие наши неприятные для собаки или болевые воздействия, которые мы совершаем уже после ненужного нам или неправильного с нашей точки зрения поведения собаки. То есть между проступком нашего пса и нашими воздействиями проходит какое-то время. Это главное отличие наказания. Если же неприятное воздействие с нашей стороны совершается сразу по окончании нежелательного поведения или во время него, то это - отрицательное подкрепление.
|
|
Вторым отличием наказания является его неизбежность. Какбы.себя ни вела провинившаяся собака после проступка, мы считаем, что ее следует наказать. И наказываем. Например, мы приходим вечером домой и об-
наруживаем в квартире Содом и Гоморру и радостно встречающего нас щенка. С точки зрения среднестатистического хозяина собаки, мы должны его наказать, что мы и делаем. Это на самом деле наказание, так как отдалено от проступка немалым количеством времени и оказалось неизбежным. Как, впрочем, и бесполезным, в чем вы убедитесь со временем сами. Но это одновременно и отрицательное подкрепление ритуала встречи вашего щенка. И вы заметите, как щенок перестает радоваться вашему приходу и все чаще принимает позу подчинения (стыдится наделанного им беспорядка, но продолжает делать его, с вашей точки зрения).
Или ваша собака что-то подобрала на улице и, тщательно пережевывая это что-то, подходит к вам, выполняя команду "Ко мне!". Вы, естественно, ее выдираете аки Сидорову козу, и это является наказанием для подбора пищи (бесполезным, вы сами знаете), но одновременно отрицательным подкреплением подхода к дрессировщику. Ваши действия приводят к тому, что собака перестает в такие моменты подходить к вам, а спокойно доедает подобранное в стороне.
И еще одна ситуация. Вам не нравится, что собака забирается на диван, и вы бы хотели исправить данное поведение. Вы входите в комнату и застаете на диване спящую собаку со счастливым выражением морды. Желая дать понять собаке, что она не права и что вам не нравится такое поведение, вы ее шлепаете. Со временем собака начинает понимать вот что: когда она лежит на диване, ваше появление и угрожающие слова служат сигналом к быстрому спрыгиванию с дивана, чтобы избежать шлепка. То есть вы учите собаку быстро спрыгивать с дивана при помощи отрицательного подкрепления. Но шлепки ваши являются наказанием к тому самому залезанию на диван, с которым вы собрались бороться. Со временем вы сами убедитесь,
|
|
что воспитательное значение этого наказания ничтожно. Об этом же говорит и весь опыт человечества в части борьбы с преступлениями при помощи наказания.
Почему наказание чаще всего бездейственно? Потому, что, во-первых, потребность уже удовлетворена и нежелательное действие уже получило положительное подкрепление. А во-вторых, потому что воздействие как следствие очень отдалено от причины (проступка). Представьте себе - вы наказываете собаку через час после того, как она съела ваши тапочки. В течение этого часа собака еще совершила с десяток безобидных поступков. Как же ей понять, какое именно действие привело к неблагоприятным последствиям? Природа заставляет ее связывать последствия с последним по времени действием, что собака и делает.
Наказание не учит, не дает информацию животно-му о том, какое же поведение правильное. Собака, которую вы наказываете за съеденные тапочки, ничего не может понять, потому что в течение последнего часа она больше не ела никакой обуви. И вам бы порадоваться этому. И еще: наказание чаще всего учит тому, как не попадаться, а не тому, как правильно себя вести. Очень трудно для человека, а для животного практически невозможно изменить будущее поведение, чтобы в будущем избежать его последствий.
И присмотритесь к себе - чаще всего, наказывая собаку, вы просто даете выход своим эмоциям и своим обидам на нее.
Опасно же наказание тем, что, как замечает К. Прайор, оно служит мощным подкреплением наказывающему. Если при помощи наказания нам удалось исправить (а это случается) поведение, то бессознательно мы все чаще и чаще начинаем прибегать к нему. А избыток отрицательных воздействий на молодое животное приводит к тому, что у него пропадает вся-
кое желание воспитываться и дрессироваться, оно вырастает зашуганным и робким.
Наказание может помочь, когда оно не очень далеко отставлено и очень сильное или неожиданное и непривычное, когда поведение, с которым вы боретесь, не очень закрепилось у собаки. То есть, если бы за первое преступление отрубали руку, вряд ли бы возникло желание совершить второе.
Метод 4. Отрицательное подкрепление
Вопрос о подкреплении, как ни странно, довольно запутанный. В отечественной школе физиологов подкреплением считают все безусловные (непосредственные) воздействия на животное, которые следуют после условного сигнала (например, команды). Безусловные воздействия это и предложение пищи собаке, воды, наш окрик, оглаживание, шлепок, в общем, все, что собака непосредственно может воспринять. В случае наличия подкрепления условный рефлекс называют положительным (подкрепляемым) и отрицательным или тормозным (неподкрепляемым), в случае отсутствия безусловного воздействия. При таком подходе болевые воздействия на собаку можно считать подкреплением положительным для того действия, которое мы вырабатываем. Например, когда отрабатываем движение собаки рядом с собой. А действие, которое вырабатывается при помощи боли - оборонительным положительным рефлексом. На самом деле собака совершает нужные нам действия, уходя от боли, предотвращая ее, то есть обороняется.
В оперантной же дрессировке подкреплением считается любое воздействие, увеличивающее или
|
|
Рис. 4. Схема действия отрицательного подкрепления уменьшающее вероятность повторения в будущем предшествующего его воздействию поведения. В таком случае положительным подкреплением считается воздействие, которое увеличивает в будущем вероятность предшествующего ему действия. Другими словами, животное стремится к получению положительного подкрепления. Момент получения положительного подкрепления всегда положительно эмоционален. И, наоборот, животное стремится избежать отрицательного подкрепления. Факт отрицательного подкрепления вызывает отрицательные (негативные) эмоции и снижает вероятность повторения в будущем поведения, приводящего к нему. Неудовлетворение потребности считается в оперантной дрессировке мощным отрицательным подкреплением.
Некоторые свойства подкрепления мы уже рассматривали, сейчас же мы примем точку зрения Карен Прайор, по мнению которой отрицательное подкрепление - это любое неприятное событие или ощущение, действие которого можно прекратить или избежать, изменив поведение. Отличие отрицательного подкрепления от наказания в том, что отрицательное подкрепление, как и положительное, происходит во
время поведения, а не после него, и на него можно повлиять изменением поведения.
Для того, чтобы наверняка понять отличие отрицательного подкрепления от наказания, давайте вернемся к примеру из предыдущей главы. Ваша собака лазает на диван. Вам это не нравится и вы отучаете ее следующим образом: как только застаете на диване, тут же кричите в ее адрес ругательные слова и задаете трепку. Как правило, агрессивное поведение хозяина прекращается сразу же, как только собака спрыгивает с дивана.
Если следовать вашей логике, то благодаря примененным мерам воздействия собака должна сообразить, что лазать на диван ей нельзя. Ничего подобного! Сначала собака понимает, что в случае ее локализации на диване грубый, резкий окрик хозяина означает: скорей слезай, чтобы избежать трепки.
|
|
Многие собаки достаточно быстро понимают, что появление хозяина, когда она лежит на диване, приводит к резкому окрику, а если с дивана не слезть, то схлопочешь. В результате ретируются с дивана сразу, как только на пороге комнаты появляется хозяин. Третьи идут еще дальше, они связывают наличие хозяина в квартире с его агрессивным поведением во время диванного положения, и в присутствии хозяина ведут себя как паиньки. Когда же хозяина нет, все категории собак ведут себя одинаково - диванолюбиво. Почему? Да потому, что ваше неприятное воздействие на собаку выступает подкреплением (отрицательным или положительным - это еще вопрос) спрыгивания с дивана и является наказанием по отношению к залезанию на диван. То есть таким педагогическим воздействием вы обучаете собаку быстро спрыгивать с дивана по коман-де (в данном случае это сложная команда или комплексный раздражитель: ваш вид и осуждающий крик).
Таким образом, хотелось бы показать, что отрицательное подкрепление, как впрочем, и положительное, какому-то действию или поведению происходит во время этого действия или в конце его, и на его появление, интенсивность и знак можно повлиять, изменив или прекратив именно это поведение. Тогда как наказание, о котором мы говорили ранее, происходит через некоторое время после совершения проступка.
А как же отучить собаку залезать на диван? Нужно придумать нечто такое, что делало бы неприятным именно это действие. Например, можно поставить на диване заряженные мышеловки. А одного добермана, который со всего размаха шлепался на диван, отучили так: разложили на диване остриями вверх шиферные кнопки и прикрыли их покрывалом. Для отучения оказалось достаточным одного доберманьего прыжка. Более того, бедняга начинал активно сопротивляться при попытке затащить его на диван.
Отрицательное подкрепление - очень эффективный способ формирования поведения, но это не делает его лучшим. Последите за собой, в общении с людьми и собаками мы в основном пользуемся именно им. Нам почему-то кажется, что правильное хорошее поведение это норма. Так и должно быть и чего тут радоваться и хвалить? Поэтому и не замечаем, а что самое плохое - и не подкрепляем положительно нужное нам поведение. Мы его как будто не видим, а обращаем внимание только на огрехи. Но слишком частое применение отрицательного подкрепления приводит, особенно у щенков, к появлению робости, неуверенности в себе, тревожности и отбивает охоту от самого процесса дрессировки. Потому что собака в первую очередь начинает понимать: появление нового навыка увеличивает возможность дополнительного получения отрицательного подкрепления. А его она, естествен^
но, стремится избежать. Кстати, классическая дрессировка оттого и является классической, что строится в основном на отрицательном подкреплении. Например, команда "Сидеть!" свидетельствует о возможных неприятных, а то и болевых воздействиях в области крестца, и чтобы их избежать, необходимо сесть.