Отрицательное подкрепление

Если положительное подкрепление - это то, что обучаемый будет стремиться получить, то отрицательное - то, чего он будет стараться избегать.

Но нужно отличать отрицательное подкрепление от наказания. Наказание происходит после поведения, и избежать наказания, изменив поведение, нельзя, так как поведение уже осуществилось. Малыш, которого отшлепали за плохую оценку, не может изменить оценку, которую он принес. Отрицательное же подкрепление можно остановить изменением поведения, т. е. оно дается в процессе поведения. Допустим, сидя в гостях у тетушки, вы случайно положили ноги на журнальный столик. Тетушка неодобрительно нахмуривается. Вы опускаете ноги на пол. Лицо тетушки смягчается. Это и есть отрицательное подкрепление.

Обычно управление лошадью тоже основано на отрицательном подкреплении: лошадь поворачивает потому, что стремится избежать неприятного ощущения, возникавшего при натягивании повода.

Время подачи подкрепления

Подкрепление - это информация. Оно сообщает, что собственно вы хотите, что именно вам нужно. Поэтому подкрепление нужно давать вовремя.

Запоздалое подкрепление - это самая большая ошибка. Например, собака садится, но к тому моменту, как хозяин говорит «хорошая собака», она уже снова стоит. За то, думает собака, ее похвалили? За то, что она встала.

Раннее подкрепление тоже неэффективно. В зоопарке Бронкса был такой случай. В вольере жила горилла. Служителям было нужно, чтобы она выходила в вольер, когда нужно почистить внутреннюю клетку, а у нее была привычка сидеть в дверях. Служители клали снаружи пищу, подманивали ее бананами, - горилла либо не обращала на них внимания, либо хватала пищу и оказывалась возле авери, прежде чем ее успевали закрыть. Наконец позвали Дрессировщика. Он объяснил служителям, что они пытались подкрепить действие, которого не было. Это называется взяточничеством. Подкреплять же надо гориллу, когда она сама выйдет из двери и подойдет к решетке. Задача была решена.

Система вариабельного подкрепления лежит в основе всех азартных игр. Если бы вы, играя в рулетку, каждый раз выигрывали, то не стали бы играть.

Правило при вариабельном режиме таково: чем реже, непредсказуемей подкрепления, тем лучше.




double arrow
Сейчас читают про: