Таблица 1. Сравнение режимов обучения нейросетей
Вид обучения: | С "учителем" | С "подкреплением" | Без "учителя" |
Что подается в качестве обучающих примеров | Набор пар входов-выходов | Оценка выходов сети | Только набор входных значений |
Что требуется от сети | Найти функцию, обобщающую примеры, в случае дискретных - классифицировать входы. В целом – научиться реагировать схожим образом в схожих ситуациях. | Научиться заданной “правильной” линии поведения. | Найти закономерности в массиве данных, отыскать порождающую данные функцию распределения, найти более компактное описание данных. |
Способ обучения, при котором действительный выход нейросети сравнивают с эталонным, называют обучением с учителем. Сеть обучается на наборе примеров (пар входов-выходов).
Иногда выходная информация известна не полностью. Например, вместо эталонных ответов известно лишь хуже или лучше данная конфигурация сети справляется с задачей (вспомним детскую игру “холоднее-горячее”). Этот тип обучения называют обучением с подкреплением (reinforcement learning).
Вообще говоря, возможен и такой режим обучения, когда желаемые значения выходов вообще неизвестны, и сеть обучается только на наборе входных данных:
Такой режим обучения сети называют обучением без учителя. В этом случае сети предлагается самой найти скрытые закономерности в массиве данных. Так, избыточность данных допускает сжатие информации, и сеть можно научить находить наиболее компактное представление таких данных, т.е. произвести оптимальное кодирование данного вида входной информации.