Контекстуальная сцена

ПРЕДЪЯВЛЯЕМЫЙ ОБЪЕКТ

груженые u интерпретация сенсорных сигналов

Одна из гипотез о том, как распознаются паттерны и формы, называется "сравнение с эталоном". В нашем случае с распознаванием паттернов че­ловеком эталон — это некоторая внутренняя структура, которая при ее сопоставлении с сенсорными стимулами позволяет опознать объект. Со­гласно такому представлению о распознавании, в процессе приобретения жизненного опыта у нас образуется огромное количество эталонов, каж­дый из которых связан с некоторым значением. Так, зрительное опозна­ние формы, например, геометрической фигуры, происходит следующим образом: световая энергия, исходящая от этой фигуры, воздействует на сетчатку глаза и преобразуется в нервную энергию, которая передается в мозг. Осуществляется поиск среди имеющихся эталонов. Если находится эталон, который соответствует нервному паттерну, человек опознает этот паттерн. После сопоставления объекта с его эталоном может происходить дальнейшая обработка информации и интерпретация объекта.

Сравнение с эталоном как одна из теорий распознавания паттернов имеет свои сильные и слабые стороны. С положительной стороны, кажет­ся очевидным, что для опознания некоторой фигуры, например, буквы или какой-нибудь визуальной формы, нужен определенный контакт с соответ­ствующей внутренней формой. На каком-то уровне абстракции для опоз­нания объекта "внешней реальности" необходимо, чтобы он был представ­лен в долговременной памяти. С другой стороны, буквальная интерпрета­ция теории сравнения с эталоном встречается с определенными трудно­стями. Например, если опознание возможно только тогда, когда между "внешним" объектом и его "внутренней" репрезентацией имеется соот­ветствие 1:1, то это значит, что даже при незначительном расхождении между объектом и его эталоном опознания не произойдет. Поэтому стро­гое следование этой теории означало бы необходимость формирования несчетного количества эталонов, соответствующих каждой из разнообраз­ных геометрических форм, которые мы видим и узнаем.

Легкость, с которой мы распознаем зрительные образы в повседневной жизни, может навести на мысль, что это очень простой процесс, и все же,

Рис. 3.4. К f.

ответов испыт го в исследоЕ влияния конте. По горизон' "А"~ соответс щий контекст; нет контекста; несоответствуг контекст, схс объект; и "76" соответствуй: контекст, не г жий объект. Ад ровано из: melhart (197', данным Ра (1975Ь).

Сравнение эталоном

Распознавание nammep

когда мы пытаемся воспроизвести опознание с помощью искусственных средств, то оказывается, что результат от нас ускользает. Возьмем для примера опознание букв и устройство для распознавания слов. Чтобы на­учиться хорошо читать, нужно потратить несколько лет, но когда мы на­учились распознавать орфографическую конфигурацию, составляющую слово, мы можем мгновенно узнать это слово в различных контекстах, произнести его и вспомнить его значение. Как бы вы смоделировали ис­ходный процесс опознания буквы на компьютере? Один из способов — это хранить в "памяти" компьютера каждую из 26 букв. Тогда каждый раз, когда буква сканировалась бы оптическим устройством, воспринимаемая зрительная конфигурация "настраивалась" бы на элемент памяти (эта­лон), связанный с этой буквой. Так, слово CARD (карточка) анализирова­лось бы как C-A-R-D, т.е. "С" настраивалось бы на ячейку памяти, соот­ветствующую конфигурации "С", для "А" нашлось бы соответствие в ячейке "А" и т.д. "Вуа-ля! — мог бы воскликнуть компьютер, — а я читаю буквы!" Но что если бы мы попросили его опознать буквы в слове "card"? В его памяти нет конфигураций для написания букв в нижнем регистре. Реше­ние просто, скажете вы: увеличьте память и включите туда буквы нижне­го регистра. Но тогда мог бы наш компьютер прочитать (как это делаем мы) буквы, написанные вот так:

или так>

или так>

Конечно же, в чтении участвуют гораздо более сложные процессы, чем простое опознание букв. Прием, используемый в компьютерной техни-ке> — сравнение конфигурации букв с конкретными конфигурациями в памяти машины — называется "сравнение с эталоном"; это похоже на поворот ключа в замке. Чтобы открыть замок, конфигурация бороздок u выемок на ключе должна совпасть с конфигурацией замка. На языке рас­познавания образов при сравнении с эталоном происходит следующее: когда зрительная конфигурация соответствует совместимой с ней репре­зентации в памяти, информация высвобождается. Как видно из примера с компьютером, метод сравнения с эталоном встречается с трудностями при попытке опознать слово "CARD", если в его написании есть какие-либо отклонения, — это все равно, что пытаться открыть замок погнутым клю­чом.

Таким образом, сравнение с эталоном — это элементарная процедура распознавания паттернов, основанная на том, что конфигурация сенсор­ной информации точно подходит к соответствующей "конфигурации" в памяти; и хотя ее возможности ограничены, она имеет определенное тео­ретическое и практическое значение. Теоретические вопросы, связанные с этим методом, мы затронем позднее. Что касается его практических применений, то они весьма многочисленны.

Итак, в случае распознавания паттернов человеком "жесткое" следо­вание этой модели привело бы к необходимости создания миллионов от­дельных шаблонов, каждый из которых соответствовал бы отдельному зрительному паттерну. Если бы нам приходилось хранить так много этало­нов, наш мозг был бы таким громоздким, что пришлось бы возить его на тачке. Так что этот трюк не пройдет по неврологическим соображениям.

гружение и интерпретация сенсорных сигналов

; Сравнение с эталоном является основой многих кодирующих систем, ставших час-

|| тью нашей повседневной жизни. Например, почти все банки в США имеют системы

цену, печатаемую затем на контрольной ленте кассового аппарата.)

STATE BANK

Mattew A. SWANN 18 Chelsea Place New York, N.Y. 1ÜÜ11

no. 159

pay to the order of_

для идентификации счетов по специальным | цифрам, отпечатанным на оборотной сто-|роне чека, а во многих магазинах исполь-зуются аналогичные коды (напечатанные ff i; на упаковках товара) для ускорения про-|цесса выписки счетов и проведения пере-|учета товаров. (По этому коду компьютер | определяет единицу товара и указывает ее

Обе эти разновидности кодов читаются посредством сравнения с эталоном. Рису­нок на чеке имеет отличительные детали, помогающие компьютеру различать буквы, а торговые коды читаются по положению линий, их ширине и пространству между ними. Коды преобразуются сканером в электрические импульсы, из которых со­ставляется сигнальный паттерн; последний передается в компьютер, идентифицирую­щий этот паттерн путем сравнения его с аналогом (эталоном), находящимся в его памяти.

Но даже если бы это было возможно, то для доступа к памяти, где хранят­ся многие миллионы эталонов, потребовалась бы процедура поиска, зани­мающая крайне много времени, что никак не соответствует нашей способ­ности быстро опознавать множество различных паттернов. Наконец, эта модель маловероятна, потому, что мы можем опознавать незнакомые фор­мы и фигуры (например, новые варианты начертания буквы "А").

Еще один подход к проблеме извлечения информации из сложных стиму- Подеталь- лов — это подетальный анализ. В соответствии с ним, восприятие — это ный ана- "высокоуровневая" обработка информации, которой предшествует этап лиз идентификации входных стимулов по их более простым деталям. Так, прежде чем произойдет оценка информации зрительного паттерна "в полном объеме", осуществляется минимальный анализ его составных частей. На элементарном визуальном уровне слово — например, слово ARROW (стрела) — не переводится непосредственно в свою понятийную или мысленную репрезентацию в нашей памяти (например, "заостренное древко для стрельбы из лука" или знак " —^ "). Оно не читается как "arrow", и его отдельные буквы не воспринимаются как A-R-R-O-W, а вместо этого обнаруживаются и анализируются детали или компоненты каждой буквы. Так, буква "А" может быть разложена на две наклонные линии (/ \) и

Распознавание паттерн

. 3.5. Уста-а для наблю-<я за нервной вностью, вы-:емой просты-зрительными jjféjfâ улами.

одну горизонталь (----), острый угол (/М, перевернутую емкость (/ \)

и т.д. Если процесс опознания основан на анализе деталей и это найдет свое подтверждение, то выходит, что ранние этапы обработки информации более сложны, чем мы предполагали вначале.4

В двух исследовательских направлениях — неврологическом и бихеви­ористском — были получены данные в пользу гипотезы о подетальном анализе. Мы сосредоточимся на втором из них, но сначала обратимся к экспериментам Хьюбеля и Визеля (Hubel and Wiesel, 1959, 1963; Wiesel, 1963), из которых прямо видно, какой тип информации кодируется в зри­тельной коре мозга. Эти ученые вживляли микроэлектроды в зрительную кору кошки и обезьяны, находившихся в состоянии легкого наркоза, а потом изучали нервную активность, возникавшую в результате проекции простых световых паттернов на экран непосредственно перед глазами жи­вотного (Рис.3.5).

Регистрируя возбуждение отдельных нервных клеток и усиливая воз­никающие в них электрические импульсы, они обнаружили, что некото­рые клетки реагируют только на горизонтальные фигуры, а некоторые —

4Чтобы оценить сложность сенсорного, перцептивного и моторного аппара­тов, обслуживающих "простое" восприятие и ответные реакции, представьте себе, сколько всего требуется, чтобы отбить ракеткой на лету теннисный мяч. За долю секунды мы способны оценить его форму, размер, скорость, цвет, траекторию, вращение и предсказать его положение. Наш мозг должен пере­вести всю эту информацию (записанную только в двумерном виде на сетчат­ке) в моторную реакцию, которая в случае успеха позволит нам отразить мяч. Помимо того, что все это происходит практически мгновенно, значительная часть информации постоянно меняется (например, относительная величина мяча, его скорость и траектория).

гружение и интерпретация сенсорных сигналов

В

ММ*

ttrrr

Рие. 3.6. Pec

клеток зритеп коры кошки не муляцию гу светлой поле Фрагменты А-. казывают орие цию светлой п сы (вытянутый моугольник сп.

НЫМИ ЛИНИЯМ!*

носительно рецептивного (штриховые лм Но фрагмен-полоса была ентирована же, как на А

НО быстро ДЕ

лась из сторо сторону. Взятс Hube/ and W (1963).

только на вертикальные. В других экспериментах они обнаружили, что некоторые клетки чувствительны к краям зрительного стимула, некото­рые — к линиям, а некоторые — к правым углам. На Рис.3.6 показано, как усиленная мозговая активность клеток коры у очень молодого (и соот­ветственно зрительно неопытного) котенка связана с конкретной ориента­цией освещенной полосы (А-Е), предъявлявшейся на экране в поле зрения животного. Горизонтальными отрезками над каждой записью активности обозначены периоды, когда стимул был виден. Хьюбель пришел к выводу, что формирование этих кортикальных кодов воспринимаемых фигур явля­ется врожденным и специфичным для каждой клетки:

"Теперь становится понятным значение огромного числа клеток в зрительной коре. Видимо, каждая клетка имеет свое особое назначение; она отвечает за одну ограниченную зону сетчатки, реагируя лучше всего на одну конкретную форму стимула и на одну конкретную ориентацию. Если посмотреть на эту проблему с противоположной стороны, то для каждого стимула — каждой зоны сетчатки, на которую воздействует стимул, каждого типа линии (край, полоса или отрезок) и каждой ориентации стиму­ла — существует определенный набор простых кортикальных клеток, которые на них реагируют; всякое изменение расположения стимула вызывает ответную реакцию новой^группы клеток. Количество клеточных групп, последовательно реагирующих по мере того как глаз следит за медленно вращающимся пропеллером, трудно вообразить" (Hubel, 1963).

Распознавание паттер

Следовательно, сложный и громоздкий механизм разложения паттерна на простые детали — не только возможность, имеющая отношение к невро­логии, но действительно неврологическая необходимость, т.е. подеталь­ный анализ может оказаться таким этапом, через который информация должна пройти, прежде чем анализ паттерна сможет начаться на высшем уровне.

Движения глаз и восприятие паттерна. Непосредственное от­ношение к подетальному анализу имеют наблюдения за движениями глаз и зрительными фиксациями. Можно предположить, что если вы относи­тельно долго смотрите на некоторую деталь паттерна, то вы извлекаете из нее больше информации, чем при мимолетном взгляде. Этим подходом заинтересовались Макворт и Ярбус (Mackworth, 1965; Yarbus, 1967). Ре­зультаты экспериментов с фиксацией, проведенных русским психологом5 Ярбусом, показаны на Рис.3.7. Ярбус предположил, что чем больше ин­формации содержит некоторая деталь (например, глаза, уши или рот ре­бенка на указанной иллюстрации), тем дольше на ней фиксируется взгляд. Он также заключил, что распределение точек фиксации зависит от целей наблюдателя. В одной серии экспериментов испытуемых просили при раз­глядывании сложного изображения сделать некоторые оценки (оценить, например, каковы материальные условия членов семьи, сколько им лет). При этом взгляд останавливается на тех деталях, которые наиболее важ­ны для целей испытуемого. Таким образом, восприятие деталей сложного паттерна зависит не только от физических свойств стимула, но и от рабо­ты высокоуровневых когнитивных процессов, таких как внимание и моти­вация.

Тогипное знание

Альтернативой сравнению с эталоном и подетальному анализу как сред­ствам распознавания паттернов является теория формирования прото­типов. Вполне вероятно, что в ДВП хранятся не конкретные эталоны и тем более не детальные признаки многочисленных паттернов, которые нам приходится опознавать, а своеобразная абстракция паттернов, которая и служит в качестве прототипа. Паттерн сопоставляется с прототипом и при наличии сходства происходит его опознание. Применительно к чело­веку, гипотеза прототипного сравнения более отвечает принципу невроло­гической экономичности и процессам поиска в памяти, чем гипотеза о сравнении с эталоном; она позволяет также опознавать "необычные" пат­терны, которые, тем не менее, как-либо связаны с прототипом. В такой системе можно, например, сформировать прототип идеализированной бук­вы "А", относительно которого все остальные "А" будут оцениваться по принципу сходства. Если расхождение велико (например, если это не "А", а другая буква), то мы отмечаем отсутствие "совпадения" и отвергаем предъявленную букву как не "А"; затем можно искать прототип, который лучше подходит для этой буквы. Свидетельства в пользу прототипного сравнения — повсюду вокруг нас, и интуитивно эта гипотеза выглядит весьма достоверной. Мы узнаем машину марки Фольксваген, даже если у нее другие цвет и форма или она облеплена всякими безделушками, кото-

5Точнее, биофизиком.— Прим. ред. '-ружение и интерпретация сенсорных сигналов

Рис. 3.7. За

движений т испытуемого разглядыва картины (er вверху). Трое рия 1 получ когда испытуе рассмотри картину лр< вольно. Поел ющие траектс получены пс того, как испь мою просили нить эксноми кую состоят ность изобрел ных людей (Тр тория 2); их рост (3); пре, пожить, что делали, перед как пришел "п. титель" (4); за г нить их одежд) запомнить пс жение люде объектов в кол те (6); и оцен как долго "пос гель7' не видел "семью" (7). Bz из: Yarbus (19<

Распознавание паттер-

рые никак не сходятся с идеализированной моделью в нашей голове. В этом смысле прототип — это не только абстракция из набора стимулов, но и "краткий конспект", наилучшая репрезентация данного паттерна6.

Хотя приведенные аргументы говорят в пользу сравнения с прототи­пом, можно задать вопрос: Необходимо ли точное соответствие между

6В цивилизации, где физическое очарование вознаграждается, прототипами женственности и мужественности могут стать победительница пышного пред­ставления "Мисс Америка" и исполнитель главной мужской роли в кассовом фильме, и тогда оценка нами человека может оказаться связанной с тем, насколько он соответствует этому идеальному прототипу.

ИДИ, НАЙДИ ЭТО...

ДОЛГО­ВРЕМЕННАЯ ПАМЯТЬ

аружение и интерпретация сенсорных сигналов

образом и прототипем? Может быть эталоны — это некоторое приближе­ние к образу, нужное, чтобы открыть ячейку памяти? Однако, если бы это было так, то разве могли бы мы делать тонкие дифференцировки, необхо­димые для обычного зрительного восприятия? Возьмем, например, сход­ство деталей в буквах О и Q или В, P и R. Хотя эти зрительные паттерны похожи друг на друга, мы редко их путаем. Значит, эталоны не могут быть "приблизительными" или "размытыми"— иначе мы слишком часто оши­бались бы при распознавании образов, что очевидно не так.

Таким образом, сравнение с эталоном как принцип распознавания об­разов полезно для компьютерных программ (чтение кодов на чеках и т.п.), но в своей жестой форме оно не может адекватно объяснить разнообра­зие, точность и экономичность распознавания образов человеком. Подво­дя итог, скажем, что распознавание образов предполагает проведение опе­раций с памятью. В простейшем случае можно полагать, что при распоз­навании образа происходит сопоставление сенсорной информации с неко­торым следом, хранящимся в памяти.

Абстрагирование зрительной информации. Как мы предположили, на одном уровне зрительного опознания может происходить сравнение с эталоном, но на другом уровне могут использоваться прототипы. Предполагается, что прототип — это абстракция набора стимулов, воплощающая множество сходных форм одного и того же паттерна. Прототип позволяет нам распознавать образ, даже если он не идентичен прототипу, а только похож на него. Так, мы распознаем различные написания буквы "А" не потому, что они точно подходят к некоторой ячейке памяти, а потому, что члены класса "А" обладают некоторыми общими чертами.

Экспериментальные исследования, направленные на подтверждение те­ории прототипов как средства распознавания образов, часто обращались к вопросу о том, как формируются прототипы и как обеспечивается быстрая классификация новых паттернов. Этот вопрос не нов; он беспокоил епис­копа Беркли (Berkeley) еще много лет назад:

"Перед его мысленным взором все изображения треугольников обладали весьма конкретными свойствами. Они были или равносторонними, или равнобедренными, или прямоугольными треугольниками, и он напрасно искал мысленный образ "универсального треугольника". Хотя то, что мы имеем в виду под треугольником, легко определяется вербально, совсем не ясно, как выглядит "совершенный" треугольник. Мы видим множество самых, разнообразных треугольников; что же из всего этого множества мы создаем в своих, мыслях, как основу для опознания треугольника?" (Цит по: Calfee, 1975, р.222).

Воображаемая Одиссея Беркли о "совершенном" треугольнике растянулась на несколько столетий и, наконец, стала предметом эмпирического исследования в эксперименте, который сам стал для многих прототипом (Posner, Goldsmith, and Weiten, 1967). Эти ученые нашли прототип треугольника (и других фигур), а затем измеряли время реакции испытуемых на другие фигуры, в чем-то подобные прототипу. В первой части эксперимента они разработали серию прототипов (Рис.3.8) путем

Распознавание nammef.

•f I Случайный _ Г^^1:^УЖи

ук^л^ча у'-у ^J'"" «г '^-''- -- ' '•ъ;**>~ь,'з& 'M«-Л«<•/- Л-* <• Л-'*' ч<» •

&fâ#^y*>f&$f? " ^j:*;. ' ' '"', х "?г ^ '7'^"' 'f " "'"-- * - - ', ' "

3.8. Четыре паттерна-прототипа и четыре искаженных паттерна треугольника, использо-,ie в эксперименте Познера и др. Адаптировано из: Posner, Goldsmith, and Welton (1967).

расстановки 9 точек в матрице 30x30 (стандартный лист в клеточку, 20 квадратов на дюйм) так, чтобы получились треугольник, буква или случайная фигура. Путем сдвига этих точек с их исходных позиций были получены по четыре искаженных фигуры для каждого оригинала. (На Рис. 3.8 показаны также искаженные треугольные паттерны.) Испытуемым показывали по одному каждый из четырех искаженных паттернов и просили классифицировать их по прототипам. После того как испытуемые классифицировали каждый паттерн (они делали это нажатием соответствующей кнопки), им сообщали, какой из их выборов был верен; прототип не предъявлялся.

Из этого первого эксперимента стало очевидно, что испытуемые на­учались относить искаженные паттерны конкретного прототипа к некото­рой общей категории, тогда как другие паттерны, полученные из другого прототипа, были отнесены к другой общей категории. За первоначальной задачей шла задача на перенос, в которой испытуемых просили рассорти­ровать ряд паттернов по трем предыдущим категориям. Новые наборы паттернов состояли из: (Остарых искаженных паттернов, (2)новых иска­женных паттернов (основанных на тех же исходных прототипах) и (3)са-мих прототипов. Старые искаженные паттерны были классифицированы правильно и легко — с точностью около 87%, но что более важно, прото­типы (которых испытуемые никогда не видели и не классифицировали) были "правильно" классифицированы примерно с тем же успехом. Новые искаженные паттерны были классифицированы менее удачно, чем другие два типа. Поскольку прототипы были столь же точно классифицированы, как и старые искаженные паттерны, это означало, что испытуемые дей­ствительно что-то узнали о прототипах, — хотя они видели только их искаженные изображения.

Отличительной чертой этого эксперимента было то, что прототип или схема классифицировались правильно примерно с той же частотой, что и первоначально выученные искаженные паттерны и более часто, чем новые (контрольные) искаженные паттерны. Познер и др. утверждали, что ин­формация о прототипах была очень эффективно абстрагирована из со­храненной информации (основанной на искаженных- паттернах). Имело

гружение и интерпретация сенсорных сигналов

место не только абстрагирование прототипов из искаженных паттернов; в самом процессе заучивания паттернов содержалось также знание об их изменчивости. Возможность того, что верная классификация прототипов основана на их знакомости (треугольник, буквы F и М) для большинства людей, была исследована в эксперименте Петерсона, Мегера, Чейта и Джилли (Peterson, Meagher, Chait, and Gillie, 1973). Их результаты пока­зали, что прототипы и минимально искаженные тестовые паттерны наибо­лее значащих конфигураций легче идентифицируются, чем бессмыслен­ные прототипы и минимально искаженные тестовые паттерны. Однако, там, где степень искажения была велика, оказалось верным противопо­ложное, т.е. наиболее значимые прототипы опознавались реже, чем мало­значащие. Такие результаты не противоречат Познеру, но бросают вызов идее Беркли о взаимодействии между "универсальным треугольником" и его искаженным паттерном. Видимо, мы абстрагируем прототипы на осно­ве сохраненной в памяти информации. Очевидно, хорошо знакомые фор­мы будут подходить к менее широкому диапазону искаженных форм, чем формы относительно малознакомые. Поиски епископом Беркли "совер­шенного треугольника" привели к выводу, что все треугольники равны, но некоторые равнее!

Наши поиски прототипов и наша способность к их абстрагированию, даже когда мы не воспринимаем их непосредственно, была хорошо проил­люстрирована в эксперименте Франкса и Брансфорда (Franks and Bransford, 1971). Они составили серию карточек 5x8, которые содержали пары цвет­ных геометрических фигур, причем на одной карточке был прототип, а на остальных — его "преобразования". Прототипом, или "базой", служил маленький треугольник в большом квадрате слева и маленький ромб в большом круге справа. Испытуемых просили воспроизвести эту фигуру во время тренировочной фазы эксперимента, но им не говорили, что позднее их попросят опознать эту фигуру. Преобразования проводились по прави-

Рие. 3.9. Уверенность испы­туемого в верности опо­знания базовой фигуры и ее преобразований. Адап­тировано из: Franks and Bransford (1971).

Распознавание nammep

лам, содержащимся в самом рисунке: большая перестановка включала смену левой и правой фигур; при малой перестановке менялись'внешний и внутренний элементы и т.д. После того, как испытуемым показывали только преобразованные фигуры, различающиеся по их расхождению с прототипом, им давали задачу на опознание; при этом испытуемые сами оценивали степень своей уверенности в ответе. Задача на опознание вклю­чала предъявление прототипа (не виденного ранее) и преобразованных фигур. Результаты (Рис.3.9) показали, что испытуемые опознавали прото­тип с, большей вероятностью, чем его преобразования (хотя они их уже видели), и с большей уверенностью. Было также обнаружено, что оценка уверенности опознания связана со степенью преобразования, с наиболее часто опознаваемым прототипом, с преобразованиями, включающими одну перестановку и т.д.

В еще одном примере распознавания, основанном на фигурах из "ре­альной жизни", Рид (Reed, 1972) конструировал "лица" с малозаметными отличиями по нескольким признакам, например — по расположению глаз, длине и положению носа, высоте лба. Каждый признак имел один из трех вариантов (например, глаза и рот имели три положения относительно кон­тура "лица", а нос имел три возможных длины). В типичной задаче испы­туемых просили рассортировать эти схематические лица (Рис.3.10) в пер­вый или второй из двух рядов лиц (Рис.3.11). Рид обнаружил, что испыту-

Рис. 3.10. Схематические лица, представляющие три способа их изменения в эк­сперименте Рида. Адапти­ровано из: Reed, 1972.

Рис. 3.11. Два

ояда лиц, к одно­му из которых ис­пытуемый должен был отнести лица, показанные на Рис.3.1Q. Адапти-оовано из: Reed, 1972.

Обнаружение и интерпретация сенсорных сигналов 96

емые — студенты из его коллед- жа — абстрагировали прототип из каж­дого ряда как основу для сравнения с образцами (три лица на Рис.3.10). Наиболее часто используемая стратегия заключалась в абстрагировании прототипа и сравнении "расстояния"7 между ними и паттернами. Рид зак­лючил, что "преимущественная стратегия заключалась в формировании абстрактного образа или прототипа, представляющего каждую категорию и классификации тестовых паттернов по принципу их сходства с этими двумя прототипами" (Reed, 1972, р.401).

Псевдо-память. В эксперименте с формированием прототипа Солсо и Маккарти (Solso and McCarthy, 1981 а), используя процедуру Франкса и Брансфорда, обнаружили, что испытуемые неверно опознают прототип как ранее виденную фигуру и делают это с большей уверенностью, чем при опознании ранее виденных фигур. Это явление называется псевдо­памятью. Они предположили, что прототип формируется на основе часто встречающихся признаков. Такие признаки, например индивидуальные для данной фигуры контуры или части лица человека, хранятся в памяти. Общий показатель прочности запоминания можно определить по частоте появления признака: как правило, чаще воспринимаемые признаки имеют больше шансов сохраниться в памяти, чем редко воспринимаемые. Более того, возможно, что правила, по которым соотносятся признаки в паттерне, не так хорошо удерживаются в памяти, как сами признаки. Таким образом, можно представить, что процесс приобретения знания о паттерне состоит из двух этапов: получения информации о признаках паттерна и об отношениях между признаками. Пожалуй, наиболее интригующим в загадке формирования прототипов является то, что эти два этапа протекают с разной скоростью в процессе приобретения нами знания о паттерне. Это в чем-то похоже на соревнования, где два атлета бегут с разной скоростью. Тот, что быстрее,— аналог изучения признаков, а более медленный — аналог изучения их взаимосвязей.

В эксперименте Солсо и Маккарти, "лицо-прототип" было составлено при помощи фоторобота — устройства, используемого в полиции; оно состоит из набора пластиковых эталонов, на каждом из которых изобра­жена часть лица — волосы, глаза, нос, подбородок, рот. Для каждого из выбранных лиц-прототипов был произведен набор образцов, имеющих раз­личную степень сходства с прототипом (см. Рис.3.12). Испытуемым пока­зывали образцы, а затем — второй набор, содержащий некоторые из пер­воначальных лиц, некоторые новые лица, ранжированные по их сходству с прототипом, а также сам прототип. Испытуемых просили решить, видят ли они лица, из ранее виденного набора или новые лица и оценить уверен­ность в своем ответе. Как видно из Рис.3.13, испытуемые не только прини­мали прототипы за уже виденные, но выставляли при этом наивысшую оценку уверенности в ответе (пример псевдо-памяти).

Из вышесказанного можно сделать некоторые выводы о формировании и использовании зрительного прототипа. Ранее цитированные исследова­ния показывают, что мы (Сформируем прототипы на основе усредненных характеристик отдельных экземпляров; (2)приобретаем определенные зна­ния о прототипе даже когда имеем дело только с его видоизменениями;

7Т.е. степени различия.— Прим.ред.

Распознавание паттерн*

Рис. 3.12. Лицо-прототип (P) и образцы лиц, имеющих раз­личную степень (75, 50, 25 и 0%) сходства с прототипом. So/so, McCarty (l 981 a).

75%

50 %

25%

0%

Рис. 3.13. Показатели уве­ренности в ответе для прото­типа, уже виденных (старых) элементов, и новых элементов. So/so, McCarthy (198la).

бнаружение и интерпретация сенсорных сигналов

(З)приобретаем некоторую обобщенную информацию об общих признаках прототипов, причем хорошо известные прототипы содержат меньше вклю­чений, чем менее знакомые (или недавно выученные); (4)о модифициро­ванных экземплярах судим по степени их близости к прототипу; и ^фор­мируем прототип путем абстрагирования отдельных образцов и затем оце­ниваем взаимосвязь между прототипическими формами, исходя из степе­ни их отличия от этого прототипа, а также от других отдельных образцов.

Теория прототипов: центральная тенденция и частота признаков. Из вышеописанных экспериментов и многих других иссле­дований возникли две теоретические модели формирования прототипов. В одной из них, называемой моделью центральной тенденции, предполагает­ся, что прототип представляет собой среднее из всех экземпляров. Иссле­дование Познера и др., а также Рида говорят в пользу этой модели. По­знер и Кил (Posner, Keele, 1968), например, считают, что прототип можно представить математически как точку в гипотетическом многомерном про­странстве, в которой пересекаются средние расстояния от всех призна­ков. В экспериментах Познера и Рида можно видеть, как у испытуемых формируется прототип, являющий собой абстракцию некоторой фигуры. Таким образом, прототип — это абстракция, хранящаяся в памяти и отра­жающая центральную тенденцию некоторой категории.

Вторая модель, называемая моделью частоты признаков, предполагает, что прототип отражает моду или наиболее часто встречающееся сочета­ние признаков. Эксперименты Франкса и Брансфорда, Ноймана (Neumann, 1977) и Солсо и Маккарти подтверждают эту модель. В ней прото-тип — это синоним "лучшего экземпляра" из некоторого набора паттернов. Про­тотип — это паттерн, включающий наиболее часто встречающиеся при­знаки, свойственные некоторому набору экземпляров. Хотя прототип за­частую уникален, поскольку состоит из уникальной комбинации призна­ков (вспомните уникальные геометрические фигуры в эксперименте Фран­кса и Маккарти или уникальные лица в эксперименте Солсо и Маккарти), сами по себе признаки уже воспринимались ранее. Такие признаки — например, геометрические элементы частей лица — есть строительные блоки прототипа. Каждый раз, когда человек смотрит на паттерн, он реги­стрирует и признаки паттерна, и взаимосвязь между ними. Однако, со­гласно модели частоты признаков, при освоении прототипа, включающего многие ранее встречавшиеся признаки, у человека возникает уверенность, что он уже видел раньше это изображение, т.к. его признаки сохранились в памяти. Поскольку взаимосвязь между признаками встречалась реже, чем сами признаки — в большинстве экспериментов экземпляры показы­вались только раз — информация о соотношении признаков хуже сохра­нилась в памяти, чем информация о самих признаках.

Было проведено несколько экспериментов с целью выяснить различия между этими моделями. В одном их них (Solso and McCarthy, 1981b) ис­пытуемых просили запомнить ряд трехзначных цифр. Затем им показыва­ли другой набор цифр и просили давать ранговые оценки своим ответам; второй набор состоял из нескольких старых элементов, некоторых новых элементов, арифметического среднего элементов первого набора, а также наиболее часто встречающихся чисел. Как правило, то число, которое с наибольшей уверенностью признавалось числом из первой группы, было числом-прототипом, составленным из часто встречавшихся чисел. Нако-

Распознавание паттерн

нец, при проведении вышеописанного эксперимента практически не было обнаружено свидетельств в пользу модели центральной тенденции, хотя его результаты подтверждают модель частоты признаков. Очевидно, неко­торые эксперименты ясно подтверждают частотную модель, но зато дру­гие подтверждают модель центральной тенденции. Может быть, верны обе модели; тогда расхождения можно было бы отнести на счет различий в стимульном материале или попытаться объяснить их тем, что прототипы основываются на часто встречающихся признаках лишь на стадии заучи­вания, а позднее возникают прототипы, основанные на центральной тен­денции.

Распознавание образов в шахматах. До сих пор мы имели дело только с простыми изображениями; даже лица в эксперименте Рида невы­разительны и сильно упрощены. А как видятся более сложные паттерны? Чейз и Саймон (Chase and Simon, 1973a, 1973b) изучали эту проблему, анализируя сложный паттерн фигур на шахматной доске и пытаясь выяс­нить, чем мастера шахмат отличаются от обычных игроков. Интуиция может подсказывать нам, что когнитивные различия между ними заключаются в том, насколько ходов вперед мастер может предвидеть игру. Интуиция ошибается — по крайней мере, это следует из исследований де Грота (de Groot, 1966), обнаружившего, что мастер и обычный игрок просчитывают вперед примерно одинаковое количество ходов, рассматривают примерно одинаковое количество ходов и ищут схемы ходов примерно одинаковым образом. Возможно даже, что мастер анализирует меньшее количество альтернативных ходов, тогда как обычный игрок тратит время на заведомо неподходящие варианты. В чем же между ними разница? А вот в чем: в способности, посмотрев на доску всего несколько секунд, воспроизвести расположение фигур; слабому игроку очень трудно это сделать. Ключ к этому наблюдению лежит в природе такого паттерна: расположение фи­гур должно иметь смысл. Если фигуры расположены в случайном порядке или нелогично, то и у новичка, и у мастера результаты будут одинаково неважные. Возможно, мастер объединяет по несколько фигур в группы — так же как мы с вами объединяем буквы в слова, а затем складывает эти группы в более крупный значащий паттерн — так же как мы объединяем слова в предложения. Если так, то опытный мастер действительно имеет больше возможностей к воспроизведению таких паттернов, поскольку он может закодировать фигуры и группы в некоторую шахматную схему.

Чейз и Саймон проверили эту гипотезу на трех типах испытуемых — мастере, игроке класса А (очень сильном) и начинающем игроке. В своем эксперименте они просили испытуемых воспроизвести полностью 20 шах­матных позиций, взятых из специальных шахматных журналов и книг,— половина позиций изображала середину партий, а другая половина — их окончания (Рис.3.14). В этом эксперименте две шахматные доски были поставлены рядом, и испытуемый должен был на одной доске воспроизве­сти положение фигур с другой. В другом эксперименте испытуемые рас­сматривали шахматную позицию в течение 5 с и затем воспроизводили ее по памяти. Чейз и Саймон обнаружили, что у мастера время сканирова­ния позиции было ненамного больше, чем у игрока класса "А" или у начи­нающего, но на воспроизведение позиции мастер затрачивал гораздо мень­ше времени, чем они (Рис.3.15); на Рис.3.16 показано количество пра­вильно размещенных фигур. Дальнейший анализ результатов показал, что

Миттельшпиль

Черные

Эндшпиль

Белые

"Случайный " миттельшпиль

Черные

"Случайный" эндшпиль

Белые

Рис. 3.14. Пр

мер митгельшпиг. (середины) и э/ч шпиля (окончань шахматной псц тии и их дубли/с«ты, образова, ные по случайн* му принципу.

умение видеть значимые группы фигур позволяло более сильным игрокам собрать больше информации за данное время.

Эксперимент Чейза и Саймона имел важное теоретическое значение. Информационные группы или единицы, соединенные вместе более или менее абстрактными отношениями, могут стать основой синтаксиса пат­тернов. Информационные единицы, не имеющие какого-либо значащего контекста и не объединяемые в группы, трудно кодировать, будь то буквы, геометрические фигуры, ноты или шахматные фигуры; но если объеди­нить их в значимые структуры — в поэму, архитектурное сооружение, мелодию или элегантную шахматную защиту,— то они обретают значе­ние, поскольку их теперь легко абстрагировать на языке обычной грамма­тики. В современной теории информации были развиты первичные модели разума, основанные на идее структурных уровней. Мы также были свиде­телями бурного развития структурной грамматики языка (она рассматри­вается далее, в Главе 11), музыки, телесных реакций, графических задач и

Распознавание паттерна 10

Рис. 3.15. Время сканирова­ния и воспроизведения шахмат­ной позиции игроками трех различных уровней мастерства. Адаптировано из: Chase and Simon (1973).

Рис. 3.16. Зависимость пра­вильно размещенных фигур от уровня мастерства. Оригиналь­ные позиции предъявлялись иг­рокам в течение 5сек. Адапти­ровано из: Chase and Simon (1973).

шахмат. Одной из наиболее распространенных способностей человека, применимой ко всем чувственным формам, является, по-видимому, тен­денция кодирования информации о реальности на языке абстракций высо­кого уровня, в которые может встраиваться новая информация. Вышепри­веденные эксперименты с восприятием шахматных позиций и абстрагиро­ванием непосредственных стимулов подтверждают это положение.

Специалисты U абстракции. Из вышеприведенного исследования следует, что эксперты (например, мастера шахмат) способны воспроизве­сти больше информации, связанной с их специальностью, чем новички. Этот любопытный результат открыл целое направление исследований, связанное со способностями кодирования и воспроизведения у специали­стов8. В работе Адельсон (Adelson, 1981, 1984) изучалось формирование

8Выпуск Canadian Journal of Psychology, Vol.39, 1985 целиком посвящен этой теме.

бнаружение и интерпретация сенсорных сигналов)2

представления компьютерных программ у опытных и начинающих про­граммистов. В ряде экспериментов Адельсон обнаружила, как и можно было ожидать, что эксперты превосходят новичков по количественным оценкам навыка. Более интересным является установленный ею факт, что опытные программисты опираются на абстрактные представления о ком­пьютерных программах, тогда как новички больше фокусируются на вне­шних деталях программы. В частности, опытные специалисты стараются представить, для чего данная программа предназначена, а новички пыта­ются узнать, как она работает. По всей видимости, фундаментальной ког­нитивной способностью, отличающей опытного человека от неопытного, является умение посмотреть на набор элементов —будь то шахматные или геометрические фигуры, лица или компьютерные программы — как на фрагменты, образующие при их объединении более крупную структуру.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: