Тестирование в образовании

Сразу оговоримся, что к собственно психологическим тесты образовательные (или тесты достижений) не относятся, поскольку направлены прежде всего на оценку степени усвоения того или иного учебного материала. Тем не менее разра­ботка психологических тестов во многом влияла и на развитие инструментов оценки знаний, эти исследования шли рука об руку, в них участвовали психоло­ги, а поэтому в истории психодиагностики нельзя обойти вниманием тестирова­ние в сфере образования, которая была и остается основным потребителем пси­хологических тестов. А. Анастази справедливо замечает, что в тестах достижений основной интерес сосредоточен на том, что индивид может делать к настоящему времени. Эти тесты в отличие от тестов интеллекта и способностей в основном оцениваются в терминах валидности по содержанию.

Самые ранние сведения о проверке успеваемости в европейской школе дати­руются примерно 1200 г. В это время Университет Болоньи проводил первый уст­ный экзамен на получение степени доктора философии. Это был единственный экзамен, который в то время сдавали студенты, и обычно продолжался он около недели. Интересно, что экзамен этот проходил в таверне, и студенты быстро уста­новили традицию угощать едой и напитками как своих коллег, так и преподавате­лей. Естественно, что экзамен нередко переходил в пьяные ссоры и потасовки. Почти 500 лет такой устный экзамен оставался единственным видом «теста» на академическую успеваемость. В 1700 г. в Кембриджском университете устный экзамен был введен и для получения более низкой степени магистра. В начале XIX в. письменные экзамены становятся в Европе общепринятыми. В США пер­вые письменные экзамены были введены в Массачусетсе в 1845 г.

Считается, что первопроходцем в области педагогического измерения был Ре-веренд Джордж Фишер, директор школы в Англии. Еще в начале 1860-х гг. этот педагог понял необходимость установления стандартов успеваемости в обучении. Для использования в своей школе Фишер разработал так называемые «книги шкал». Он присваивал значение единицы для выражения высшего показателя, которого возможно достичь, и значение пяти для обозначения наименьших до­стижений в таких предметах, как правописание, математика, навигация, библия, французский язык, общая история, рисование и др.

Американский врач и психолог Дж. М. Раис (1857-1934) заслуживает призна­ния как первый из тех, кто начал массовое тестирование в школе. Он изобрел три различных теста на правописание, которые использовал для проверки примерно 33 тыс. учеников 4-8-х классов в 21 городе США. Отчет о результатах этого ис­следования был издан в 1897 г.

Этот отчет произвел фурор среди американских преподавателей. Одним из выводов исследования было то, что количество времени, проведенного в ежеднев­ной тренировке по правописанию, не имеет непосредственной связи с успехами


в нем (много позже по оригинальным данным Раиса был рассчитан коэффициент корреляции, равный -0,12) Из этого следовало заключение о том, что детей нуж­но не столько учить правописанию, сколько развивать их ум. Впоследствии Раис направил свое внимание на поиск инструментов, позволяющих оценить уровень овладения арифметикой. В 1902 г. он составил серию арифметических тестов для 4-8-х классов и провел их примерно с 6 тыс. учащимися из 18 школ, расположен­ных в 7 городах. На следующий год был подготовлен языковой тест в форме пре­зентации рассказа, по которому ученики должны были писать сочинение. Более чем 8 тыс. учащихся из 9 различных городов писали такие сочинения. Они были оценены Райсом по изобретенной им пятибалльной шкале, которой, как извест­но, предстояло большое будущее. Однако работы Раиса, несмотря на их новатор­ский характер, не были достойно оценены его современниками. Отцом измерения в образовании в США был признан Э. Торндайк.

Проявляя интерес к статистике, Торндайк совместно с Фоксом в 1903 г. опуб­ликовал исследование, в котором были разработаны и использованы несколько тестов, связанных с арифметическими операциями. Целью их исследования было изучение взаимоотношений между различными арифметическими операциями. В том же году Торндайк издает книгу под названием «Образовательная психоло­гия» (Educational Psychology). В ней описывались те виды тестов, которые счита­лись наилучшими для определения успеха в обучении.

Публикация этой книги ознаменовала появление новой области — образова­тельной психологии, в которой нашлось место и проблемам измерения. Разработ­ке этих проблем посвящена ставшая классической работа Торндайка «Введение в теорию умственных и социальных измерений» (Introduction to the Theory of Mental and Social Measurements, 1904). Помимо статистических методов в этой книге об­суждались принципы построения тестов.

В декабре 1909 г. Торндайк представил научной общественности свою широко известную Шкалу почерка. Эта шкала, по сути дела, была первым инструментом для измерения продукта образования. Торндайк собрал образцы почерков, кото­рые классифицировались экспертами как различные по качеству. Для того чтобы образовать шкалу, он расположил эти образцы в порядке возрастания их качества. Шкала почерка Торндайка положила начало этапу стремительного развития тес­тов по многим образовательным предметам. Этому в немалой степени способство­вал приток в США иммигрантов, обусловивший увеличение набора учащихся. Также возрастала необходимость в квалифицированных рабочих, что требовало их обучения и, конечно, развития инструментов для оценки его эффективности. К этому времени относится разработка арифметических тестов С. Стоуном, одним из последователей и учеников Торндайка. Широко известные как Стандартные тесты Стоуна, они внесли вклад в образовательное измерение и стали основой для исследований другого ученика Торндайка — С. А. Куртиса. Результатом усилий Куртиса стала Серия арифметических тестов А (1909). Позднее появляется зна­чительно усовершенствованная серия В (1914).

При проверке бесплатных школ Нью-Йорка в 1910-1911 гг. впервые были ис­пользованы тесты для измерения успеваемости учеников как средство оценки


эффекта внести школьной системы. Среди используемых в ходе этой проверки те­стов (было обследовано более 30 тыс. учеников) были и тесты Куртиса. Они же были задействованы в последующих широкомасштабных исследованиях в Босто­не, Кливленде, других крупных городах США.

Среди других подготовленных Торндайком исследователей, внесших свой вклад в развитие образовательного измерения, был Б. Р. Букингем. В 1913 г. он разработал шкалу правописания, которая представляла новый тип измерительно­го инструмента. Уровни сложности 50 слов, отобранных для шкалы, были опре­делены на основании процента правильных ответов учеников различных классов. После этого слова были расставлены в шкале в соответствии с их уровнем слож­ности. В шкалу вошли также 125 вспомогательных слов. Теоретической основой теста Букингема было положение о том, что способность к правописанию может быть измерена тем уровнем трудности, которого может достичь ученик по этой шкале. Принцип построения шкалы Букингема был использован Л. П. Айресом в его Шкале правописания, а также другими специалистами по образовательно­му измерению при создании тестов для разных предметных областей: С. Вуди — для тестов на математические операции; X. Г. Хотсом — для алгебры; В. А. С. Хен-моном и X. А. Брауном — для латыни; М. Р. Трабу — для языкознания, а также М. Дж. Ван-Вагененом — для тестов по истории.

Результаты тестовых исследований в крупных городах побуждают руковод­ство школ к соответствующим нововведениям. В «Двенадцатом ежегоднике На­ционального общества по исследованию образования» (1913) впервые были даны официальные рекомендации по использованию тестов в школе. Руководство школ начинает активно использовать статистические методы. В университетах были разработаны специальные курсы для обучения статистическим методам будущих администраторов и технических специалистов в области образования. Основным учебником служило переработанное Торндайком «Введение в теорию умственных и социальных измерений» (1913).

Для содействия изучению работы школ независимыми организациями, город­скими и окружными школьными департаментами, государственными отделами общественного обучения, а также университетскими центрами были созданы бюро образовательных исследований под руководством выдающихся специали­стов в развитии измерения. Это обеспечило прогресс в области школьных изме­рений. Этими бюро предоставлялись услуги по обеспечению тестами персонала школ, проводилась стандартизация имеющихся тестов, создавались новые. Адми­нистрация и учителя школ знакомились с тестами и техникой их проведения. Продажа и использование тестов, по мнению Ашбо (1918), выросли до беспреце­дентных размеров. Этот автор сообщал о том, что в 1916 г. было реализовано около 900 тыс. копий одного из популярных тестов, а ежегодная продажа некоторых дру­гих перевалила за 100 тыс. экземпляров. Использование тестов не ограничивалось пределами США. Они рассылались во многие страны мира. К 1918 г. В. С. Монро представил список 109 стандартизированных тестов на измерение успеваемости, которые уже были на рынке, включая 84 теста, созданных для младших классов (до 8-го класса включительно), а также 25 тестов — для старших классов. Боль­шинство тестов для начальной школы составляли тесты на измерение успехов


в математике и только один тест оценивал эффективность обучения рисованию. Тесты по иностранному языку лидировали среди тех, которые предназначались для старшеклассников.

Накануне Первой мировой войны тесты для измерения интеллекта были при­знаны как наиболее важные инструменты образовательной психологии. Интел­лект стал особой областью исследования в образовательной психологии, и лиде­ром этого направления также был Торндайк. В 1918 г. Торндайк формулирует принцип, на котором должно базироваться тестирование в образовании. Суть это­го принципа состоит в том, что если нечто существует, то оно существует в опре­деленном количестве. Обучение связано с изменениями в человеке; изменение заключается в различии между двумя ситуациями; каждая из этих ситуаций из­вестна нам только по произведенному продукту — изготовленным вещам, произ­несенным словам, выполненным действиям и т. п. Измерение любого из этих про­дуктов означает определение его количества таким образом, что в итоге мы будем знать его величину лучше, чем до измерения.

В течение 10 лет, предшествующих Первой мировой войне, а также какое-то время после нее Торндайк был своего рода оракулом образовательной психоло­гии США, его взгляды на тесты и интеллект представлялись незыблемыми и не подлежали обсуждению.

Сегодня образовательные тесты обычно подразделяются на батареи общих достижений и тесты по конкретным учебным предметам. Батареи тестов общих достижений позволяют получить профиль показателей успешности по основным областям школьных знаний. Основное достоинство этих тестов в том, что иссле­дователь имеет возможность сравнения основных результатов ученика, достигну­тых в разных областях знаний. Иногда такое сравнение возможно и на достаточно длительных отрезках обучения, при переходе из класса в класс. Тесты по конкрет­ным учебным предметам позволяют более глубоко проникнуть в структуру успеш­ности усвоения определенной области знания, что особенно важно при специа­лизации учащихся в какой-либо науке. На сегодняшний день, во всяком случае в США, наверное, очень трудно найти учебную дисциплину, по которой не суще­ствовало бы стандартизированного теста достижений. Помимо упомянутых тес­тов в образовании используются близкие друг другу диагностические и критери­ально-ориентированные методики. Первые используются для выявления причин и анализа трудностей, возникающих в обучении, с помощью вторых ведется по­стоянная оценка степени овладения соответствующими навыками (о критериаль­но-ориентированном тестировании см. выше).


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: