Общие требования к тестам

В заданиях теста не должно быть лишних слов, каждое задание должно содержать четкие и короткие инструкции, ответы должны быть короткими и содержательными. По форме тестовые задания можно разделить на следующие основные группы:

- задание с выбором верного ответа (или несколько верных) из набора предлагаемых- тесты закрытого типа;

- ввод предполагаемого ответа на задание самим тестируемым- тесты открытого типа.

При компьютерном тестировании вторая форма тестов трудно реализуется. Задания открытого типа иногда порождают ответы, которые формально трудно оценить ни как правильные, ни как неправильные. Поэтому при компьютерном тестировании чаще используют тесты закрытого типа. При этом следует иметь в виду, что неправильные варианты ответов должны быть правдоподобны. Удачно составленные задания отвлекают внимание примерно половины испытуемых, незнающих правильного ответа на вопрос. Обязательным условием и основным этапом при разработке и формировании теста является оценка его качества, трудности и надежности. Опыт разработки тестов показывает, что создание качественного теста предполагает совместную работу преподавателя- предметника со специалистами по тестам. Оценка качества теста достигается путем обсуждения несколькими экспертами формы, содержания теста и вариантов ответов. Трудность теста можно определить экспериментально (по частоте появления верных ответов на задания), надежность же тестов характеризуется воспроизводимостью результатов при повторном тестировании и также может быть установлено экспериментально.

Одним из наиболее трудоемких этапов в разработке тестов является этап составления заданий. Тест должен отражать контролируемый материал, не содержать избыточных заданий, соответствовать целям тестирования. Под структурой теста будем понимать определенный порядок связывания заданий в тесте: задания считаются связанными, если верный (неверный) ответ на одно задание предполагает верный (неверный) ответ на другое. В этом случае при ответе на одно задание учитываются ответы на все задания, структурно с ним связанные. Для такой структуры естественно выстроить все задания теста по степени сложности и установить между ними связи.

Контроль осуществляется следующим образом: тестируемому предъявляется некоторое задание. Если задание выполнено верно, предполагается, что также верны результаты всех заданий, предшествующих выбранному на данном шаге. Если результат неверный, то предполагается неверными результаты всех заданий следующих в структуре теста за выполненным. Далее выделенные таким образом задания отсекаются (включая предъявленное задание), и формируется новая структура из заданий с еще неопределенным результатом, из числа которых выбираются очередные задания для предъявления тестируемому. Таким образом, данный алгоритм позволяет исключить из запроса те задания, ответы на которые предопределены ответами на уже заданные.

НВ каждом шаге вычисляется количество правильно выполненных заданий. Опрос завершается, если это количество станет большим или равно некоторой величине, заданной преподавателем и определяющей полноту опроса. Такой алгоритм позволяет проводить опрос начиная с более легких или со сразу сложных заданий в зависимости от целей тестирования /5/.

 

Уровни тестов

Для проверки качества усвоения материала на первом уровне (уровне знакомства) должны использоваться тесты, требующие выполнения действий, направленных на узнавание. Это распознавание, различения, классификация объектов, явлений и понятий. Тесты первого уровня- это тесты на опознания («да»- «нет») и тесты на различение (избирательные или выборочные).

Тесты второго уровня требуют от учащихся выполнение действий по воспроизведению по памяти информации об объекте изучения. Например:

А) дополните текст…….;

Б) напишите формулу……..;

В) нарисуйте схему………….

В случае а) испытуемый должен дать полную формулировку, в случае б) необходимо написать лишь нужную формулу, в случае в) требуется вставить по памяти расположение элементов.

Можно выделить два типа тестов второго уровня: тесты на дополнение или подстановку, тесты на понимание и воспроизведение. Тесты третьего уровня требуют от испытуемого умение применить усвоенную информацию в практической деятельности для решения типовых и некоторых нетиповых заданий. При этом всегда имеет место продуктивная деятельность учащегося в результате которой приобретенные знания проверяются на уровне умений. Такими тестами являются задачи, требующие готового способа решения без его существенного преобразования. Воспроизведение и использование знаний происходит в том виде, в котором они были усвоены в процессе обучения.

Тесты четвертого уровня требуют таких знаний и умений, которые позволяют принимать решения в новых проблемных ситуациях. К этому уровню относятся задания, для выполнения которых испытуемый должен ориентироваться в сложной, незнакомой ему ситуации.

Следует подчеркнуть также важность оценки трудности теста. Нередко составители теста путают трудность теста со сложностью измеряемого или интеллектуального процесса. Задание или тест, требующий простого воспроизведения, может быть очень трудным из-за некорректно поставленного вопроса или большого объема элементарных операций. С другой стороны, тест, требующий интерпретации данных или применения принципов решения, может быть простым, потому что сами принципы или методы решения хорошо известны.

 

Свойства тестов

 

Тесты должны обладать следующими свойствами:

- валидность (адекватность, обоснованность);

- определенность (общепонятность);

- надежность;

- практичность;

- простота в использовании;

- прогностическая ценность.

Валидность теста отражает, что именно должен измерить тест и на сколько хорошо он это делает; показывает, в какой мере тест измеряет то качество (свойство, способности и т.п.), для оценки которого он предназначен. Не обладающие валидностью тесты непригодны для практического использования. Выделят три типа валидности:

- содержательная- дает ответы на вопросы, охватывает ли содержание теста весь комплекс программных требований к значению данного конкретного предмета и насколько данные задания (выбранные из множества возможных) пригодны для оценки знаний по этому предмету;

- эмпирическая- означает проверку теста с помощью другого теста, измеряющего тот же показатель, что и данный, с целью оценить индивидуальную прогностичность теста;

- концептуальная- устанавливается путем доказательств правильности теоретических концепций, положенных в основу теста. Определенность теста означает, что при его чтении испытуемый хорошо понимает, какие задания и в каком объеме он должен выполнить, чтобы полученный результат соответствовал поставленной задачи.

Надежность теста– это вопрос о том, в какой мере его повторение приведет к тем же результатам. Повышению надежности теста способствует его простота, строгое соблюдение условий тестирования, исключение возможностей влияния посторонних факторов (подсказки, списывание и т.п.).

Прогностическая ценность теста означает, что тест должен быть таки, чтобы результаты обследования могли быть использованы в последующей деятельности, например, при повторении плохо усвоенного материала.

При составлении тестов должны учитываться такие следующие требования:

- строгое соответствие источникам информации, которыми пользуются учащиеся;

- простота- каждое задание должно заключаться в требовании от испытуемого ответа только на один вопрос;

- однозначность- формулировка задания должна исчерпывающим образом разъяснять поставленную перед испытуемым задачу, при чем язык и термины, обозначения, графические изображения и иллюстрации задания и ответов к нему должны быть безусловно и однозначно понятыми учащимся /6/.

 

Оценочные шкалы

Сложившаяся в России пятибалльная система оценок была удобна для школ с единым содержанием образования, единым уровнем его усвоения, едиными сроками изучения материалов. Очевидно, что в изменившихся условиях одинаковые оценки могут нести совершенно различную информацию. Часто поступающие в ВУЗы абитуриенты с одинаковыми оценками в аттестате показывают разные уровни подготовки.

На рисунке 1 представлены виды оценочных шкал.

Преимущество количественных шкал- их простота и определенность, но плата за это является их малая информативность. Порядковые шкалы, особенно дескриптивные, высоко информативны и содержательны. Недостатком их является высокая неопределенность, необходимость иметь систему экспертизы. При тестировании чаще всего используется относительная и рейтинговая шкала /6/.

 

Рисунок 1- Виды оценочных шкал


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: