Образец матрицы для анализа заданий

Обследуемый	Задания	Сумма
a	b	с	d	е
1. 2. 3. 4. 5.
Сумма

Задания (вопросы, утверждения) только тогда следует включать в окончательную версию опросника, когда они измеряют те же самые личностные особенности, что и другие, предназначенные для этого задания. Для определения дискриминативности заданий используется коэффициент корреляции каждого задания с общим баллом всего теста. Чем выше коэффициент корреляции, тем выше дискриминантность задания, тем лучше задание. Это основной критерий. Как правило, требуется минимальная корреляция в 0,2. Задания с отрицательной или нулевой корреляцией почти всегда исключаются.

При решении вопроса о включении задания в окончательную версию теста нужно принимать во внимание многие факторы. В дополнение к изучению эффективности и дискриминантности нужно определить то количество заданий, которое потребуется для окончательной версии (не менее 20-30 заданий!) и насколько хорошо они «вписываются» в ранее созданную для теста решетку. Например, можно включить задания с низкой дискриминативностью, если имеется немного заданий по некоторой области измерения. Также иногда имеет смысл включение в окончательный вариант опросника задания с недостаточно высоким показателем эффективности при условии, что оно обладает достаточной дискриминантностью. Также важно обеспечить приблизительно равное количество прямых и обратных заданий. Для испытуемых разных полов необходимо выполнить отдельные процедуры анализа заданий.

8. Определение надежности теста. Надёжность – относительное постоянство и устойчивость результатов измерения при первичном и повторном его применении на одних и тех же испытуемых. Понятие надежности связано с понятием точности измерения. Если многократное измерение каждый раз дает абсолютно разное значение измеряемого показателя, значит, измерительная процедура не является надежной. Повторное применение надежного инструментария должно давать сходные результаты. Некоторые расхождения допустимы, но важно чтобы, они были незначительными. Надежность – критерий, который говорит о точности психологических измерений, т.е. насколько внушают доверие полученные результаты.

В тесте проверяется: 1) надежность самого измерительного инструмента (метод расщепления); 2) стабильность измеряемого признака; 3) константность, т.е. относительная независимость результатов от незначительных изменений в условиях проведения обследования (метод ретеста).

Метод расщепления. Обычно задания теста делятся на четные и нечетные, отдельно обрабатываются, а затем результаты двух полученных рядов коррелируются между собой. Если измерительный инструмент однороден, то большой разницы в успешности решения по таким половинкам не будет, следовательно, коэффициент корреляции будет достаточно высоким (не ниже r = +0,75).

Метод ретеста – повторное измерение интересующего качества на одной и той же выборке с использованием одной и той же измерительной процедуры при сохранении одних и тех же условий, но через определенный временной интервал. О стабильности измеряемого признака судят по коэффициенту корреляции между показателями первого и второго замера. Коэффициент корреляции должен быть не ниже r = +0,70. Очень многое в данном методе зависит от временного интервала. Если он небольшой, то испытуемый, уже знакомый с процедурой измерения, будет помнить результат и ориентироваться на него (либо подгонять под первоначальный, либо стремиться продемонстрировать «новый» результат). Это нежелательно, идет искажение надежности. Если времени слишком много, испытуемые забудут прежний результат, но и в самих измеряемых качествах могут произойти значительные изменения, т.е. ретест будет замерять уже новое качество, а не воспроизводить старый результат. Оптимальным считается временной интервал в 2 – 3 недели.

Метод параллельного измерения. Применяется для проверки константности методики. Коррелируются результаты двух экспериментов, проведенных в относительно одинаковых условиях на одной и той же выборке испытуемых, но разными экспериментаторами. Коэффициент корреляции должен быть не ниже r = +0,80.

9. Определение валидность теста. Валидность – характеристики способности измерительной процедуры измерять действительно то, для чего эта процедура используется. Тест называется валидным, если он измеряет то, для измерения чего предназначен. Проверка измерительной процедуры на валидность называется валидизацией.

Очевидная валидность – описывает представление о тесте, сложившееся у испытуемого. Тест должен восприниматься обследуемым как серьезный инструмент познания его личности, чем-то схожий с вызывающим уважение и в какой-то мере трепет медицинским диагностическим инструментарием. Очевидная валидность приобретает особое значение в современных условиях, когда представление о тестах в общественном сознании формируется многочисленными публикациями в популярных газетах и журналах того, что можно назвать квазитестами, с помощью которых читателю предлагается определить все, что угодно: от интеллекта до совместимости с будущим супругом.

Конкурентная валидность оценивается по корреляции разработанного теста с другими, валидность которых относительно измеряемого параметра установлена.

Прогностическая валидность устанавливается с помощью корреляции между показателями теста и некоторым критерием, характеризующим измеряемое свойство, но в более позднее время. По Л. Кронбаху, прогностическая валидность – наиболее убедительное доказательство того, что тест измеряет именно то, для чего он был предназначен. Основная проблема – выбор внешнего критерия (это особенно затруднительно при разработке личностных тестов).

Инкрементная валидность имеет ограниченное значение и относится к случаю, когда один тест из батареи тестов может иметь низкую корреляцию с критерием, но не перекрываться другими тестами из этой батареи.

Дифференциальная валидность может быть проиллюстрирована на примере тестов интересов. Тесты интересов обычно коррелируют с академической успеваемостью, но по-разному для разных дисциплин. Ее значение так же ограничено.

Содержательная валидность – подтверждение того, что задания теста отражают все аспекты изучаемой области поведения. Обычно она определяется у тестов достижений. На практике для ее определения подбираются эксперты, которые указывают, какая область (области) поведения наиболее важна, например, для музыкальных способностей, а затем, исходя из этого, генерируются задания теста, которые вновь оценивают эксперты.

Конструктная валидность демонстрируется полным, насколько это возможно, описанием переменной, для измерения которой предназначается тест. По сути дела, она включает в себя все подходы к определению валидности, которые были перечислены выше. Решение вопроса о конструктной валидности – поиск ответа на два вопроса: 1) существует ли реально некоторое свойство; 2) надежно ли измеряет данный тест индивидуальные различия по этому свойству.

Не существует какого-либо единичного показателя, с помощью которого устанавливается валидность психологического теста. В отличие от надежности и дискриминативности, нельзя осуществить точные статистические расчеты, подтверждающие валидность методики. Однако разработчик должен представить весомые доказательства в пользу валидности теста, что потребует от него психологических знаний и интуиции.

10. Определение объективности теста. Согласно Кеттэллу, измерительная процедура считается объективной, если ее цель скрыта от испытуемого (что не позволяет ему фальсифицировать результаты измерения) и данные, полученные с ее помощью, могут быть оценены независимо от лица, проводящего измерение и интерпретацию. Добиться независимости измерения психологических качеств и свойств от влияния субъективных факторов, связанных с особенностями личности экспериментатора и испытуемого, практически невозможно. Поэтому существует другое понимание объективности. Если использование в психологическом исследовании какой-либо измерительной процедуры разными исследователями при измерении одного и того же показателя на идентичных, но в тоже время разных выборках дает одинаковый результат, то данная измерительная процедура считается объективной. В этом определении акцент смещён с требования независимости на требование сохранения одинакового результата. Добиться сохранения одинакового результата возможно, для чего необходимо соблюдать меры по стандартизации основных составляющих измерительной процедуры (начиная от выбора заданий для испытуемого, времени для выполнения заданий, заканчивая процедурой регистрации данных, обработки и интерпретации результатов).

11. Стандартизация теста позволяет сравнить показатели, полученные одним испытуемым, с таковыми в генеральной совокупности или соответствующих группах. Этим достигается адекватная интерпретация показателя отдельного испытуемого. При стандартизации теста вводится понятие нормы, или нормативных показателей. Для получения стандартных норм нужно тщательно отобрать большее количество испытуемых в соответствии с ясно обозначенным критерием. При формировании выборки стандартизации следует учитывать ее объем и репрезентативность. В руководствах по тестам чаще всего указывается на то, что для простого уменьшения стандартной погрешности достаточной будет выборка из 500 испытуемых. Однако репрезентативность выборки не зависит от ее объема. Например, для того чтобы получить нормативные показатели для всей популяции детей, обучающихся в начальной школе, потребуется выборка объемом более 10 тысяч, тогда как выборка из такой ограниченной популяции, как пилоты авиакомпаний, не может быть столь значительной.

В некоторых случаях приходится формировать несколько групп стандартизации относительно возраста, пола, социального статуса и пр. Нормы находятся эмпирически, т.е. представляются в средних величинах и показателе стандартного отклонения.

Формула подсчета средней арифметической величины:

Формула вычисления среднего квадратического отклонения:

Статистические нормы задаются в соответствии со значениями средней арифметической величины и среднего квадратического отклонения измеряемого показателя.

Созданием стандартизованного теста и его публикацией обычно завершается работа психолога, но следует помнить, что с течением времени необходим пересмотр (ревизия) теста. Достаточно вспомнить о тестах интеллекта, нормы по которым устаревают через каждые 5 лет, и можно предположить, что процесс их старения будет ускоряться.

Диагностическая методика отличается от любой исследовательской тем, что она стандартизирована. Стандартизация (по А. Анастази)– это единообразие процедуры проведения и оценки выполнения теста. Таким образом, стандартизация рассматривается в двух планах: как выработка единых требований к процедуре эксперимента и как определение единого критерия оценки результатов диагностических испытаний. Стандартизация процедуры эксперимента подразумевает унификацию инструкций, бланков обследования, способов регистрации результатов, условий проведения обследования.

11 12 13 14 15 16 17

Подборка статей по вашей теме: