Проверка надёжности теста

Надежность теста это такой критерий, который говорит о степени точности, с которой тест измеряет определённоё свойство или способ поведения личности. Надёжность характеризует тест с точки зрения его устойчивости к действию помех (внешних и внутренних).

О высокой степени надёжности теста говорят в том случае, когда тест точно измеряет то свойство, для измерения которого он предназначен. В качестве критериев точности можно отметить следующие:

1) При повторно применении теста к тем же самым испытуемым, в одних и тех же условиях, через определённый интервал времени, результаты обоих тестирований существенно не различаются между собой.

2) Действия случайных посторонних факторов не оказывают существенного влияния на результаты тестирования.

В качестве посторонних факторов можно назвать следующие: эмоциональное состояние и утомление, если они не входят в круг исследуемых характеристик, температура, освещённость помещения и другие. Такие посторонние случайные факторы ещё называют факторами нестабильности измерительной процедуры.

3) При повторном применении теста к тем же самым испытуемым, через определённый интервал времени, в изменённых условиях результаты обоих тестирований существенно не различаются между собой. Под изменёнными имеется в виду следующие условия: другой экспериментатор, состояние респондента и другие.

Наиболее часто надёжность толкуют в следующих смыслах:

1) Надёжность самого измерительного инструмента – характеризуется коэффициентом надёжности. Эмпирическое определение этого коэффициента является обязательным условием допуска теста для его использования в практической деятельности психолога. Уровень надёжности теста зависит от:

а) Правильности подбора заданий, с точки зрения их взаимосогласованности;

б) Внутренней однородности – актуализации в заданиях одного и того же свойства;

в) Общей гомогенности и взаимосогласованности отдельных пунктов заданий.

Для проверки надёжности измерительного инструмента, позволяющего судить о степени его однородности (гомогенности) используют метод деления, или расщепления теста на части, при котором задания теста делятся на чётные и нечётные (иногда первую половину и вторую половину), отдельно обрабатываются, а затем результаты двух полученных на репрезентативной выборке рядов коррелируются между собой, и мерой надёжности выступает коэффициент корреляции, рассчитанный по формуле Спирмена (см. 3.1.1). Методика признаётся надёжной, если полученный коэффициент корреляции Спирмена (rs) не ниже +0,75 - +0,85. Но на начальном этапе разработки теста можно получить невысокий коэффициент корреляции - +0,46 - +0,50, что говорит о том, что ряд заданий теста имеет специфичность и их надо изъять из теста и повторить процедуру снова. Снижение коэффициента надёжности может происходить также в результате социально-психологической неоднородности той выборки, на которой проверялась надёжность теста.

2) Стабильность изучаемого признака – характеризуется коэффициентом стабильности. Он позволяет судить о том, насколько устойчив, стабилен признак, который измеряется данной методикой.

Для измерения стабильности теста используется приём, известный под названием тест – ретест, заключающийся в повторном тестировании выборки испытуемых одним и тем же тестом через определённый интервал времени при одних и тех же условиях. Временной интервал зависит от возраста (например, у маленьких детей изменения могут произойти в течение одного месяца), событий, происходящих с испытуемым в жизни, содержанием и характером задач теста. С увеличением временного интервала в последовательности: , стабильность признака имеет тенденцию снижаться, и поэтому наибольшую проблему вызывает попытка ответить на вопрос об оптимальных сроках повторного тестирования. Наиболее часто многие авторы называют срок между первым и повторным тестированием для взрослых в несколько месяцев, но не более 6. Для детей младшего возраста – несколько недель.

Мерой стабильности теста выступает коэффициент корреляции между результатами первого и повторного тестирования у одной и той же выборки испытуемых. Коэффициент стабильности, рассчитанный по формуле Спирмена (см. 3.1.1 (rs)), должен быть не ниже rs = +0,8.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: