Надежность тестов

Надежностью тестов называется степень совпадения результатов при повторном тестировании одних и тех же людей в одинаковых условиях. Вполне понятно, что полное совпадение результатов при повторных измерениях практически невозможно.

Вариацию результатов при повторных измерениях называют внутрииндивидуальной или внутригрупповой, либо внутриклассовой. Основными причинами такой вариации результатов тестирования, которая искажает оценку истинного состояния подготовленности спортсмена, т.е. вносит определенную ошибку или погрешность в эту оценку, являются следующие обстоятельства:

1) случайные изменения состояния испытуемых в процессе тестирования (психологический стресс, привыкание, утомление, изменение мотивации к выполнению теста, изменение концентрации внимания, нестабильность исходной позы и других условий процедуры измерений при тестировании);

2) неконтролируемые изменения внешних условий (температура, влажность, ветер, солнечная радиация, присутствие посторонних лиц и т.п.);

3) нестабильность метрологических характеристик технических средств измерения (ТСИ), используемых при тестировании. Нестабильность может быть вызвана несколькими причинами, обусловленными несовершенством применяемых ТСИ: погрешностью результатов измерения из-за изменений напряжения сети, нестабильностью характеристик электронных измерительных приборов и датчиков при изменениях температуры, влажности, наличием электромагнитных помех и т.п. Следует отметить, что по этой причине погрешности измерений могут составлять значительные величины;

4) изменения состояния экспериментатора (оператора, тренера, педагога, судьи), осуществляющего или оценивающего результаты тестирования

и замена одного экспериментатора другим;

5) несовершенство теста для оценки данного качества или конкретного показателя подготовленности.

Существуют специальные математические формулы для определения коэффициента надежности теста.

В таблице 2 приведена градация уровней надежности тестов.

Тесты, надежность которых меньше указанных в таблице значений, использовать не рекомендуется.

Говоря о надежности тестов, различают их стабильность (воспроизводимость), согласованность, эквивалентность.

Под стабильностью теста понимают вопроизводимостъ результатов при его повторении через определенное время в одинаковых условиях. Повторное тестирование обычно называют ретестом. Стабильность теста зависит от:

-вида теста;

- контингента испытуемых;

- временного интервала между тестом и ретестом.

Для количественной оценки стабильности используется дисперсионный анализ, по той же схеме, что и в случае расчета обычной надежности.

Согласованность теста характеризуется независимостью результатов тестирования от личных качеств лица, проводящего или оценивающего тест. Если результаты спортсменов в тесте, который проводят разные специалисты (эксперты, судьи), совпадают, то это свидетельствует о

высокой степени согласованности теста. Это свойство зависит от совпадения методик тестирования у разных специалистов.

Когда создается новый тест, нужно обязательно проверить его на согласованность. Делается это так: разрабатывается унифицированная методика проведения теста, а потом два или более специалиста по очереди в стандартных условиях тестируют одних и тех же спортсменов.

Эквивалентность тестов. Одно и то же двигательное качество (способность, сторону подготовленности) можно измерить с помощью нескольких тестов. Например, максимальную скорость — по результатам пробегания с ходу отрезков в 10, 20 или 30 м. Силовую выносливость - по числу подтягивании на перекладине, отжиманий в упоре, количеству подъемов штанги в положении лежа на спине и т. д. Такие тесты называют эквивалентными.

Эквивалентность тестов определяется следующим образом: спортсмены выполняют одну разновидность теста и затем, после небольшого отдыха, вторую и т. д.

Если результаты оценок совпадают (например, лучшие в подтягивании оказываются лучшими и в отжимании), то это свидетельствует об эквивалентности тестов. Коэффициент эквивалентности определяется с помощью корреляционного или дисперсионного анализа.

Применение эквивалентных тестов повышает надежность оценки контролируемых свойств моторики спортсменов. Поэтому если нужно провести углубленное обследование, то лучше применить несколько эквивалентных тестов, Такой комплекс называется гомогенным. Во всех остальных случаях лучше использовать гетерогенные комплексы: они состоят из неэквивалентных тестов.

Не существует универсальных гомогенных или гетерогенных комплексов. Так, например, для слабо подготовленных людей такой комплекс, как бег на 100 и 800 м, прыжок и длину с места, подтягивание на перекладине, будет гомогенным. Для спортсменов высокой квалификации он может оказаться гетерогенным.

До определенной степени надежность тестов может быть повышена путем:

- более строгой стандартизации тестирования,

- увеличения числа попыток,

- увеличения числа оценщиков (судей, экспертов) и повышения согласованности их мнений,

- увеличения числа эквивалентных тестов,

- лучшей мотивации испытуемых,

- метрологически обоснованный выбор технических средств ихмерений, обеспечивающий заданную точность измерений в процессе тестирования.

1 2 3 4 5 6 7

Подборка статей по вашей теме: