Стандартизация. (англ. standard – типовой, нормальный) унификация, регламентация, приведение к единым нормам процедуры и оценок теста

(англ. standard – типовой, нормальный) унификация, регламентация, приведение к единым нормам процедуры и оценок теста.

Благодаря стандартизации методики достигается сопоставимость полученных результатов у разных испытуемых, появляется возможность выражения тестовых оценок в относительных к выборке стандартизации показателях, сопоставления таких оценок в разных тестовых методиках.

В психодиагностике различают две формы стандартизации

· В первом случае под стандартизацией понимается обработка и регламентация процедуры проведения, унификация инструкции, бланков обследования, способов регистрации результатов, условий проведения обследования, характеристика контингентов испытуемых. Строгая периодичность процедуры обследования – обязательное условие обеспечения надежности теста.

· Во втором случае под стандартиацией понимается преобразование нормальной (или искусственно нормализованной) шкалы оценок в новую шкалу, основанную уже не на количественных эмпирических значениях изучаемого показателя, а на его относительном месте в распределении результатов в выборке.

Наиболее распространенными преобразованиями оценок в психодиагностике являются центрирование и нормирование посредством среднеквадратических отклонений.

"Любая норма, в чем бы она ни выражалась, ограничивается конкретной совокупностью людей, для которых она вырабатывалась... Применительно к психологическим тестам они (нормы) никоим образом не абсолютны, не универсальны и не постоянны. Они просто выражают выполнение теста испытуемыми из выборки стандартизации"

Применение тестовых норм в профессионально организованной психодиагностике основывается на переводе тестовых баллов из «сырой» шкалы в «стандартную». Эта процедура называется «стандартизация тестового балла».

17.

Особое значение для психодиагностики имеет понятие - норма. В психодиагностике следует различать как минимум два различных вида норм: статистические и социокультурные. Первый вид чаще применяется для оценки стилевых и мотивационных черт. Второй вид - для оценки способностей и достижений.

Статистическая норма - это средний диапазон на шкале измеряемого свойства. Нормой здесь считается близость значения свойства к тому уровню, который характеризует статистически среднего индивида.

Критериальные - диагностические нормы, в которых задано соответствие между тестовыми баллами по шкале измеряемого свойства и уровнем критериального показателя. В случае критериального поведения КН указывают на вероятность появления критериального поведения при данном значении тестового балла.

Абсолютные нормы: в роли шкалы для вынесения диагноза выступает сама шкала сырых баллов (например, количество {ученных иностранных слов).

18.

Процентильные тестовые нормы: это точки на шкале тестовых баллов, которые отделяют от выборки стандартизации заданный процент испытуемых.

Процентиль - процент испытуемых, показавших балл ниже или равняый данному.

Процентили показывают относительное положение каждого испытуемого в нормальной выборке, но не величину различий между результатами. Процентильные оценки обладают и рядом достоинств. Они легко доступны пониманию пользователей психодиагностической информации, универсальны по отношению к различным типам методик и легко рассчитываются. Пр.о. не относятся к типичным шкальным показателям.

Нормативное измерение на интервальном уровне использует предположение о равенстве единиц измерения показателя теста во всем интервале его вариации. Для сравнения показателей разных тестов они переводятся в стандартные шкалы.

Связь многих статистических параметров с нормальным распределением определяет предпочтительность нормального распределения тестовых оценок. Если эмпирическое распределение отличается от нормального, оно может быть в большинстве случаев нормализовано искусственно (стандартизировано).

19.

Шкалирование- метод моделирования явлений с помощью числовых систем.

Шкалы измерительные- форма фиксации совокупности признаков изучаемого объекта с упорядочиванием их в определенную числовую систему. Шкалы и представляют собой метрические системы, моделирующие исследуемый феномен путем замены прямых обозначений изучаемых объектов числовыми значениями и отображение пропорций континуального состава элементов объекта в соответствующих числах. Каждому элементу совокупности проявлений свойств соответствует определенный бал или шкальный индекс, количественно устанавливающий положение наблюдаемой единицы на шкале, которая охватывает всю совокупность или ее часть, существенную с точки зрения исследования.

Классификация Стивенсона. По признаку метрической детерминированности. Шкалы бывают метрические (интервальные и шкалы отношений) и неметрические (номинативные, шкалы порядка).

Номинативные шкалы устанавливают соответствие признака тому или иному классу. Объекты объединяют в классы на основании какого- либо общего свойства, либо символа. Это не шкала измерения, допускается лишь операция равенства и неравенства.

Порядковые шкалы- предназначены для расчленения совокупности признаков на элементы, связанные отношением «больше-меньше», и допускают отнесение переменных к группам, упорядоченным друг относительно друга и представляющим некое системное единство. Они дают возможность оценить степень выраженности признака.

Шкала интервалов- метрическая шкала, в которой элементы упорядочены не только по принципу выраженности измеряемого признака, но и на основе ранжирования признаков по размеру, что выражается интервалами между числами, приписываемыми степени выраженности измеряемого признака.

К ряду шкалы интервалов относятся шкалы IQ-показателей, T-баллов, процентилей.

В шкалах отношений числовые значения присваиваются объектам таким образом, чтобы между числами и объектами соблюдалась пропорциональность. Шкала предусматривает операции равенства –неравенства, больше- меньше, равенство интервалов и отношений.

21. Репрезентативность тестовых норм-

   

соответствие граничных точек на распределении тестовых баллов, полученных на выборке стандартизации (см.), аналогичным граничным точкам, которые могли бы быть получены на популяции проведения – на множестве испытуемых, для которых предназначен тест. Обычно при получении кривой нормального распределения делается вывод о том, что тестовые нормы обладают репрезентативностью. Однако нормальность не является необходимым условием репрезентативности. РТН может достигаться и в отсутствие нормального распределения.

К основным методам повышения точности измерений относятся:

· тестовый метод - при использовании данного метода значение измеряемой величины определяется по результатам нескольких наблюдений, при которых в одном случае входным сигналом средства измерений является сама измеряемая величина Х, а в других - так называемые тесты, являющиеся фукциями измеряемой величины.

· метод вспомагательных измерений используется для исключения погрешностей из-за влияющих величин и неинформативных параметров входного сигнала. Для реальзации этого метода одновременно с измеряемой величиной Х с помощью вспомогательных измерительных устройств производится измерение каждой из влияющих величин и вычисление с помощью вычислительного устройства, а также фомул и алгорптмов поправок к резульататм измерения.

· метод симметричных наблюдений заключается в проведении многократных наблюдений через равные промежутки времени и усреднении результатов наблюдений, симметрично расположенных относительно среднего наблюдения.

22.

Надежностью теста называется степень совпадения результатов при повторном тестировании одних и тех же людей (или других объектов) в одинаковых условиях, независимость его результатов от действия всевозможных случайных факторов. К числу таких факторов следует отнести:

- разнообразие внешних материальных условий тестирования, меняющихся от одного испытуемого к другому (время суток, освещенность, температура в помещении, наличие посторонних звуков, отвлекающих внимание и т. п.),

- динамичные внутренние факторы, по-разному действующие на разных испытуемых в ходе тести рования (время так называемой врабатываемости -- выхода на стабильные показатели темпа и точности действий после начала тестирования, скорость утомления и т. п.),

- информационно-социальные обстоятельства (различная динамика в установлении контакта с психологом или лаборантом, проводящим тестирование; возможное наличие других людей в помещении; наличие предыдущего опыта знакомства с данным

тестом; наличие какого-то знания и отношения к тестам вообще и т. п.).

23.

Валидность

Каждый метод предназначен для измерения какого-либо свойства, что и определяет содержание этого метода. Сведения о степени, в которой тест действительно измеряет то, для чего он предназначен, входят в понятие валидности. Например, методика "Кольца Ландольта" предназначена для измерения таких свойств внимания, как концентрация, переключаемость. В психологии существуют определения понятий концентрации внимания и его переключаемости. Считается, что выводы, сформулированные на основании результатов тестирования с помощью "Колец Ландольта", вполне отражают содержание определений этих свойств внимания. Значит, эта методика действительно измеряет то, для чего она предназначена.

Помимо общего значения в понятие валидности входят многие другие сведения. Существуют разные типы и виды валидности, в которых отражены эти сведения. Ниже приведены некоторые типы.

  1. Практическая валидность характеризует тест не столько со стороны его психологического содержания, сколько с точки зрения его ценности в отношении достижения определенной практической цели (прогнозирования, диагностики). Выделяют подтипы практической валидности: прогностическая и совпадающая. Тест с высокой прогностической валидностью позволяет сделать прогноз, насколько успешно испытуемый будет выполнять определенную деятельность впоследствии. Тест с высокой совпадающей валидностью позволяет ответить на вопрос: "Какова вероятность того, что индивид Х обладает свойством У в настоящий момент времени?"
  2. Валидность по объему отражает степень, в какой объем теста выборочно репрезентирует тот класс ситуаций или учебного материала, относительно которого должны быть сделаны выводы. Валидность по объему показывает, в каком объеме, в какой мере психическое свойство отражено в методике.
  3. Оценочная валидность выражает степень корреляции (соответствия) между показателями, полученными испытуемыми по данному методу, и оценками измерительного свойства со стороны экспертов. Например, при валидации (проверке теста на валидность) тестов оценки умственных способностей школьников в качестве экспертов обычно выступают учителя.
  4. Внешняя валидность означает, что впечатление, которое создается у неспециалистов при знакомстве со стимульным материалом и сугубо внешней стороной тестирования, соответствует заявленному содержанию метода.

Эффективная методика может быть создана, если она прошла все этапы валидации, то есть когда приняты меры для придания ей как содержательной валидности (см. общее значение понятия валидности выше), так и практической.

Валидность и надежность. Тест может быть надежен, но не валиден. Это означает, что он измеряет какое-то свойство очень точно, но какое именно – остается под вопросом. В такой ситуации необходима более точная валидизация теста, как содержательная, так и практическая.

24.

достоверность
— Одна из характеристик психодиагностических методик и тестов. Понятие достоверности близки к понятию валидности, но не вполне тождественно ему.

Достоверность
Если открытие можно повторить, то оно считается достоверным. Помимо этого общего соображения. термин используется более конкретным образом в психологических исследованиях и при оценке результатов:
• Чтобы экспериментальное открытие считалось достоверным, необходимо доказать, что оно с успехом воспроизводится при тех же условиях (ретикация).
• Для достоверности психометртеского теста он должен обладать виутреиией и внешней валидностью. Ответы на вопросы в анкете или личностном опроснике можно проверить на наличие противоречий (внутренняя валидность). Кроме того, ответы можно проверять в течение определенного времени, устанавливая степень стабильности результатов (внешняя валидность).

Для того, чтобы результаты тестов соответствовали объективной реальности, работа с ними были эффективной тесты и все психодиагнастические материалы должны соответствовать определенным требованиям. Эти требования предъявляются не только к разработке тестов, но и к их применению.
Одним из требований является надежность теста. Под надежностью понимается помехоустойчивость теста, точность и независимость его результатов от действия случайных факторов (это могут быть разнообразные внешние раздражители, динамичные внутренние факторы, информационно-социальные обстоятельства). Надежность – достаточно важный показатель, т.к.она устанавливает: измеряет тест какой-либо показатель, либо не измеряет его.
Также важным требованием является валидность теста. Валидность – комплексна характеристика теста, включающая сведения об области исследуемого явления и репрезентативности диагностической процедуы по отношению к нему. Другими словами, валидность говорит что именно мы измеряем с помощью данного теста.Существуют следующие виды валидности:
Очевидная валидность (т.е. по заданиям и вопросам мы можем определить область изучаемого явления
Содержательная валидность
Конструктная валидность (предназначена для более полного описания переменной, которая диагностируется).
Следующим показателем является достоверность теста – особая разновидность валидности. Речь идет о сознательных или бессознателных искажениях, которые вносят в тестовый состав сам испытуемый, руководствуясь в ходе теста особой мотивацией, отличающейся от той, которая присуща ему в реальном поведении. Т.о. достоверность теста – способность теста защищать информацию от мотивационных искажений.
Еще одним требование, предъявляемым к тесту является стандартизация. Она представляет собой унификацию, регламентацию, приведение к единым нормам процедур и оценок теста. Так, выделяют стандартизацию процедуры тестирования и стандартизацию тестовых норм. Первая предполагает унификацию инструкции, бланка обследования, способа регистрации результатов, условий проведения обследования.
Важным этапом стандартизации является установление норм, выбор критерия, по которому проводятся сравнение результатов. Таким критерием является статистическая норма, она всегда устанавливается на большой репрезентативной выборке для которой она предназначена.
Говоря о применении тестов, нужно отметить необходимость использования адаптированных для данного региона методик, а также соответствия данных методик возрасту, образованию и другим особенностям испытуемых.
Существуют определенные требования и к самой процедуре проведения исследования:
Инструкция сообщается всем испытуемым одинаковым образом (она как правило написана);
Никому из испытуемых не дается преимущество перед другими.
Никому из испытуемых не даются дополнительные пояснения и инструкции
Временные ограничения должны быть одинаковыми.
Исследования нужно проводить в одинаковое время и в схожих условиях.

25.

По предмету тестирования (какое качество оценивается) интеллектуальные Предназначены д/оценки уровня развития мышления (интеллекта) человека и отдельных когнитивных процессов – восприятие, внимание, воображение, память, речь.

По предмету: методы изучения психических процессов; психических состояний; психических свойств; личности; поведения. Сюда же:

По виду изучаемого компонента личности: тесты способностей, интеллекта, темперамента, интересов и т. д.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: